基于学术文献引文的自动摘要关键技术研究

基本信息
批准号:61303125
项目类别:青年科学基金项目
资助金额:27.00
负责人:蔡晓妍
学科分类:
依托单位:西北工业大学
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:蔡骋,赵建邦,李梅,李茵,张螣,李亮
关键词:
自动摘要引文倾向性分析摘要评测引文识别
结项摘要

Citation sentence in scientific paper has an important value to help researchers understanding academic value and the influence of other research on a paper. With the number of the scientific papers is increasing rapidly,which makes it more and more difficult for researchers to quickly get citation information. This project aims at researching on citation-based summarization of scientific papers, including(1) Analyzing explict citation features and implicit citation features of scientific papers,proposing a citation detection method based on SVM in order to improve citation detection rate. (2) Exploring features of citation polarity, and proposing a citation sentiment detection approach based on random forest. (3) Researching citation-based scientific papers summarization methods,and proposing a novel ranking mechanism which can mutually and simultaneously update clustering and ranking process, to improve the quality of the generated summary.(4) Researching evaluation methods of summary based on semantic similarity, and comparing semantic similarity between system generated summary and human generated summary by introducing a LDA model.The purpose of the project is to provide theoretical and technical support for academic literature citation retrieval system, it also has important scientific significance and research value on the academic research itself.

学术文献中的引文对于帮助学者了解某篇文献的学术价值及对后续研究的影响具有重要的价值。然而随着学术文献数量的日益庞大,使得学者们快速获取引文信息变得越来越困难。基于此,本项目针对学术文献中的引文进行自动摘要关键技术研究,主要包括:(1)分析学术文献中显示引文和隐式引文的特征,提出基于SVM的引文识别算法,提高引文识别率;(2)探索与引文倾向性相关的各种特征,提出基于随机森林的倾向性分类方法;(3)研究基于学术文献引文的自动摘要方法,提出将引文句聚类和排序过程相互作用的排序策略,用以提升摘要生成质量;(4)研究基于语义的文摘评测方法,引入LDA主题模型衡量机器摘要与人工摘要的语义相似度。本项目的研究将为学术文献引文检索系统的实际应用提供理论和技术上的支持,具有重要的科学意义和研究价值。

项目摘要

学术文献中的引文对于帮助学者了解某篇文献的学术价值及对后续研究的影响具有重要的价值。然而随着学术文献数量的日益庞大,使得学者们快速获取引文信息变得越来越困难。基于此,本项目针对学术文献中的引文进行自动摘要关键技术研究,主要包括:(1)分析学术文献中显示引文和隐式引文的特征,提出基于PU学习的引文识别算法,提高引文识别率;(2)探索与引文倾向性相关的各种特征,提出基于非负矩阵分解的倾向性分类方法方法和基于随机森林的倾向性分类方法;(3)提出3种自动摘要生成方法,分别是基于排序和聚类相互作用的多文档自动摘要方法;结合噪声检测与联合聚类机制的多文档自动摘要生成方法;通过子空间聚类增强文摘信息多样性和覆盖性的文档自动摘要生成方法;以及面向查询的多文档自动摘要生成过程中基于双重超图的句子排序方法。这些研究的开展将为学术文献引文检索系统的实际应用提供理论和技术上的支持,研究成果可应用于民用、军事等相关领域。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
5

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015

蔡晓妍的其他基金

相似国自然基金

1

基于深度语义表示和多文档摘要的学术文献自动综述研究

批准号:71904058
批准年份:2019
负责人:丁恒
学科分类:G0414
资助金额:18.50
项目类别:青年科学基金项目
2

基于多语义信息融合的学术文献引文推荐研究

批准号:71673211
批准年份:2016
负责人:陆伟
学科分类:G0414
资助金额:51.00
项目类别:面上项目
3

面向科技文献的引用摘要生成关键技术研究

批准号:61572049
批准年份:2015
负责人:李素建
学科分类:F0211
资助金额:63.00
项目类别:面上项目
4

基于异构文献网络表示学习的个性化引文推荐技术研究

批准号:61872296
批准年份:2018
负责人:蔡晓妍
学科分类:F0211
资助金额:65.00
项目类别:面上项目