基于学术文献引文的自动摘要关键技术研究

基本信息
批准号:61303125
项目类别:青年科学基金项目
资助金额:27.00
负责人:蔡晓妍
学科分类:
依托单位:西北工业大学
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:蔡骋,赵建邦,李梅,李茵,张螣,李亮
关键词:
自动摘要引文倾向性分析摘要评测引文识别
结项摘要

Citation sentence in scientific paper has an important value to help researchers understanding academic value and the influence of other research on a paper. With the number of the scientific papers is increasing rapidly,which makes it more and more difficult for researchers to quickly get citation information. This project aims at researching on citation-based summarization of scientific papers, including(1) Analyzing explict citation features and implicit citation features of scientific papers,proposing a citation detection method based on SVM in order to improve citation detection rate. (2) Exploring features of citation polarity, and proposing a citation sentiment detection approach based on random forest. (3) Researching citation-based scientific papers summarization methods,and proposing a novel ranking mechanism which can mutually and simultaneously update clustering and ranking process, to improve the quality of the generated summary.(4) Researching evaluation methods of summary based on semantic similarity, and comparing semantic similarity between system generated summary and human generated summary by introducing a LDA model.The purpose of the project is to provide theoretical and technical support for academic literature citation retrieval system, it also has important scientific significance and research value on the academic research itself.

学术文献中的引文对于帮助学者了解某篇文献的学术价值及对后续研究的影响具有重要的价值。然而随着学术文献数量的日益庞大,使得学者们快速获取引文信息变得越来越困难。基于此,本项目针对学术文献中的引文进行自动摘要关键技术研究,主要包括:(1)分析学术文献中显示引文和隐式引文的特征,提出基于SVM的引文识别算法,提高引文识别率;(2)探索与引文倾向性相关的各种特征,提出基于随机森林的倾向性分类方法;(3)研究基于学术文献引文的自动摘要方法,提出将引文句聚类和排序过程相互作用的排序策略,用以提升摘要生成质量;(4)研究基于语义的文摘评测方法,引入LDA主题模型衡量机器摘要与人工摘要的语义相似度。本项目的研究将为学术文献引文检索系统的实际应用提供理论和技术上的支持,具有重要的科学意义和研究价值。

项目摘要

学术文献中的引文对于帮助学者了解某篇文献的学术价值及对后续研究的影响具有重要的价值。然而随着学术文献数量的日益庞大,使得学者们快速获取引文信息变得越来越困难。基于此,本项目针对学术文献中的引文进行自动摘要关键技术研究,主要包括:(1)分析学术文献中显示引文和隐式引文的特征,提出基于PU学习的引文识别算法,提高引文识别率;(2)探索与引文倾向性相关的各种特征,提出基于非负矩阵分解的倾向性分类方法方法和基于随机森林的倾向性分类方法;(3)提出3种自动摘要生成方法,分别是基于排序和聚类相互作用的多文档自动摘要方法;结合噪声检测与联合聚类机制的多文档自动摘要生成方法;通过子空间聚类增强文摘信息多样性和覆盖性的文档自动摘要生成方法;以及面向查询的多文档自动摘要生成过程中基于双重超图的句子排序方法。这些研究的开展将为学术文献引文检索系统的实际应用提供理论和技术上的支持,研究成果可应用于民用、军事等相关领域。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

DOI:
发表时间:
2

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于改进LinkNet的寒旱区遥感图像河流识别方法

DOI:10.6041/j.issn.1000-1298.2022.07.022
发表时间:2022
3

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

DOI:10.11842/wst.20190724002
发表时间:2020
4

高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析

高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析

DOI:10.7498/aps.68.20181682
发表时间:2019
5

铁路大跨度简支钢桁梁桥车-桥耦合振动研究

铁路大跨度简支钢桁梁桥车-桥耦合振动研究

DOI:10.3969/j.issn.1000-0844.2017.05.0820
发表时间:2017

蔡晓妍的其他基金

相似国自然基金

1

基于深度语义表示和多文档摘要的学术文献自动综述研究

批准号:71904058
批准年份:2019
负责人:丁恒
学科分类:G0414
资助金额:18.50
项目类别:青年科学基金项目
2

基于多语义信息融合的学术文献引文推荐研究

批准号:71673211
批准年份:2016
负责人:陆伟
学科分类:G0414
资助金额:51.00
项目类别:面上项目
3

面向科技文献的引用摘要生成关键技术研究

批准号:61572049
批准年份:2015
负责人:李素建
学科分类:F0211
资助金额:63.00
项目类别:面上项目
4

基于异构文献网络表示学习的个性化引文推荐技术研究

批准号:61872296
批准年份:2018
负责人:蔡晓妍
学科分类:F0211
资助金额:65.00
项目类别:面上项目