基于谱主题模型的多文档自动摘要算法研究

基本信息

批准号：61402069

项目类别：青年科学基金项目

资助金额：24.00

负责人：刘娜

学科分类：

依托单位：大连工业大学

批准年份：2014

结题年份：2017

起止时间：2015-01-01 - 2017-12-31

项目状态：已结题

项目参与者：肖鹏,李明霞,肖智博,王法胜,毛玉越

关键词：

主题模型多文档摘要谱学习

结项摘要

Existing multi-document summarization algorithm mainly focus on a single learning algorithm and ignore the cooperation among multiple algorithm, which leads to incomplete, inaccurate and high redundancy of summarization result. This project establishes the multi-strategies cooperative learning framework to research the issue of sentence similarity calculation, extraction of sentence and ranking of sentence in multi-documents summarization, by developing the co-working mechanism of multiple algorithms including topic model, spectral learning, ranking learning and active learning, etc.Our research mainly concentrates on mixture topic model, parameter estimation based on spectral learning, similarity based on clause substructure and topic model, control model of redundancy and relativity according MMR algorithm, keywords-dependent and keywords-independent summarization sentence ranking using topic model, ranking learning and active learning methods. Meanwhile, develop academic paper recommender system based on research on summarization algorithms, the algorithms proposed in the multi-document summarization are evaluated and applied.

现有的多文档自动摘要算法主要致力于单种学习算法的研究，忽略了多种算法之间的协作机制，存在摘要结果不完整、不准确、冗余性较高等问题。项目研究主题模型、谱学习、排序学习、主动学习等多种算法之间的协作机制，构建多策略协同学习框架，以有效应对多文档自动摘要技术中的句子相似度计算、文摘句抽取和文摘句排序问题。重点研究主题模型的有效融合机制，基于谱学习的主题模型参数学习方法，基于句子结构和主题模型的句子相似度衡量，基于MMR方法的冗余度、相关度控制模型，基于主题模型、排序学习、主动学习等方法的面向关键词的文摘句排序和关键词无关的文摘句排序问题。项目在深化研究多文档自动摘要核心理论的同时研制论文推荐系统，达到既验证算法又促进算法实用化的目的。

项目摘要

在被海量信息包围的数据时代，如何更加有效地浏览和查阅互联网上的海量信息，对信息进行合理地筛选和浓缩，已然成为“大数据”时代一项亟需解决的研究课题。多文档自动摘要的目的在于对文本内容进行提炼和总结，方便用户快速获取信息。本项目的主要研究内容可以归纳为以下三个方面：（1）提出主题模型的自适应融合方法和基于无监督学习的词义消歧方法，选取关键语义构造特征向量对文档进行表示，提高句子相似度的计算精度，为文摘句的抽取做准备；（2）引入并定义主题重要性的概念，以此来衡量主题的重要程度，计算句子权重时重点考虑句子主题和文档重要主题的相似性，从而有效过滤文摘句的冗余信息；（3）为了寻找权重和相似度都相对较高的句子作为文摘句，我们把这两个数值映射到二维坐标系中，用最大向量法来解决句子的排序问题。同时，我们将用户描述成文档，将项目描述成单词，利用主题模型将用户表示成主题的分布，主题表示成项目的多项式分布，以便更好地发现用户、项目之间的潜在关联性。用户（项目）之间的相似度用混合相似度来衡量，从而增强推荐的质量，形成更准确的摘要句排序。本项目按照原定计划，基本完成了申报书中的研究目标和研究内容。基于以上研究内容，本项目组发表重要论文17篇，其中SCI检索6篇，EI检索8篇，CSCD核心期刊3篇，专利1项，原型系统1个，培养研究生1名。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：

发表时间：2020

DOI：10.3788/CJL201946.0801003

发表时间：2019

DOI：10.13609/j.cnki.1000-0313.2022.04.019

发表时间：2022

刘娜的其他基金

批准号：51301157

批准年份：2013

资助金额：25.00

项目类别：青年科学基金项目

批准号：81872397

批准年份：2018

资助金额：57.00

项目类别：面上项目

批准号：31000651

批准年份：2010

资助金额：20.00

项目类别：青年科学基金项目

批准号：51603040

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：11501043

批准年份：2015

资助金额：17.00

项目类别：青年科学基金项目

批准号：71901033

批准年份：2019

资助金额：20.00

项目类别：青年科学基金项目

批准号：41807400

批准年份：2018

资助金额：25.00

项目类别：青年科学基金项目

批准号：31300015

批准年份：2013

资助金额：23.00

项目类别：青年科学基金项目

批准号：30900635

批准年份：2009

资助金额：20.00

项目类别：青年科学基金项目

批准号：81200492

批准年份：2012

资助金额：24.00

项目类别：青年科学基金项目

批准号：61871340

批准年份：2018

资助金额：63.00

项目类别：面上项目

批准号：71702090

批准年份：2017

资助金额：20.00

项目类别：青年科学基金项目

批准号：41202073

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：30973423

批准年份：2009

资助金额：31.00

项目类别：面上项目

批准号：81402820

批准年份：2014

资助金额：23.00

项目类别：青年科学基金项目

批准号：11604090

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：41072170

批准年份：2010

资助金额：52.00

项目类别：面上项目

批准号：40702039

批准年份：2007

资助金额：19.00

项目类别：青年科学基金项目

批准号：81470991

批准年份：2014

资助金额：73.00

项目类别：面上项目

批准号：51673057

批准年份：2016

资助金额：61.00

项目类别：面上项目

批准号：81400272

批准年份：2014

资助金额：23.00

项目类别：青年科学基金项目

批准号：41572217

批准年份：2015

资助金额：84.00

项目类别：面上项目

批准号：31701721

批准年份：2017

资助金额：25.00

项目类别：青年科学基金项目

批准号：31800221

批准年份：2018

资助金额：25.00

项目类别：青年科学基金项目

批准号：21304027

批准年份：2013

资助金额：25.00

项目类别：青年科学基金项目

批准号：20307003

批准年份：2003

资助金额：21.00

项目类别：青年科学基金项目

批准号：41106023

批准年份：2011

资助金额：25.00

项目类别：青年科学基金项目

批准号：81670690

批准年份：2016

资助金额：58.00

项目类别：面上项目

批准号：81600124

批准年份：2016

资助金额：17.00

项目类别：青年科学基金项目

批准号：61703265

批准年份：2017

资助金额：24.00

项目类别：青年科学基金项目

批准号：21502224

批准年份：2015

资助金额：21.00

项目类别：青年科学基金项目

批准号：30400535

批准年份：2004

资助金额：21.00

项目类别：青年科学基金项目

批准号：81370484

批准年份：2013

资助金额：70.00

项目类别：面上项目

批准号：41705121

批准年份：2017

资助金额：24.00

项目类别：青年科学基金项目

批准号：11501481

批准年份：2015

资助金额：18.00

项目类别：青年科学基金项目

批准号：41372236

批准年份：2013

资助金额：98.00

项目类别：面上项目

批准号：31200741

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：31401878

批准年份：2014

资助金额：24.00

项目类别：青年科学基金项目

批准号：40706015

批准年份：2007

资助金额：18.00

项目类别：青年科学基金项目

批准号：31771636

批准年份：2017

资助金额：58.00

项目类别：面上项目

批准号：41806035

批准年份：2018

资助金额：25.00

项目类别：青年科学基金项目

批准号：31670998

批准年份：2016

资助金额：64.00

项目类别：面上项目

批准号：31872114

批准年份：2018

资助金额：60.00

项目类别：面上项目

相似国自然基金

基于hLDA层次主题模型的中文多文档摘要研究

批准号：61202247

批准年份：2012

负责人：李蕾

学科分类：F0211

资助金额：22.00

项目类别：青年科学基金项目

基于深度语义表示和多文档摘要的学术文献自动综述研究

批准号：71904058

批准年份：2019

负责人：丁恒

学科分类：G0414

资助金额：18.50

项目类别：青年科学基金项目

基于反馈式排序框架F-Rank的查询导向的更新式多文档自动摘要研究

批准号：61070083

批准年份：2010

负责人：彭敏

学科分类：F0211

资助金额：29.00

项目类别：面上项目

基于词义的文档表示模型及多语亚文档主题分析研究

批准号：61272233

批准年份：2012

负责人：夏云庆

学科分类：F0211

资助金额：82.00

项目类别：面上项目

基于谱主题模型的多文档自动摘要算法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于铁路客流分配的旅客列车开行方案调整方法

一种基于多层设计空间缩减策略的近似高维优化方法

基于多色集合理论的医院异常工作流处理建模

基于腔内级联变频的0.63μm波段多波长激光器

结直肠癌免疫治疗的多模态影像及分子影像评估

刘娜的其他基金

氩气雾化TiAl合金粉末特性及雾化机理研究

RhoB/Arl14小G蛋白中心功能聚合体通过Slit2/Robo1-Wnt/β-catenin通路轴调节大肠癌EMT

印迹基因H19表达调控与孤雌胚胎干细胞多能性关系研究

二醋酸纤维素离子液体高效增塑机理及其熔融纺丝成形

多介质大变形流体时空一致高阶动理学方法研究

多任务情境下信息模态、多任务类型和中断方式对行为绩效的影响及其机理研究

手性药物的水生态毒性效应研究

中国黑痣菌属分类及分子系统学研究

NDRG2对急性髓性白血病细胞的分化及化疗敏感性的功能研究

在致肾间质纤维化中HDAC1调控TGF-β/Smad信号通路活化的作用及机制

三维集成电路多物理场仿真快速算法研究及应用

产业集群多层次创新网络结构、互动及其对创新绩效的影响

基于天然类比和实验探讨CO2流体—碳酸盐岩相互作用

基于文库筛选的miR-483-3p介导c-Myc转录通路调控胃癌发生的新机制研究

联苄类化合物的发现与逆转肿瘤多药耐药活性研究

基于氮系二维材料的纳米电子器件的量子输运性质研究

硝基苯污染地下水生物修复微生物群落结构及修复效能

地下水污染原位修复的生物可渗透反应墙新型装填介质研究

基因或药物阻断表皮生长因子受体酪氨酸磷酸化调控腹膜纤维化的作用

利用非手性单体制备手性螺旋聚联烯及应用于手性识别和对映体分离

Toll样受体4调控心肌缺血再灌注损伤的细胞特异性作用及分子机制研究

多硫化钙修复Cr(VI)污染地下水及其同位素分馏效应

脱氧雪腐镰刀菌烯醇多功能重组全长抗体识别及定向进化机制研究

CPK5调控钙调素结合蛋白CaMBP参与植物免疫的分子机理

镍络合物催化的共轭高分子与联烯的嵌段共聚

有机粘土矿物吸附底泥中难降解有机污染物的性能研究

东中国海热收支年代际变化及其影响因素研究

基因或特异性抑制剂阻断组蛋白甲基转移酶EZH2调控腹膜纤维化的作用和机制

E3泛素连接酶β-TRCP在慢性髓性白血病伊马替尼耐药中的作用及机制研究

细胞行为调控与同步表征的光诱导操作方法研究

抗真菌天然产物Sampangine的结构简化及作用机制研究

小G蛋白RhoC调控胃癌转移的新机制研究

miR-92a在胃粘膜肠上皮化生中调控CDX2的作用机制研究

基于催化剂扩散和输送的人工增雨作业影响区的确定

随钻电磁波测井响应计算的谱元数值模式匹配法研究及应用

基于CSIA和PCR两种新型环境分子诊断技术评价TCE污染地下水的生物降解效能

在炎症微环境作用下Wnt信号通路调控牙周膜干细胞成骨分化的研究

菜用大豆低温胁迫应答相关microRNA的鉴定及其调控机制研究

南极绕极波绕极传播信号激发机制的研究

Lin28a调控ES细胞naïve-primed状态转变机制研究

南海北部涡致跨陆坡输运的季节和季节内变化

炎症微环境作用下牙周膜干细胞免疫调节及再生功能变化及其调控机制研究

乙醛脱氢酶ADH1相关天然反义lncRNA在菜用大豆低温胁迫应答中的功能及作用机制研究

相似国自然基金