基于图结构的文献挖掘算法研究

基本信息
批准号:60803075
项目类别:青年科学基金项目
资助金额:21.00
负责人:黄民烈
学科分类:
依托单位:清华大学
批准年份:2008
结题年份:2011
起止时间:2009-01-01 - 2011-12-31
项目状态: 已结题
项目参与者:金锋,郑志诚,王宏宁,孙建树,柴艳妹
关键词:
语义分类自动摘要情感分析文本推理图结构
结项摘要

传统的文本表示方法是建立在"词袋"(Bag-Of-Words)表示方法上的,即认为文档是一个关于词或短语的离散集合。经典的信息检索模型、文本分类方法和文献挖掘算法等无一不是建立在这种表示方法之上的。然而这种表示抹杀了文档内部描述单元之间的句法、语义上联系,抹杀了自然语言固有的内在本质。实际上,单词之间有句法、语义上互相依赖,句子之间有前后、篇章的依赖,只有图或树等复杂结构才能有效地表示。本项目将围绕这一基本问题,开展二个方面的研究:一,针对实际问题,如何利用图结构有效地表示文本;二,在图结构表示的基础上,如何有效地开展相关文献挖掘算法的研究,包括基于图结构的自动摘要、文本推理、评论信息的情感分析、文本分类的研究。项目研究的领域以生物文献挖掘为主,同时也利用TAC国际评测提供的数据,以验证算法的通用性。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016

黄民烈的其他基金

批准号:61876096
批准年份:2018
资助金额:65.00
项目类别:面上项目
批准号:61272227
批准年份:2012
资助金额:82.00
项目类别:面上项目

相似国自然基金

1

海量不确定图挖掘算法研究

批准号:61173023
批准年份:2011
负责人:邹兆年
学科分类:F0202
资助金额:58.00
项目类别:面上项目
2

基于概率图分类模型的潜在药物靶标挖掘算法研究

批准号:31801109
批准年份:2018
负责人:王腾蛟
学科分类:C0608
资助金额:18.00
项目类别:青年科学基金项目
3

基于图挖掘的蛋白质功能预测算法的研究

批准号:60703105
批准年份:2007
负责人:尚学群
学科分类:F0214
资助金额:18.00
项目类别:青年科学基金项目
4

基于多关系的模糊认知图挖掘模型、算法与评价机制研究

批准号:61175048
批准年份:2011
负责人:杨炳儒
学科分类:F0607
资助金额:57.00
项目类别:面上项目