基于图结构的文献挖掘算法研究

基本信息

批准号：60803075

项目类别：青年科学基金项目

资助金额：21.00

负责人：黄民烈

学科分类：

依托单位：清华大学

批准年份：2008

结题年份：2011

起止时间：2009-01-01 - 2011-12-31

项目状态：已结题

项目参与者：金锋,郑志诚,王宏宁,孙建树,柴艳妹

关键词：

语义分类自动摘要情感分析文本推理图结构

结项摘要

传统的文本表示方法是建立在"词袋"（Bag-Of-Words）表示方法上的，即认为文档是一个关于词或短语的离散集合。经典的信息检索模型、文本分类方法和文献挖掘算法等无一不是建立在这种表示方法之上的。然而这种表示抹杀了文档内部描述单元之间的句法、语义上联系，抹杀了自然语言固有的内在本质。实际上，单词之间有句法、语义上互相依赖，句子之间有前后、篇章的依赖，只有图或树等复杂结构才能有效地表示。本项目将围绕这一基本问题，开展二个方面的研究：一，针对实际问题，如何利用图结构有效地表示文本；二，在图结构表示的基础上，如何有效地开展相关文献挖掘算法的研究，包括基于图结构的自动摘要、文本推理、评论信息的情感分析、文本分类的研究。项目研究的领域以生物文献挖掘为主，同时也利用TAC国际评测提供的数据，以验证算法的通用性。

项目摘要

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.13197/j.eeev.2019.05.95.fuwq.009

发表时间：2019

DOI：

发表时间：

DOI：

发表时间：2020

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：10.11842/wst.20190724002

发表时间：2020

黄民烈的其他基金

批准号：61876096

批准年份：2018

资助金额：65.00

项目类别：面上项目

批准号：61272227

批准年份：2012

资助金额：82.00

项目类别：面上项目

相似国自然基金

海量不确定图挖掘算法研究

批准号：61173023

批准年份：2011

负责人：邹兆年

学科分类：F0202

资助金额：58.00

项目类别：面上项目

基于概率图分类模型的潜在药物靶标挖掘算法研究

批准号：31801109

批准年份：2018

负责人：王腾蛟

学科分类：C0608

资助金额：18.00

项目类别：青年科学基金项目

基于图挖掘的蛋白质功能预测算法的研究

批准号：60703105

批准年份：2007

负责人：尚学群

学科分类：F0214

资助金额：18.00

项目类别：青年科学基金项目

基于多关系的模糊认知图挖掘模型、算法与评价机制研究

批准号：61175048

批准年份：2011

负责人：杨炳儒

学科分类：F0607

资助金额：57.00

项目类别：面上项目

基于图结构的文献挖掘算法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于被动变阻尼装置高层结构风振控制效果对比分析

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于多色集合理论的医院异常工作流处理建模

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

黄民烈的其他基金

开放领域人机对话技术研究

信息多样性和信息摘要的关键问题研究

相似国自然基金