基于简标注和弱监督学习的开放的信息抽取研究

基本信息
批准号:61103077
项目类别:青年科学基金项目
资助金额:25.00
负责人:周德宇
学科分类:
依托单位:东南大学
批准年份:2011
结题年份:2014
起止时间:2012-01-01 - 2014-12-31
项目状态: 已结题
项目参与者:何洁月,何瑜岚,刘胥影,季秋,朱曼,孙林翠,邱坤浦
关键词:
简标注弱监督学习命名实体识别多知识源开放的信息抽取
结项摘要

从自然语言文本中自动获取有用信息是信息抽取研究的目标。与传统的信息抽取针对某一类特定的关系信息不同,开放的信息抽取旨在利用信息抽取技术获得海量的非特定的关系信息,从而实现真正的广泛的信息抽取。目前,开放的信息抽取面临如下的挑战:一,系统性能不高;二,泛化能力弱。针对这两个挑战,本项目首先引入一个多知识源导向的开放的信息抽取框架,在其中构造一个基于简标注和弱监督学习的信息抽取器,并进行命名实体识别和开放的关系抽取的联合分析,从而提高系统的性能和泛化能力,进而实现项目的最终的目标-"面向非特定的关系,构造一个具有高准确率和召回率的信息抽取系统,并拥有很强的泛化能力",实现真正的广义的信息抽取。

项目摘要

项目主要围绕基于简标注和弱监督学习的开放的信息抽取展开研究。具体的研究计划要点包括,基于简标注和弱监督学习的统计模型的构建以及面向开放信息抽取系统的构建。项目按照研究计划进展顺利,同时项目负责人在原有的研究计划基础上进行了必要的内容扩充。考虑到事件抽取在各个自然语言处理领域的广泛应用,我们选择事件抽取作为开放的信息抽取的具体实例,并围绕生物信息学和社交网络文本展开工作,取得了一定的研究进展。目前取得的研究成果包括SCI论文3篇,其中在生物信息学顶级期刊Bioinformatics(影响因子4.6)上发表一篇研究性论文,自然语言处理顶级会议ACL2014会议论文1篇。具体如下:发表了题目为“Event Trigger Identification for Biomedical Events Extraction using Domain Knowledge”的论文。论文主要围绕信息抽取的主要组成部分-事件抽取展开研究,并结合生物学应用,提出基于领域知识的生物事件触发词识别方法;发表了题目为“Semi-Supervised Learning of Statistical Models for Natural Language Understanding”的研究性论文。该论文为基于简标注和弱监督学习的统计模型的构建提供理论指导;发表了题目为“A Simple Bayesian Modelling Approach to Event Extraction from Twitter”的ACL2014会议论文。论文主要围绕信息抽取的主要组成部分-事件抽取展开研究,并结合社交网络文本,提出基于无监督学习的开放的事件抽取模型LEM。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018
4

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
5

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022

相似国自然基金

1

基于弱监督学习的水果品种信息自动抽取方法研究

批准号:61503386
批准年份:2015
负责人:陈瑛
学科分类:F03
资助金额:20.00
项目类别:青年科学基金项目
2

基于弱监督学习和深度信息的目标跟踪算法研究

批准号:61202299
批准年份:2012
负责人:钟必能
学科分类:F0605
资助金额:23.00
项目类别:青年科学基金项目
3

面向互联网开放域的弱监督关系抽取关键问题研究

批准号:61703234
批准年份:2017
负责人:张春云
学科分类:F0607
资助金额:26.00
项目类别:青年科学基金项目
4

基于弱监督学习的不精确标注水下声音事件识别方法研究

批准号:61806214
批准年份:2018
负责人:王得志
学科分类:F0604
资助金额:21.00
项目类别:青年科学基金项目