基于简标注和弱监督学习的开放的信息抽取研究

基本信息

批准号：61103077

项目类别：青年科学基金项目

资助金额：25.00

负责人：周德宇

学科分类：

依托单位：东南大学

批准年份：2011

结题年份：2014

起止时间：2012-01-01 - 2014-12-31

项目状态：已结题

项目参与者：何洁月,何瑜岚,刘胥影,季秋,朱曼,孙林翠,邱坤浦

关键词：

简标注弱监督学习命名实体识别多知识源开放的信息抽取

结项摘要

从自然语言文本中自动获取有用信息是信息抽取研究的目标。与传统的信息抽取针对某一类特定的关系信息不同，开放的信息抽取旨在利用信息抽取技术获得海量的非特定的关系信息，从而实现真正的广泛的信息抽取。目前，开放的信息抽取面临如下的挑战：一，系统性能不高；二，泛化能力弱。针对这两个挑战，本项目首先引入一个多知识源导向的开放的信息抽取框架，在其中构造一个基于简标注和弱监督学习的信息抽取器，并进行命名实体识别和开放的关系抽取的联合分析，从而提高系统的性能和泛化能力，进而实现项目的最终的目标－"面向非特定的关系，构造一个具有高准确率和召回率的信息抽取系统，并拥有很强的泛化能力"，实现真正的广义的信息抽取。

项目摘要

项目主要围绕基于简标注和弱监督学习的开放的信息抽取展开研究。具体的研究计划要点包括，基于简标注和弱监督学习的统计模型的构建以及面向开放信息抽取系统的构建。项目按照研究计划进展顺利，同时项目负责人在原有的研究计划基础上进行了必要的内容扩充。考虑到事件抽取在各个自然语言处理领域的广泛应用，我们选择事件抽取作为开放的信息抽取的具体实例，并围绕生物信息学和社交网络文本展开工作，取得了一定的研究进展。目前取得的研究成果包括SCI论文3篇，其中在生物信息学顶级期刊Bioinformatics(影响因子4.6)上发表一篇研究性论文，自然语言处理顶级会议ACL2014会议论文1篇。具体如下：发表了题目为“Event Trigger Identification for Biomedical Events Extraction using Domain Knowledge”的论文。论文主要围绕信息抽取的主要组成部分-事件抽取展开研究，并结合生物学应用，提出基于领域知识的生物事件触发词识别方法；发表了题目为“Semi-Supervised Learning of Statistical Models for Natural Language Understanding”的研究性论文。该论文为基于简标注和弱监督学习的统计模型的构建提供理论指导；发表了题目为“A Simple Bayesian Modelling Approach to Event Extraction from Twitter”的ACL2014会议论文。论文主要围绕信息抽取的主要组成部分-事件抽取展开研究，并结合社交网络文本，提出基于无监督学习的开放的事件抽取模型LEM。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.16368/j.issn.1674-8999.2018.12.569

发表时间：2018

DOI：

发表时间：2021

DOI：10.3778/j.issn.1002-8331.1911-0012

发表时间：2020

DOI：

发表时间：

DOI：

发表时间：2020

周德宇的其他基金

批准号：61772132

批准年份：2017

资助金额：65.00

项目类别：面上项目

相似国自然基金

基于弱监督学习的水果品种信息自动抽取方法研究

批准号：61503386

批准年份：2015

负责人：陈瑛

学科分类：F03

资助金额：20.00

项目类别：青年科学基金项目

基于弱监督学习和深度信息的目标跟踪算法研究

批准号：61202299

批准年份：2012

负责人：钟必能

学科分类：F0605

资助金额：23.00

项目类别：青年科学基金项目

面向互联网开放域的弱监督关系抽取关键问题研究

批准号：61703234

批准年份：2017

负责人：张春云

学科分类：F0607

资助金额：26.00

项目类别：青年科学基金项目

基于弱监督学习的不精确标注水下声音事件识别方法研究

批准号：61806214

批准年份：2018

负责人：王得志

学科分类：F0604

资助金额：21.00

项目类别：青年科学基金项目

基于简标注和弱监督学习的开放的信息抽取研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

肥胖型少弱精子症的发病机制及中医调体防治

基于铁路客流分配的旅客列车开行方案调整方法

针对弱边缘信息的左心室图像分割算法

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于多色集合理论的医院异常工作流处理建模

周德宇的其他基金

面向热门争议话题的基于社交网络文本与结构的层次观点挖掘研究

相似国自然基金