开放域动态事实性信息获取及融合方法研究

基本信息
批准号:61273321
项目类别:面上项目
资助金额:81.00
负责人:秦兵
学科分类:
依托单位:哈尔滨工业大学
批准年份:2012
结题年份:2016
起止时间:2013-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:赵妍妍,陈毅恒,孟雷,付瑞吉,张牧宇,陈炜鹏,赵江江,宋原,刘安安
关键词:
事实性信息融合超图动态事件触发词识别开放域动态事实性信息实体及实体类型识别
结项摘要

Dynamic Factual Information Extraction in open-domain refers to extract the factual event information from the web or document in any domain, and further illustrate by structural form. Previous methods are mostly confined in the specific domain research. We propose the method for information extraction and fusion oriented to open-domain, by research on automatically detecting the event trigger in open-domain and recognizing the open-domain entity and entity type we break the domain limit; what especially different from the previous argument recognition methods is the proposed method of event argument recognition abased on hypergraph, this method not only takes the binary features between event trigger and event candidate arguments into consideration, but also take the features between event candidate arguments into account, so that it merges more language features to the recognition of event candidate. At last, by fusing the factual information extracted from the huge collection of documents, recognizing and distilling the redundant information, we construct the factual information knowledge base. Research on dynamic factual information acquisition and fusion in open-domain is of great significance to help the user acquire the useful information efficiently and provide support to higher natural language application such as Question-Answer and knowledge inference.

开放域动态事实性信息获取是指从互联网任意领域的网页或文档中抽取动态事件信息,并以结构化的呈现出来。已有方法大多局限于特定领域的研究。本课题提出的面向开放域的动态事实性信息获取与融合方法研究,通过研究面向开放域的事件触发词自动发现,以及开放域实体及其类型识别的方法,解决了研究领域受限问题;尤其是与以往的事件元素识别方法不同的是,本课题提出了基于超图的事件元素识别方法,该方法不仅考虑了触发词和候选事件元素之间的二元语言特征,也考察了候选事件元素之间的多元语言特征,从而融入了更多的语言特征来进行候选事件元素的识别。最后,通过将大量文本中抽取的事实性信息融合,识别和去除冗余信息,构建了事实性信息知识库。开放域动态事实性信息的抽取及融合研究对于帮助用户从互联网文本中挖掘高效获取有用信息,以及为知识推理和问答系统等更高层的自言语言应用提供支持,具有十分重要的意义。

项目摘要

开放域动态事实性信息获取是指从互联网任意领域的网页或文档中抽取动态事件信息,并以结构化的呈现出来。已有方法大多局限于特定领域的研究。本课题提出的面向开放域的动态事实性信息获取与融合方法研究,通过研究面向开放域的事件触发词自动发现,以及开放域实体及其类型识别的方法,解决了研究领域受限问题;尤其是与以往的事件元素识别方法不同的是,本课题提出了基于超图的事件元素识别方法,该方法不仅考虑了触发词和候选事件元素之间的二元语言特征,也考察了候选事件元素之间的多元语言特征,从而融入了更多的语言特征来进行候选事件元素的识别,同时考察基于神经网络的多语言事件识别的方法进行研究,并取得较好的效果。同时,本课题在开放域实体类型识别及其层次化的研究工作中取得了较好的进展,实体上位词获取的准确率高达90%以上。利用开放域实体类型获取以及上位词层次化的技术,我们构建了自动构建的大规模开放域中文实体知识库——《大词林》。另外,在信息融合中的矛盾检测问题的研究工作中,我们提出了一种联合方法检测矛盾语义关系。开放域动态事实性信息的抽取及融合研究对于帮助用户从互联网文本中挖掘高效获取有用信息,以及为知识推理和问答系统等更高层的自言语言应用提供支持,具有十分重要的意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
3

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
4

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018
5

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018

秦兵的其他基金

批准号:60675034
批准年份:2006
资助金额:24.00
项目类别:面上项目
批准号:61632011
批准年份:2016
资助金额:265.00
项目类别:重点项目
批准号:60975055
批准年份:2009
资助金额:30.00
项目类别:面上项目

相似国自然基金

1

句法语义分析与开放域信息抽取融合技术研究

批准号:61572245
批准年份:2015
负责人:邱立坤
学科分类:F0211
资助金额:64.00
项目类别:面上项目
2

科学信息开放获取的运行模式与政策机制研究

批准号:70573107
批准年份:2005
负责人:张晓林
学科分类:G0414
资助金额:18.00
项目类别:面上项目
3

面向孕妇体域网的绿色智能信息获取与处理方法研究

批准号:61771080
批准年份:2017
负责人:李勇明
学科分类:F0124
资助金额:62.00
项目类别:面上项目
4

基于信息获取与融合的电池系统健康状态估计方法研究

批准号:61903114
批准年份:2019
负责人:武骥
学科分类:F0303
资助金额:25.00
项目类别:青年科学基金项目