基于推理现象的中文文本推理资源建设和自动分析研究

基本信息
批准号:61402341
项目类别:青年科学基金项目
资助金额:26.00
负责人:任函
学科分类:
依托单位:武汉大学
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:陈禹,王冬芝,吕晨,盛雅琦,王浩
关键词:
文本蕴涵识别资源建设文本推理推理现象
结项摘要

One of the most important factors that impact the performance of textual inference is whether diverse inference types are recognized by inference systems. Researches on inference phenomena help to recognize inference types, however, due to the deficiency of related research of inference phenomena, it is far from building large-scale annotation resources and computational approaches. This proposal will give an insight on the structure characteristic of Chinese, explore the expression of Chinese inference phenomena and build a corpus resource for Chinese inference phenomena. Based on it, this proposal will explore the automatic recognition methods of inference phenomena, including recognizing semantic unit and inference phenomena. This proposal will also introduce a inference model for inference phenomena based on Bayesian Belief Network. This proposal helps to research the characteristic of Chinese textual inference and inference phenomena, explore deep understanding stateies on Chinese textual inference, promote the construction of platform of Chinese textual inference. This proposal will also contributes to the evaluation of performances of textual inference systems.

影响文本推理系统性能的一个重要因素是推理系统能否识别多样化的推理类型。推理现象的研究有助于识别各种推理类型,然而目前相关研究非常缺乏,也没有建立相关的大规模标注资源和分析模型。本项目拟研究汉语推理现象的自动识别,并基于推理现象进行推理判断。为此,本项目将深入考察汉语结构特点,研究汉语推理现象的表现形式,据此建立一个汉语推理现象标注资源。在此基础上,本项目将研究推理现象的自动识别,包括语义单元的自动识别和推理现象的自动识别,提出并研究基于推理现象的贝叶斯信念网络推理模型,并利用该模型进行文本自动推理。本项目有助于研究汉语文本推理的特点及相关推理现象,探讨面向汉语文本推理的深层理解方法,推动中文文本推理的平台建设,并评估现有文本推理系统的性能。

项目摘要

本项目通过研究汉语文本推理中的各类推理关系,建立一个汉语文本推理现象标注框架及标注资源,在此基础上提出了推理现象的自动识别模型,并以此建立了汉语文本推理的自动分析方法。对于推理现象标注框架及资源,本研究将推理现象分为替换、省略和解释三大类,在此基础上建立了一个包含29种推理现象的标注体系,并建立了一个包含5000个文本推理对的数据集。这一方案通过将文本间的外在形式变化与内在的语义转换建立联系,从而建立了一套适合机器自动分析的汉语语义推理机制以及相应的标注资源。对于推理现象识别和总体推理关系判断,本研究设计并实现了从推理单元识别、推理现象识别到总体推理判断的串行识别和联合识别方案,并通过实验验证了其有效性。该方法不仅有效提高了文本推理的性能,而且其分析过程具有可解释性。对于系统应用,本研究将文本推理方法应用于自动问答和情绪识别两个自然语言处理应用中。基于推理现象的文本推理方法的应用使上述系统具备一定的深度理解能力。实验表明该方法在一定程度上改进了系统性能。本项目的主要成果包括:1)在中文信息学报、湖北社会科学(CSSCI)等期刊和CCL、CLSW等国内外自然语言处理会议发表论文16篇;2)建立了一个包含5000个文本对,共14272个推理现象的标注数据集,其中推理单元的标注一致率为77.56%,推理现象的标注一致率为86.23%;3)实现了一个推理现象标注平台; 4)设计并实现了一个基于推理现象识别的文本推理系统,并参加了NTCIR-11国际评测,取得第二名的成绩;5)设计并实现了基于文本推理的自动问答和情绪识别系统;6)将本研究方案应用于汉语篇章结构语料库的构建以及隐式情绪识别研究。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

黄河流域水资源利用时空演变特征及驱动要素

黄河流域水资源利用时空演变特征及驱动要素

DOI:10.18402/resci.2020.12.01
发表时间:2020
2

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018
3

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
4

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
5

适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理

适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理

DOI:10.19783/j.cnki.pspc.200521
发表时间:2021

任函的其他基金

相似国自然基金

1

汉语文本推理的资源建设和统计分析研究

批准号:61173062
批准年份:2011
负责人:姬东鸿
学科分类:F0211
资助金额:58.00
项目类别:面上项目
2

汉语特征结构的资源建设和自动分析研究

批准号:90820005
批准年份:2008
负责人:姬东鸿
学科分类:F0211
资助金额:50.00
项目类别:重大研究计划
3

意见挖掘中隐式情感的资源建设和自动分析研究

批准号:61702121
批准年份:2017
负责人:任亚峰
学科分类:F0211
资助金额:27.00
项目类别:青年科学基金项目
4

计算机自动推理

批准号:68673036
批准年份:1986
负责人:刘叙华
学科分类:F02
资助金额:2.00
项目类别:面上项目