One of the most important factors that impact the performance of textual inference is whether diverse inference types are recognized by inference systems. Researches on inference phenomena help to recognize inference types, however, due to the deficiency of related research of inference phenomena, it is far from building large-scale annotation resources and computational approaches. This proposal will give an insight on the structure characteristic of Chinese, explore the expression of Chinese inference phenomena and build a corpus resource for Chinese inference phenomena. Based on it, this proposal will explore the automatic recognition methods of inference phenomena, including recognizing semantic unit and inference phenomena. This proposal will also introduce a inference model for inference phenomena based on Bayesian Belief Network. This proposal helps to research the characteristic of Chinese textual inference and inference phenomena, explore deep understanding stateies on Chinese textual inference, promote the construction of platform of Chinese textual inference. This proposal will also contributes to the evaluation of performances of textual inference systems.
影响文本推理系统性能的一个重要因素是推理系统能否识别多样化的推理类型。推理现象的研究有助于识别各种推理类型,然而目前相关研究非常缺乏,也没有建立相关的大规模标注资源和分析模型。本项目拟研究汉语推理现象的自动识别,并基于推理现象进行推理判断。为此,本项目将深入考察汉语结构特点,研究汉语推理现象的表现形式,据此建立一个汉语推理现象标注资源。在此基础上,本项目将研究推理现象的自动识别,包括语义单元的自动识别和推理现象的自动识别,提出并研究基于推理现象的贝叶斯信念网络推理模型,并利用该模型进行文本自动推理。本项目有助于研究汉语文本推理的特点及相关推理现象,探讨面向汉语文本推理的深层理解方法,推动中文文本推理的平台建设,并评估现有文本推理系统的性能。
本项目通过研究汉语文本推理中的各类推理关系,建立一个汉语文本推理现象标注框架及标注资源,在此基础上提出了推理现象的自动识别模型,并以此建立了汉语文本推理的自动分析方法。对于推理现象标注框架及资源,本研究将推理现象分为替换、省略和解释三大类,在此基础上建立了一个包含29种推理现象的标注体系,并建立了一个包含5000个文本推理对的数据集。这一方案通过将文本间的外在形式变化与内在的语义转换建立联系,从而建立了一套适合机器自动分析的汉语语义推理机制以及相应的标注资源。对于推理现象识别和总体推理关系判断,本研究设计并实现了从推理单元识别、推理现象识别到总体推理判断的串行识别和联合识别方案,并通过实验验证了其有效性。该方法不仅有效提高了文本推理的性能,而且其分析过程具有可解释性。对于系统应用,本研究将文本推理方法应用于自动问答和情绪识别两个自然语言处理应用中。基于推理现象的文本推理方法的应用使上述系统具备一定的深度理解能力。实验表明该方法在一定程度上改进了系统性能。本项目的主要成果包括:1)在中文信息学报、湖北社会科学(CSSCI)等期刊和CCL、CLSW等国内外自然语言处理会议发表论文16篇;2)建立了一个包含5000个文本对,共14272个推理现象的标注数据集,其中推理单元的标注一致率为77.56%,推理现象的标注一致率为86.23%;3)实现了一个推理现象标注平台; 4)设计并实现了一个基于推理现象识别的文本推理系统,并参加了NTCIR-11国际评测,取得第二名的成绩;5)设计并实现了基于文本推理的自动问答和情绪识别系统;6)将本研究方案应用于汉语篇章结构语料库的构建以及隐式情绪识别研究。
{{i.achievement_title}}
数据更新时间:2023-05-31
黄河流域水资源利用时空演变特征及驱动要素
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
基于细粒度词表示的命名实体识别研究
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理
汉语文本推理的资源建设和统计分析研究
汉语特征结构的资源建设和自动分析研究
意见挖掘中隐式情感的资源建设和自动分析研究
计算机自动推理