汉语句法分析中的自动歧义识别和分类问题研究

基本信息
批准号:61300158
项目类别:青年科学基金项目
资助金额:23.00
负责人:黄书剑
学科分类:
依托单位:南京大学
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:陈家骏,赵迎功,周浩,陈华栋,朱长峰,孙辉丰
关键词:
歧义识别句法分析歧义分类
结项摘要

Efficient information processing applications often require effective methods to automatically analyze and understand the text. Syntactic analysis, or parsing, is an important step of the text analysis pipeline. However, the parsing result of real world applications is usually not good enough. An important factor of parsing errors is the structural ambiguity. Structural ambiguity refers to the presence of multiple syntactic structures for the same or similar sentence fragments. Most of the previous studies focus on the theoretical issues, the analysis of given ambiguous instances or the application of a certain linguistic resource. In this project we plan to study methods for automatically identifying and classifying structural ambiguities. We firstly identify structural ambiguities using uncertainty measures. Then we classify these ambiguities into different categories according to the context or linguistic resources requires to solve them. These identification and classification results may leads to specific resolution techniques for a certain ambiguity type and better resolution result.

高效的信息处理应用需要有效的文本的自动分析和理解方法,句法分析是文本分析体系中的重要环节。句法分析效果在实际应用中仍然难以让人满意,这主要是由于对句法结构歧义的处理错误导致的。句法结构歧义是指存在相同或相似的句子片段对应多个不同的句法结构的情况。以往的研究大多关注于部分歧义实例的消解、某个具体的歧义问题或特定的语义资源的使用,缺乏通用的歧义处理手段。本项目拟研究在自动句法分析中的歧义识别方法以及面向消解过程的歧义分类方法。首先采用不确定性分析的技术对句法分析中影响分析效果的关键性歧义自动识别;然后结合语言学的歧义理论,根据消解这些歧义所需要的不同上下文和语义知识来源对歧义进行分类,为自动的歧义消解提供依据。

项目摘要

句法分析建立在词法分析的基础上,为高层的语法语义分析提供基础,是自然语言处理中的一项基本任务。句法分析中的歧义问题是指对给定的语言片段存在多个可能的句法标注的情况。在分析过程中,歧义往往是由于模型本身的建模的上下文信息不足等原因造成的。如果这些歧义不能被有效地识别和消解,句法分析性能将会受到影响。.围绕自动句法分析中的歧义识别问题,本项目从给定句法分析模型下的歧义识别问题和给定任务场景下的歧义消解问题两个方面展开了研究。第一方面,研究了基于统计和神经网络的句法分析表示和建模以及句法分析中的歧义表示、建模和搜索的方法和技术。探索了在复杂的结构化预测问题中进行建模和搜索的方法和手段,为进一步进行歧义的判别和消解奠定了基础。第二方面,研究了句法分析中歧义判别和消解方法以及一些特殊歧义来源和特定任务中的歧义消解。探索了在复杂的自然语言处理任务需求和场景下的歧义分析、消解的方法和技术,为更好的研究更加通用的歧义分析消解方法打下了基础。项目进行过程中研制了多个句法分析系统具有较好的分析精度,以及较高的分析效率,可以为文本分析理解等应用服务。.

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018
2

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
3

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
4

适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理

适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理

DOI:10.19783/j.cnki.pspc.200521
发表时间:2021
5

基于Pickering 乳液的分子印迹技术

基于Pickering 乳液的分子印迹技术

DOI:10.1360/N972018-00955
发表时间:2019

黄书剑的其他基金

批准号:61772261
批准年份:2017
资助金额:59.00
项目类别:面上项目

相似国自然基金

1

汉语缩略语识别以及歧义消解技术研究

批准号:60973053
批准年份:2009
负责人:王厚峰
学科分类:F0211
资助金额:30.00
项目类别:面上项目
2

汉语加工中词汇和句法歧义解决的研究

批准号:39670254
批准年份:1996
负责人:舒华
学科分类:C0907
资助金额:10.00
项目类别:面上项目
3

声纹自动识别与不认人汉语语音识别

批准号:68675007
批准年份:1986
负责人:徐秉铮
学科分类:F0304
资助金额:5.00
项目类别:面上项目
4

汉语跨标点句句法分析方法研究

批准号:60872121
批准年份:2008
负责人:宋柔
学科分类:F0113
资助金额:30.00
项目类别:面上项目