汉语关联结构的资源建设和自动分析模型研究

基本信息
批准号:61202193
项目类别:青年科学基金项目
资助金额:28.00
负责人:陈波
学科分类:
依托单位:湖北文理学院
批准年份:2012
结题年份:2015
起止时间:2013-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:刘群,谷琼,周伟刚,吕晨,刘平,任恺,王丹,韩磊,马婷婷
关键词:
文本蕴含关联结构区分性模型语义依存语义资源
结项摘要

Chinese connective structure contains rich and complex semantic information. For a long time, Chinese information processing focus on the representation and analysis of single sentence, and neglects modeling and analysis of complex sentences. The project aims to establish a Chinese connectives ontology, study semantic dependency structure of connectives, propose mechanism based on the semantic dependency graph, build large-scale annotation resources and explore the analysis strategy based on discriminative model. Semantic dependency structure avoids the limitations of syntactic dependency, allowing multi-parent node and the cross dependency relations. We will built a Chinese connectives ontology and 20000 complex sentences from a real corpus. The feature design can characterize structured information. This project will help to explore the semantic representation mechanism for actual Chinese characteristics, enrich Chinese semantic resources and semantic analysis strategy, and improve the performance of Chinese automatic parsing, textual entailment, information extraction and discourse understanding.

汉语的关联结构(由连词构成的复句)包含着丰富而复杂的语义信息。长期以来中文信息处理比较专注于单句的表示和分析,复句的建模和分析处于较忽略的地位。本项目旨在建立一个完整的汉语关联词语本体,研究关联结构的语义依存结构,提出基于语义依存图(有向图)的表示机制,建设大规模标注资源并探讨基于判别性模型的分析策略。语义依存结构跳脱句法依存的限制,允许多父节点和交叉依存。所建资源包含一个汉语关联词语本体和2万个从真实语料中选取的例句,基于对数线性的二阶段区分性分析模型用以分析关联结构的语义依存,其特征设计可刻划局部和全局性的结构化信息。本项目有助于探讨适合汉语实际特点的语义描写机制,丰富汉语语义资源和语义分析策略,对提高汉语自动分析、文本蕴含、信息抽取和篇章理解等技术的性能有一定意义。

项目摘要

本项目旨在研究面向语义的汉语关联结构,建立汉语关联词语本体以及语篇级大规模关联结构语义标注资源,并探讨基于语义依存图(有向图)的表示机制和基于判别性模型的分析策略。汉语语篇级的关联结构包括显性结构(有关联词语为标志)和隐性结构(无关联词语为标志,仅以句子间的标点符号为标志)两类,本项目在显性结构和隐性结构两个方面均建构了语义资源。所建资源包括三个部分:第一,包含1291个汉语关联词语本体集。第二,建构了2万句的大规模关联结构语义标注资源。标注语料来源于宾州中文树库CTB6.1生语料和国内近三年的中文新闻语料,具有通用性、典型性、时效性和代表性。在标注过程中全程采用手工标注的方法,以确保资源标注的准确性。制定了语料的标注标准。第三,为便于下一步的自动分析,又增加了汉语关联结构模板集的建设。整体建构关联结构模板集的框架为:汉语关联结构的模板集由每种语篇关系的模板集组合而成,每种语篇关系的模板集由有限的“类模板”构成,“类模板”由若干“子模板”构成。汉语关联结构本体可以形式化为若干个关联结构模板的集合,该模板集便于进一步对关联结构引导的每个分句之间逻辑语义关系的自动分析。在自动分析方面,由于语义依存图是一个带标记的有向图,为保证分析效率,我们应用对数线性模型并将语义依存结构的分析分为两个阶段,整个分析过程分为两个阶段,Phase 1为无向树分析,Phase II为有向图分析。并运用条件随机场方法对关联结构的隐性关系(如:以顿号、逗号为关联结构标记)进行自动识别。本项目有助于探讨适合汉语实际特点的语义描写机制,丰富汉语语义资源和语义分析策略,对提高汉语自动分析、文本蕴含、信息抽取和篇章理解等技术的性能有一定意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
3

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
4

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
5

黄河流域水资源利用时空演变特征及驱动要素

黄河流域水资源利用时空演变特征及驱动要素

DOI:10.18402/resci.2020.12.01
发表时间:2020

陈波的其他基金

批准号:81272244
批准年份:2012
资助金额:70.00
项目类别:面上项目
批准号:21575040
批准年份:2015
资助金额:65.00
项目类别:面上项目
批准号:41704119
批准年份:2017
资助金额:26.00
项目类别:青年科学基金项目
批准号:40774098
批准年份:2007
资助金额:43.00
项目类别:面上项目
批准号:40066001
批准年份:2000
资助金额:17.00
项目类别:地区科学基金项目
批准号:21275049
批准年份:2012
资助金额:85.00
项目类别:面上项目
批准号:41266002
批准年份:2012
资助金额:56.00
项目类别:地区科学基金项目
批准号:81201892
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目
批准号:51178366
批准年份:2011
资助金额:60.00
项目类别:面上项目
批准号:40766001
批准年份:2007
资助金额:17.00
项目类别:地区科学基金项目
批准号:11026157
批准年份:2010
资助金额:3.00
项目类别:数学天元基金项目
批准号:11401233
批准年份:2014
资助金额:22.00
项目类别:青年科学基金项目
批准号:11126099
批准年份:2011
资助金额:3.00
项目类别:数学天元基金项目
批准号:61201327
批准年份:2012
资助金额:27.00
项目类别:青年科学基金项目
批准号:21775040
批准年份:2017
资助金额:64.00
项目类别:面上项目
批准号:71103172
批准年份:2011
资助金额:17.00
项目类别:青年科学基金项目
批准号:31500352
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:81302011
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:50805059
批准年份:2008
资助金额:20.00
项目类别:青年科学基金项目
批准号:11775054
批准年份:2017
资助金额:64.00
项目类别:面上项目
批准号:41404061
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:20927005
批准年份:2009
资助金额:140.00
项目类别:专项基金项目
批准号:71503288
批准年份:2015
资助金额:17.00
项目类别:青年科学基金项目
批准号:40376001
批准年份:2003
资助金额:31.00
项目类别:面上项目
批准号:49506075
批准年份:1995
资助金额:10.00
项目类别:青年科学基金项目
批准号:30801490
批准年份:2008
资助金额:20.00
项目类别:青年科学基金项目
批准号:81202208
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目
批准号:81860882
批准年份:2018
资助金额:37.00
项目类别:地区科学基金项目
批准号:11005020
批准年份:2010
资助金额:24.00
项目类别:青年科学基金项目
批准号:11572139
批准年份:2015
资助金额:60.00
项目类别:面上项目
批准号:81372811
批准年份:2013
资助金额:72.00
项目类别:面上项目
批准号:51105103
批准年份:2011
资助金额:26.00
项目类别:青年科学基金项目
批准号:51806197
批准年份:2018
资助金额:25.00
项目类别:青年科学基金项目
批准号:50808010
批准年份:2008
资助金额:22.00
项目类别:青年科学基金项目
批准号:21502087
批准年份:2015
资助金额:21.00
项目类别:青年科学基金项目
批准号:71103116
批准年份:2011
资助金额:21.00
项目类别:青年科学基金项目
批准号:21307048
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:41402271
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:41807366
批准年份:2018
资助金额:24.00
项目类别:青年科学基金项目
批准号:51905481
批准年份:2019
资助金额:26.00
项目类别:青年科学基金项目
批准号:81160456
批准年份:2011
资助金额:57.00
项目类别:地区科学基金项目
批准号:61906182
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:41302019
批准年份:2013
资助金额:27.00
项目类别:青年科学基金项目
批准号:51378059
批准年份:2013
资助金额:82.00
项目类别:面上项目
批准号:50901076
批准年份:2009
资助金额:20.00
项目类别:青年科学基金项目
批准号:41576024
批准年份:2015
资助金额:66.00
项目类别:面上项目
批准号:51678463
批准年份:2016
资助金额:63.00
项目类别:面上项目
批准号:69978014
批准年份:1999
资助金额:14.00
项目类别:面上项目
批准号:10878004
批准年份:2008
资助金额:160.00
项目类别:联合基金项目
批准号:50708083
批准年份:2007
资助金额:20.00
项目类别:青年科学基金项目
批准号:20875028
批准年份:2008
资助金额:32.00
项目类别:面上项目
批准号:41001237
批准年份:2010
资助金额:18.00
项目类别:青年科学基金项目
批准号:30972939
批准年份:2009
资助金额:31.00
项目类别:面上项目
批准号:71001031
批准年份:2010
资助金额:17.70
项目类别:青年科学基金项目
批准号:51508527
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:51008282
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目
批准号:40566001
批准年份:2005
资助金额:23.00
项目类别:地区科学基金项目
批准号:51305414
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:51609074
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:41501020
批准年份:2015
资助金额:23.00
项目类别:青年科学基金项目

相似国自然基金

1

汉语特征结构的资源建设和自动分析研究

批准号:90820005
批准年份:2008
负责人:姬东鸿
学科分类:F0211
资助金额:50.00
项目类别:重大研究计划
2

汉语篇章结构分析的资源建设与计算模型研究

批准号:61273320
批准年份:2012
负责人:周国栋
学科分类:F03
资助金额:81.00
项目类别:面上项目
3

基于语义依存图的汉语复杂名词短语资源建设与自动分析研究

批准号:61173095
批准年份:2011
负责人:萧国政
学科分类:F0211
资助金额:57.00
项目类别:面上项目
4

汉语文本推理的资源建设和统计分析研究

批准号:61173062
批准年份:2011
负责人:姬东鸿
学科分类:F0211
资助金额:58.00
项目类别:面上项目