基于语义依存图的汉语复杂名词短语资源建设与自动分析研究

基本信息
批准号:61173095
项目类别:面上项目
资助金额:57.00
负责人:萧国政
学科分类:
依托单位:武汉大学
批准年份:2011
结题年份:2015
起止时间:2012-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:李艳,郭婷婷,欧阳晓芳,冯文贺,刘建舟,任恺,卢露,胡兵
关键词:
复杂名词短语区分性模型语义依存多标记语义资源
结项摘要

本项目旨在研究汉语复杂名词短语的语义依存结构,提出基于多标记有向图的表示机制,建设大规模标注资源并探讨基于区分性模型的分析策略。语义依存结构跳脱句法依存的限制,允许多父节点、边多标记和交叉依存。所建资源包含源于真实语料的8万复杂名词短语,所提区分性策略基于对数线性模型,其特征设计可刻划局部和全局性的结构化信息。本项目有助于探讨和阐清适合汉语实际的语义描写机制;丰富汉语自身的语义资源和语义分析策略;对提高汉语自动分析、信息抽取和机器翻译等技术的性能有一定意义。

项目摘要

本项目已建设完成8 万汉语复杂名词短语大规模语义依存结构描述资源,语料均来源于新闻语料。并在此基础上,针对复杂名词短语的内部结构特征,提出了基于多标记有向图的复杂名词短语内部语义关系的表示方法,探讨了基于简单边优先与 SVM 相结合的依存句法分析策略。该算法考虑了复杂名词短语的内部结构特征,在降低计算复杂度的同时,有效地保证了准确率。实验证明该算法能良好地应用于复杂名词短语的依存分析,且准确率和效率高于现有中文句法分析器。本项目对探索适合汉语真实文本实际的语义描写机制,丰富汉语人机共用的语义资源和语义分析策略,对提高汉语自动分析、信息抽取和机器翻译等技术的性能均有一定意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
3

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
4

黄河流域水资源利用时空演变特征及驱动要素

黄河流域水资源利用时空演变特征及驱动要素

DOI:10.18402/resci.2020.12.01
发表时间:2020
5

温和条件下柱前标记-高效液相色谱-质谱法测定枸杞多糖中单糖组成

温和条件下柱前标记-高效液相色谱-质谱法测定枸杞多糖中单糖组成

DOI:10.3724/ SP.J.1123.2019.04013
发表时间:2019

萧国政的其他基金

相似国自然基金

1

汉语框架语义依存图自动抽取关键技术研究

批准号:60970053
批准年份:2009
负责人:李茹
学科分类:F0211
资助金额:31.00
项目类别:面上项目
2

汉语特征结构的资源建设和自动分析研究

批准号:90820005
批准年份:2008
负责人:姬东鸿
学科分类:F0211
资助金额:50.00
项目类别:重大研究计划
3

基于依存图的汉语依存分析技术研究

批准号:61170181
批准年份:2011
负责人:陈家骏
学科分类:F0211
资助金额:55.00
项目类别:面上项目
4

基于语料库的汉语短语自动切分方法研究

批准号:69303010
批准年份:1993
负责人:白栓虎
学科分类:F0211
资助金额:5.50
项目类别:青年科学基金项目