基于语义依存图的汉语复杂名词短语资源建设与自动分析研究

基本信息

批准号：61173095

项目类别：面上项目

资助金额：57.00

负责人：萧国政

学科分类：

依托单位：武汉大学

批准年份：2011

结题年份：2015

起止时间：2012-01-01 - 2015-12-31

项目状态：已结题

项目参与者：李艳,郭婷婷,欧阳晓芳,冯文贺,刘建舟,任恺,卢露,胡兵

关键词：

复杂名词短语区分性模型语义依存多标记语义资源

结项摘要

本项目旨在研究汉语复杂名词短语的语义依存结构，提出基于多标记有向图的表示机制，建设大规模标注资源并探讨基于区分性模型的分析策略。语义依存结构跳脱句法依存的限制，允许多父节点、边多标记和交叉依存。所建资源包含源于真实语料的8万复杂名词短语，所提区分性策略基于对数线性模型，其特征设计可刻划局部和全局性的结构化信息。本项目有助于探讨和阐清适合汉语实际的语义描写机制；丰富汉语自身的语义资源和语义分析策略；对提高汉语自动分析、信息抽取和机器翻译等技术的性能有一定意义。

项目摘要

本项目已建设完成8 万汉语复杂名词短语大规模语义依存结构描述资源，语料均来源于新闻语料。并在此基础上，针对复杂名词短语的内部结构特征，提出了基于多标记有向图的复杂名词短语内部语义关系的表示方法，探讨了基于简单边优先与 SVM 相结合的依存句法分析策略。该算法考虑了复杂名词短语的内部结构特征，在降低计算复杂度的同时，有效地保证了准确率。实验证明该算法能良好地应用于复杂名词短语的依存分析，且准确率和效率高于现有中文句法分析器。本项目对探索适合汉语真实文本实际的语义描写机制，丰富汉语人机共用的语义资源和语义分析策略，对提高汉语自动分析、信息抽取和机器翻译等技术的性能均有一定意义。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：10.7524 /j.issn.0254-6108.2017122903

发表时间：2018

DOI：10.7606/j.issn.1000-7601.2021.04.29

发表时间：2021

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：10.12202/j.0476-0301.2022178

发表时间：2022

萧国政的其他基金

相似国自然基金

汉语框架语义依存图自动抽取关键技术研究

批准号：60970053

批准年份：2009

负责人：李茹

学科分类：F0211

资助金额：31.00

项目类别：面上项目

汉语特征结构的资源建设和自动分析研究

批准号：90820005

批准年份：2008

负责人：姬东鸿

学科分类：F0211

资助金额：50.00

项目类别：重大研究计划

基于依存图的汉语依存分析技术研究

批准号：61170181

批准年份：2011

负责人：陈家骏

学科分类：F0211

资助金额：55.00

项目类别：面上项目

基于语料库的汉语短语自动切分方法研究

批准号：69303010

批准年份：1993

负责人：白栓虎

学科分类：F0211

资助金额：5.50

项目类别：青年科学基金项目

基于语义依存图的汉语复杂名词短语资源建设与自动分析研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于铁路客流分配的旅客列车开行方案调整方法

珠江口生物中多氯萘、六氯丁二烯和五氯苯酚的含量水平和分布特征

向日葵种质资源苗期抗旱性鉴定及抗旱指标筛选

一种基于多层设计空间缩减策略的近似高维优化方法

复杂系统科学研究进展

萧国政的其他基金

相似国自然基金