短语结构句法分析的核心思想是识别句子中的短语以及短语之间的句法关系。短语结构句法分析一直以来都是自然语言处理领域的核心问题之一。近年来,随着大规模人工标注树库的出现,数据驱动的句法分析器在实际应用中起到重要作用。本申请课题在深入分析短语结构句法分析研究中存在的一些问题的基础上,重点研究移进-归约句法分析的一些关键问题和改进技术。主要研究内容包括:在移进-归约算法框架下引入短语信息、子树级移进-归约算法、挖掘深层次的句法信息、利用预测信息指导移进-归约方法的解码技术、利用异构树库和不带标数据、句法分析的领域适应性。最终集成这些关键技术,构建基于移进-归约的中文句法分析共享支撑平台。
本课题研究渐进式中文句法分析的关键技术,设计并实现了中文语言分析器。为文本处理等其他应用提供了很好的技术支持。研究内容主要包括利用大规模数据词汇依存关系改进移进-归约成分句法分析、多维度等级评分模型优化技术、向上学习方法改进移进-归约中文句法分析、easy-first中文词性标注和依存句法分析、基于特征方法的树库转换技术、Niuparser开源语言分析技术平台构建等关键技术,最后集成所有关键技术构造一套中文句法语义分析系统NiuParser,目前已经公开发布,供学术界无偿使用。本课题相关研究成果在国内外期刊杂志和学术会议上发表了8篇学术论文,其中包括2篇国际期刊和3篇Acl/Coling顶级国际会议论文。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
面向云工作流安全的任务调度方法
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
多源数据驱动CNN-GRU模型的公交客流量分类预测
混采地震数据高效高精度分离处理方法研究进展
汉语依存句法分析若干关键技术研究
词汇化句法分析若干关键技术研究
中文专利检索中关键技术研究
中文句法分析与语义角色标注的联合学习机制研究