大规模、高质量的词汇知识资源是自然语言系统处理真实文本的基本保证。随着语料库建设的发展以及机器学习研究的不断深入,基于大规模语料库的语言知识自动获取已经成为必然趋势。本申请以汉语动词子语类框架知识资源的建设为目标,重点研究汉语动词子语类框架的自动获取技术。子语类框架是描述动词词汇知识的一种最基本的形式,它是句法分析和词汇语义知识描述的前提和基础。语言学理论指导下的统计机器学习是本申请拟采取的基本研究方法。具体地,将从语言学的角度重点分析自动获取过程中的噪音问题和数据稀疏问题,通过把论元结构和动词义类信息作为特征加入最大熵模型中,在自动获取子语类框架的过程中统一解决这两个问题。最后,通过一个基于应用的评测机制评价动词子语类框架在句法分析应用中的实际效用。本申请将为建立大规模、高质量的汉语动词子语类框架知识资源奠定技术基础。其研究方法和关键技术对其它语言知识的自动获取也具有方法论上的参考意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于SSVEP 直接脑控机器人方向和速度研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制
服务经济时代新动能将由技术和服务共同驱动
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
汉语动词次范畴化自动获取技术的研究
汉语动词搭配知识的自动发现研究
维吾尔语框架语义角色自动标注技术研究
英汉动词次范畴化对应关系自动获取研究