本课题研究了多种词义消歧方法:考察特征的依赖关系,用图模型表示词义消歧模型,提出最小描述长度的模型评价标准和模拟退火的模型搜索策略。改进ID决策树算法,克服用于词义消歧面临的几大难点,改善消歧效果。基于目标语的词义消歧方法和基于结构化语义实例的词义消歧方法被用于实际的英汉机器翻译系统中,效果良好。我们还研究了词义消歧的相关环节:兼类消歧、基本名词短语识别和非递归从句边界识别,效果明显优于同类研究。考虑到语言学资源对词义消歧效果的制约,我们开发了人机结合的方式实现了中等规模的双语对齐语料库,探索了向机读词典自动添加语义信息和全自动词料库词义标注的方法,为词义消歧及相关研究提供资源和理论的准备。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于SSVEP 直接脑控机器人方向和速度研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
一种改进的多目标正余弦优化算法
面向工件表面缺陷的无监督域适应方法
基于双语信息的英汉译文消歧技术研究
面向大数据的中文词义消歧模型优化研究
基于语义范畴扩展的汉语词义消歧方法研究
基于等价伪词的汉语全文无指导词义消歧技术研究