蒙古文是一种跨国、跨地区并且在国际上很有影响的语言文字。由于其具有十分复杂的语言特点,蒙古文也是最难信息化的语言文字之一。由于多方面的原因,现在蒙古文电子文档难于交流和共享。这严重制约了以蒙古文为载体的信息的产生、传播与查询。为此,我们提出了基于语言模型框架的跨汉蒙语言的信息检索的课题。课题以语言模型作为基础研究从汉语查询项检索蒙古语文档的信息技术。具体的研究内容有:(1)基于词缀信息的分层蒙古语语言模型;(2) 汉蒙跨语言的词向量翻译模型;(3) 基于机器翻译的查询结果Rerank,在此基础上,设计一个实验系统,实现跨汉语、蒙古语的检索平台,系统具有较高的查全率和查准率。该课题的研究必将对传承和发展少数民族文化、促进民族地区社会进步和稳定发展具有重要的意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
跨社交网络用户对齐技术综述
粗颗粒土的静止土压力系数非线性分析与计算方法
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于内容的跨语言语音检索方法研究
面向汉语-泰语跨语言新闻事件检索方法研究
基于多语用户模型的个性化跨语言信息检索研究
基于双语文档反馈的跨语言信息检索研究