双语语料库在自然语言处理及机器翻译研究中的重要作用已经得到越来越多的认可。互联网中海量的文本信息所呈现的多语言、多领域性为大规模真实双语语料库的自动构建和翻译知识的自动获取提供了有利的条件。本申请充分利用Web丰富的结构和链接信息,探索自动,高效的双语语料库和翻译知识自动获取方案。具体研究内容包括基于Web的双语平行语料库和可比语料库的自动挖掘技术,双语网页相似度的计算模型,基于双语网页结构和内容信息的翻译句对抽取,特定领域的双语语料库获取以及特定领域术语翻译的自动获取技术。本研究的目标是建立一个基于web的,大规模、多粒度、多领域、多语言的翻译资源获取平台,实现持续的、动态的双语语料库资源的自动构建和翻译知识获取。本研究对于推动机器翻译及多语言信息处理研究的发展和实用化具有重要的理论意义和实际价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
服务经济时代新动能将由技术和服务共同驱动
中外学术论文与期刊的宏观差距分析及改进建议
卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比
知识产权保护执法力度、技术创新与企业绩效 — 来自中国上市公司的证据
基于关系对齐的汉语虚词抽象语义表示与分析
利用双语语料库获取翻译知识的研究
基于多种双语平行语料相互关联分析的中轴语言统计翻译知识获取研究
面向汉藏机器翻译的大规模双语语料库构建技术研究
纳西-汉语双语语料库构建与翻译方法研究