面向机器翻译的多层次文本嵌入表示学习研究

基本信息

批准号：61672440

项目类别：面上项目

资助金额：62.00

负责人：苏劲松

学科分类：

依托单位：厦门大学

批准年份：2016

结题年份：2020

起止时间：2017-01-01 - 2020-12-31

项目状态：已结题

项目参与者：陈毅东,吴清强,谭知行,邬昌兴,胡金铭,郑剑夕,徐伟,张飚,陈福海

关键词：

机器翻译深度学习文本嵌入表示循环神经网络

结项摘要

In machine translation, learning embedding representation of text has great significance for alleviating data scarcity and exploiting deep-level semantic knowledge. However, previous studies face the challenge of difficulties, including how to learn embedding representations of bilingual texts and how to explore semantic relations among different levels of texts. To resolve these difficulties, in this project, we plan to make deep studies of multi-level text embedding representation for machine translation by using multi-lingual multi-level semantic information. The major work of this project includes (1) Graph-based bilingual word embedding representation learning; (2) Bidirectional attention-based bilingual phrase embedding representation learning; (3) Lattice-based long short term memory neural network for sentence embedding representation learning; (4) Hierarchical recurrent neural network with topic information for document embedding representation learning; (5)The research on machine translation incorporating multi-level text embedding representations. Our project fully exerts the advantage of deep learning, which brings a new insight into making breakthroughs via better text embedding representation learning, and thus has an important theoretical and practical significance for machine translation.

在机器翻译任务中，文本嵌入表示学习对缓解数据稀疏和使用深层次语义知识具有重要意义。然而，现有研究面临着双语文本嵌入表示学习难度大，不同层次文本之间语义关系不易建模的难题。对此，本项目拟对如何利用多语言多层次语义信息来学习面向机器翻译的文本嵌入表示展开深入研究。项目主要工作包括：（1）基于图结构的双语词汇嵌入表示学习；（2）基于双向注意机制的双语短语嵌入表示学习；（3）基于词图的长短时记忆神经网络句子嵌入表示学习；（4）融入主题信息的层次循环神经网络文档嵌入表示学习；（5）引入多层次文本嵌入表示的机器翻译建模研究。项目充分发挥了深度学习的优势，它的开展将为如何更好地利用文本嵌入表示学习来解决传统机器翻译面临的瓶颈问题提供一种新的思路，对机器翻译的研究发展和产业化应用具有重要意义。

项目摘要

在机器翻译任务中，文本嵌入表示学习对缓解数据稀疏和使用深层次语义知识具有重要意义。然而，现有研究面临着双语文本嵌入表示学习难度大，不同层次文本之间语义关系不易建模的难题。对此，本项目拟对如何利用多语言多层次语义信息来学习面向机器翻译的文本嵌入表示展开深入研究。在项目实施过程中，课题组主要开展了以下研究工作：（1）基于图结构的双语词汇嵌入表示学习；（2）基于双向注意机制的双语短语嵌入表示学习；（3）基于词图的长短时记忆神经网络句子嵌入表示学习；（4）融入主题信息的层次循环神经网络文档嵌入表示学习；（5）引入多层次文本嵌入表示的机器翻译建模研究。项目充分发挥了深度学习的优势，它的开展将为如何更好地利用文本嵌入表示学习来解决传统机器翻译面临的瓶颈问题提供新的思路，对机器翻译的研究发展和产业化应用具有重要意义。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.1360/SSM-2020-0035

发表时间：2020

DOI：

发表时间：2017

DOI：10.3969/j.issn.1674-0696.2020.10.20

发表时间：2020

DOI：10.11897/SP.J.1016.2018.00886

发表时间：2018

DOI：10.11936/bjutxb2021010011

发表时间：2021

苏劲松的其他基金

批准号：61303082

批准年份：2013

资助金额：27.00

项目类别：青年科学基金项目

相似国自然基金

面向机器翻译的文本领域识别

批准号：60672149

批准年份：2006

负责人：黄河燕

学科分类：F0113

资助金额：30.00

项目类别：面上项目

面向多层次篇章语义的机器翻译理论、方法与实现

批准号：61432013

批准年份：2014

负责人：张民

学科分类：F0211

资助金额：350.00

项目类别：重点项目

面向神经机器翻译的结构学习方法研究

批准号：61876035

批准年份：2018

负责人：肖桐

学科分类：F0606

资助金额：62.00

项目类别：面上项目

基于文本表示学习的金融市场行情预测方法研究

批准号：61702137

批准年份：2017

负责人：丁效

学科分类：F0211

资助金额：25.00

项目类别：青年科学基金项目

面向机器翻译的多层次文本嵌入表示学习研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

现代优化理论与应用

褐煤与煤矸石在循环流化床锅炉中混燃及SO2、NOx排放特性研究

含饱和非线性的主动悬架系统自适应控制

WMTL-代数中的蕴涵滤子及其应用

城市生活垃圾热值的特征变量选择方法及预测建模

苏劲松的其他基金

基于主题模型的枢轴语言统计机器翻译研究

相似国自然基金