Although the machine translation technology has great application value, machine translation has always been one of the most difficult subjects in the field of artificial intelligence. The existing quality problems of machine translations show that both dominant theories rule-based machine translation and statistical machine translation need to innovate. Finding new mathematical theory to improve the machine translation theory would be the spontaneous driving force for the development of machine translation. In this project we will introduce the theory of quotient space of fuzzy numbers in machine translation theory trying to solve the existing various ambiguity problem in machine translation. In view of the essential attribute of natural language, fuzziness, first by studying the basic algebraic properties of quotient space of fuzzy numbers we will establish the formal linguistics in which natural languages and synonyms basic element classes are represented by fuzzy numbers and equivalence classes of fuzzy numbers, respectively. Then with a complete metric we will reveal the analytical properties of fuzzy mappings in quotient space of fuzzy numbers and establish the optimization theory of fuzzy mappings. Finally, we will apply the obtained results to the reconstruction of the model of the machine translation and realize the algorithm of machine translation based on quotient space of fuzzy numbers in order to improve the quality of translation. In conclusion, we will construct the theory of machine translation based on the quotient space of fuzzy numbers which will give an impulse to the development of the theory of machine translation.
虽然机器翻译技术蕴藏着巨大的应用价值,但是机器翻译却一直是人工智能领域最难的课题之一。 现有机器翻译的翻译质量问题迫切需要对基于规则和基于统计的传统理论进行创新和突破。探寻新的数学理论推动机器翻译理论的完善与成熟将是机器翻译发展的内动力。本项目将在机器翻译理论中引入模糊数商空间理论,试图解决现有机器翻译中的各种歧义问题。针对自然语言的本质属性—模糊性,通过研究模糊数商空间的基本代数性质建立模糊数表示自然语言,模糊数等价类表示近义基本元素类的形式化语言研究。借助完备距离研究模糊数商空间中映射的分析性质,建立模糊映射的优化理论。最后将模糊数商空间中的成果融入到机器翻译理论模型的构建中,实现基于模糊数商空间的机器翻译算法,提高机器翻译的翻译质量。本项目将形成基于模糊数商空间的机器翻译理论,对机器翻译理论的完善起到积极的推动作用。
模糊性是自然语言的本质属性。不论是基于规则和基于统计的传统理论,还是如今基于神经网络的机器翻译理论,都必须面临解决模糊性这一问题。现有机器翻译的质量虽然有大幅提升,但仍然存在各种难题。探寻新的数学理论推动机器翻译理论的完善与成熟将是机器翻译发展的内动力。本项目针对自然语言的本质属性—模糊性,在自然语言处理中利用模糊数及其映射理论,建立基于不确定性理论的文本表示模型,将对现有机器翻译理论起到积极的推动作用,同时,本项目的理论和方法对于自然语言处理中的其他领域同样有借鉴作用。. 本项目主要做了三个部分的工作,第一部分工作是对模糊数及其商空间的代数和分析性质进行了有针对性的研究,主要研究了模糊数以及区间数的差运算的缺陷和各种改进方式存在的问题,以及商空间中相关运算的优势和模糊数与商空间的关系;研究了模糊数值函数和模糊数等价类函数的相关分析性质,以及对应的微分方程相关性质的讨论;第二部分工作是模糊数值函数和模糊数等价类函数的优化理论研究。梳理了各种模糊优化解的区别和联系;讨论了模糊数等价类函数优化问题的KKT优化条件;同时,结合Zedeh教授提出的Z-数理论,讨论了基于Z-数的优化方法和多目标优化问题的算法。 第三部分工作是自然语言的词表示文档表示理论及其应用研究:分别利用模糊集理论改进连续词袋模型,同时提出一种新的模糊查询扩展方法以及基于词向量的模糊信息查询模型;利用粗糙集理论对词袋模型文本表示算法进行研究,得到两种文本表示模型;针对自然语言中天然存在的不确定性,借鉴量子计算的理论与方法,研究基于量子纠缠的文档表示的理论及应用。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
基于直觉模糊数的随机多准则决策方法及其在应急处理方案评价与选择中的应用研究
基于模糊DEA的供应商评价理论与应用研究
模糊控制器的算法结构分析及其在热工控制中的应用研究
空间独立成分分析及其在矿产预测中的应用研究