The existing linguistic theories on clause are verb-based and not suitable for describing Chinese language. Moreover, there is few formal syntactic studies above clause levels in Chinese. NLP focuses on statistical machine learning, lacking directions from linguistics theory and language knowledge, which results in the inadequacies in text processing and long sentence translation..On the basis of preliminary work funded by NSFC, the project is to establish scientific theory of NT clause complex model centered on referential expression containing formal structure, semantic constraints, and cognition explanation. The theory, which is beyond syntactic details of specific languages, is suitable for both Chinese and English. Therefore, the theory can be used as a cross-language grammar platform to support machine translation of long sentences.
现有的语言学的小句理论是以动词为中心的,不适合描写汉语,并且对小句层面以上缺少形式化的研究。自然语言处理偏重于统计机器学习,缺少语言理论和语言知识的指导,使得篇章处理、长句翻译的效果不佳。.本项研究在国家自然科学基金资助的前期工作的基础上,建立起以指称语为中心的NT小句复合体模型的科学理论体系,包括形式结构、语义约束和认知解释。这一理论体系超越特定语言的句法细节,既适合于汉语,又适合于英语,从而可以用作跨语言的语法平台,支持长句机器翻译。
本课题的工作属于传统语言学、计算语言学、认知科学的交叉学科的基础理论和应用基础研究。.(1)主要研究内容:.[1] 研究汉语小句复合体理论体系,包括语法结构、语义约束、性质和认知解释,以及小句复合体拆解成NT小句的操作模型;.[2] 研究汉语小句复合体各概念和相关结构在英语中的对应;.[3] 考察英汉小句复合体结构的异同,研究其差异对于英汉机器翻译的影响;.[4] 研究英汉机器翻译PTA模型及其实现方法;.[5] 建设汉语小句复合体语料库和英汉小句对齐语料库。.(2)重要成果:.[1] 基础理论方面建立了普适于汉语和英语的小句复合体理论体系,包括. [1.1] 提出了小句复合体的两个基本概念:小句的话头话身结构和小句复合体小句间的成分共享机制;. [1.2] 确定了小句间成分共享机制的模式,挖掘了各种模式的语法性质和语义性质;. [1.3] 对基本概念和各种模式及其性质给出了认知解释。.[2] 应用基础方面建立了小句复合体层面的英汉机器翻译的PTA模型,包括. [2.1] 提出机器翻译错误同语法层面的关系;. [2.2] 分析了英汉小句复合体的结构异同及其与机器翻译错误的关系. [2.3.] 设计了英译汉的话头话体结构转换的表示形式和操作方法,并在语料标注中实现。.[3] 数据资源方面建立了汉语小句复合体语料库和英汉小句对齐语料库。.(3)科学意义.本课题的工作在基础理论和应用基础方面都是原创性的。话头话身结构和成分共享机制是独特的切合人脑认知的概念,本课题从这两个概念出发分析汉语和英语小句复合体的语法结构,使得这两种语言得以在这两个概念基础上建立统一的形式模型和计算模型,进行结构对比,描写结构转换,进行结构分析和结构转换的计算,为融合语言知识的机器翻译开辟了新路。本项工作的多方面结果有深入的认知解释,为人脑的语言认知机制研究提供了新途径。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
伴有轻度认知障碍的帕金森病~(18)F-FDG PET的统计参数图分析
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
二种乙肝病毒新毒株在转染细胞和树句模型的复制与表达
人,懒猴,婴猴和树句的比较基因组研究
离散选择模型和受限因变量模型的前沿理论与应用研究
基于统计模型的机器视觉理论、方法和应用研究