Natural language processing is extremely important, and has a long way to go. Generally, the methods of language processing are under the influence of two major schools of thought in philosophy of science; namely, rationalism and empiricism. Most of the methods based on rules or statistics have been made great achievements. However, all of them still remain in shallow learning stage. The purpose of this research is to explore a deep learning method used in language processing, to abstract semantic knowledge exactly, and to build a knowledge base used in language processing. This deep learning method would simulate the learning methods of human, such as association, reasoning and error correction. We would design the architecture and organization of knowledge which combine the semantic knowledge and grammatical rules by putting forward the research of semantics. The syntax is the shell of the language, but the semantics is the key point of language understanding. The syntax studies on the structure of the language. Meanwhile, the semantics is focused on the world. Both of them are independent and interdependent. The aim of the research is to construct an integrative analysis framework of Chinese syntax and semantics via the research of the features and relationships of Chinese syntax and semantics. The framework could solve the problem which the analysis of semantics is separated from the analysis of syntax, and make the result of analysis more exactly. The integrative research of syntax and semantics combines the knowledge base and the computer to change the scattered semantic knowledge, and to merge the syntax, semantics and pragmatic together.
自然语言处理极其重要,而且任重而道远。自然语言处理方法一般分为理性主义和经验主义两大流派,大部分方法尚停留在规则或数学统计浅层学习层次,虽然取得了很大的成绩,但还是远远不够的。本项目的研究目的,就是希望探索一种"深层学习"的方法,把语义知识准确抽象,构建一套语义知识库,借鉴语义学的研究成果来设计知识的结构和组织形式,使得定义的语义知识和语法规则融合在一起,模拟人类联想、推理、纠错的深层学习方法。语法知识是关于语言结构的知识,语义知识则是关于世界的知识。它们各成体系,相互依赖,不可分割。通过对汉语语法和语义的特点及其之间关系的研究,建立语法、语义一体化分析框架,解决现有语言分析中语法、语义分析分离的问题,使分析结果更准确地反应语言描述的内容。把构建的知识库与计算机高速计算耦合起来,改变语义知识零散孤立的状态,把语法、语义和语用三个方面知识融合在一起,最终归结为语法、语义的一体化研究。
在本项目的研究中,我们探索了把语义知识准确抽象,构建一套语义知识体系,借鉴语义学的研究成果来设计知识的结构和组织形式,使得定义的语义知识和语法规则融合在一起,模拟人类联想、推理、纠错的综合学习方法。在语法语义知识表示框架研究方面,我们分析了语言与知识的关系、语法语义知识在语言理解中的功能和抽象形式,定义了人类认识世界的知识单元和关联方式,提出了一种源于语言高于语言的知识表示体系,设计了一种面向自然语言理解编译模型的实体属性框架。在实体属性知识获取研究方面,我们提出了一种基于模板的属性值词自动获取方法,该方法能够从真实语料中自动获取属性的候选属性值词。我们给出了模板的定义,并提出了一种自动生成模板的方法。在模板的基础上,我们提出了一种基于已知属性词约束的属性值词获取方法。它利用模板实例化的方法从语料中提取属性值词。根据模板中属性词与属性值词之间的关系,可以直接组织属性词和属性值词的关系网。在框架知识获取研究方面,我们提出了一种面向实体属性知识库构建的搭配框架获取方法,该方法能够自动获取真实语料中的实体属性搭配,该方法基于句法树的剪枝得到实体属性搭配。在利用上述语法语义知识的语言分析研究方面,我们将自然语言处理技术获取的实体和属性相关知识资源集成到一个统一的分层表示知识框架结构中,利用上述知识库对语料进行分析处理。分析过程体现了人类对语言的理解过程,将语言理解单元映射到影像中,把影像与场景结合起来,再现了语言理解的完整过程,可以很好地应用于语言分析。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
基于组合范畴语法的汉语深层句法分析
基于深度语法的城市建筑三维模型重建
多语言语法制导编辑系统的构造技术
汉语语法加工认知与脑机制——失语症病人障碍探讨