Syntactic structures are unities of semantic contents and syntactic forms. The syntactic structures are not only needed to be analyzed for forms, but also needed to be analyzed for various semantics. The semantic analysis for syntactic structures is more profound and more comprehensive; the possible that give scientific and rational explanations for various phenomena of syntactic forms is more likely. Existing Chinese syntax and semantics analysis methods and existing semantic role labeling system are not suitable for the features of Chinese, and they do not effectively characterize the essential features of Chinese, thus bring about that the performances of syntactic parsing and semantic role labeling of Chinese are far below the performances of English. In Chinese, valence structures can well characterize syntactic structures and semantic constitution relationships of Chinese sentences, so this project will explore the semantic role labeling fusing valence information and the methods of semantic relation analysis based on the studying of related theories of valence grammar, and established a joint syntactic and semantic parsing model: the labeling and parsing of semantic information are carried on during the process of syntactic parsing; and simultaneously the labeled semantic information is integrated in the probability calculations of rules. The problem of data sparseness is another important factor that severely affects the system performances of syntactic parsing, this project will also explore the word clustering models and algorithms based on semantic relations to solve the data sparseness problem of statistical models, and to significantly enhance the system performances of syntactic parsing.
句法结构是语义内容和句法形式的统一体。对句法结构不仅要做形式分析,而且还要做种种语义分析,对句法结构的语义分析越深刻、越全面,就越有可能对句法形式上的各种现象给以科学合理的解释。现有的汉语句法语义分析方法和语义角色标注体系不适合汉语的特点,没有有效刻画出汉语的本质特性,导致目前汉语句法分析和语义角色标注性能与英语相比相差较大。在汉语中,配价结构可以较好地刻画汉语句子的句法结构和语义构成关系,因此本项目将在考察和研究配价语法相关理论基础上,探索融合配价信息的语义角色标注和语义关系分析方法,并在此基础上建立句法分析与语义角色标注联合学习模型:在句法分析的过程中,进行语义信息标注及分析;同时将标注的语义信息融入产生式的概率计算。数据稀疏问题是另一个严重影响句法分析系统性能的重要因素, 本项目将探索基于语义关系的词聚类模型和算法,解决统计模型数据稀疏问题, 较大幅度地提高句法分析系统性能。
句法结构是语义内容和句法形式的统一体。对句法结构不仅要做形式分析,例如句型分析、句法关系分析以及句法层次分析等,而且还要做种种语义分析。对句法结构的语义分析越深刻、越全面,就越有可能科学合理地解释句法形式上的各种现象。本项目重点探索融合语义信息的句法分析统计模型,建立句法分析与语义角色标注联合学习模型,针对汉语的特点以及汉语句法分析的难点,面向理论和实际应用,提出了一些新的句法语义理论、计算模型和方法:. 1.基于词类的语言统计模型是解决数据稀疏问题的主要方法之一。本项目提出了基于词相似度的词聚类算法。实验结果表明,该词聚类算法执行效率高、聚类效果较好: 常规贪婪聚类方法如布朗词聚类算法的困惑度为278,而基于词相似度的词聚类算法和基于语义相似度的词聚类算法的困惑度分别为213,209.3. 根据该词聚类模型的结果所构造的基于词类和基于词语的线性插值模型,对缓解统计语言模型中的数据稀疏问题起到了比较好的作用。. 2.汉语配价结构可以较好地刻画汉语句子的句法结构和语义构成关系,因此,我们在考察配价语法的基础上适当修改了语义角色标注体系并将谓词本身的配价信息融入语义角色标注。实验结果表明, 配价信息的使用能够较大幅度提高动名词性谓词的语义角色标注性能:基于正确句法树和正确谓词识别, 动词性谓词的SRL性能F1值达到93.69%;名词性谓词的SRL性能F1值达到79.23% ;均优于目前国内外的同类系统。. 3.本项目建立了一种基于语义类的句法分析与语义角色标注联合学习模型:在句法分析的过程中,进行语义信息标注及分析;同时将标注的语义信息融入产生式的概率计算。句法分析实验结果表明,基于语义类的并融合配价信息的句法分析与语义角色标注联合学习模型,其精确率和召回率分别为88.73%和88.26%,综合指标F值比著名的中心词驱动句法分析模型提高了8.39个百分点。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
玉米叶向值的全基因组关联分析
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
融合语义信息与社会化信息的图像美感增强模型研究
基于多模态信息深度语义融合的个性化音乐推荐模型研究
基于配价结构和话题结构的汉语句法分析和语义计算模型研究
基于生态大数据的信息物理融合系统语义模型分析关键技术研究