Noun compound, the most concise structure which is prolific, simple and ambiguous, often appears in both Chinese and English. There is semantic compression in the complex meaning construction of noun compounds.A predicate is often implied by the Chinese noun compound, and the aim of noun compound interpretation is to recover this implying predicate to reveal the semantic relations between the two nouns. Our research will not only serve the needs of natural language processing systems for information retrieval and answering system, but also provide semantic interpretation for the study of cognitive mechanisms of concepts combination in psycholinguistics. The main innovation in this research is the use of dynamic strategy in which we explore the acquisition method of implying predicate, and establish the logical models for the semantic combination patterns. We also analyze the noun compounds in searching words, and conduct preliminary applications of semantic computing in the search engine.
名名组合是最简洁的结构表达式,在英语和汉语中产量极高,具有衍生能力强、组成方式简单但是歧义性高的特点。名名组合内部隐含着复杂的意义构建过程,存在语义压缩,常常隐含了谓词。对名名组合进行释义的主要目的是发现两个名词之间隐含的谓词,进而揭示这两个名词之间的语义关系。其研究成果不但能够服务于信息检索、问答系统等自然语言处理系统的需求,而且可以为研究心理语言学关于概念组合的认知机制,提供语义解释的依据。本课题的重要创新是采用动态策略,用基于动词的方法研究汉语名名组合的语义解释,探索名名组合隐含谓词的获取方法,并对其语义组合模式进行逻辑建模,建立在计算机上操作的理解模型。本课题将分析结果应用于网络搜索词中的名名组合,实现语义计算在搜索引擎中的初步应用。
本课题围绕汉语名名组合的语义关系,分别采用基于语义分类的静态策略和基于隐含谓词的动态策略,对汉语名名组合的自动释义进行了深入的研究。首先,结合语义透明度概念,我们提出了一个共有11类的名名组合语义分类标准,该分类标准基本可以覆盖所有名名组合。其次,基于生成词库理论(Generative lexicon),我们对各类名名组合的语义关系进行逻辑建模。第三,我们发现用基于隐含谓词的方法对汉语名名组合进行语义解释,对高频的名名组合是有效的,但是对于低频、新出现的名名组合,就不容易获取到隐含谓词,对于该问题,我们采用词语相似度计算的方法,基于上述语义分类标准,对低频、新颖名名组合的语义关系进行分类。第四,在隐含谓词的获取方面,我们利用Chinese Word Sketch获取在指定语法关系下(Subject和Object)具有搭配意义的动词,并用模版生成释义短语,用搜索引擎进行过滤和排序,该方法不仅可以为名名组合提供多种可能的语义解释,而且能够反应相似的名名组合之间细微的语义差别。基于上述工作,项目组成员在国内外期刊会议上共发表论文16篇,其中SCI论文2篇,EI期刊论文4篇,EI会议论文1篇,CSCD论文2篇,CSSCI论文1篇,出版专著1部。所提出的汉语名名组合语义分类标准及标注语料已提供给北京语言大学、南京师范大学等相关研究单位使用。
{{i.achievement_title}}
数据更新时间:2023-05-31
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
多源数据驱动CNN-GRU模型的公交客流量分类预测
采用深度学习的铣刀磨损状态预测模型
长链烯酮的组合特征及其对盐度和母源种属指示意义的研究进展
现代汉语形-名和名-名的语义组合模型研究
汉语动名超常搭配处理方法研究
面向网页检索应用的汉语语义概念图表示方法研究
面向汉英机器翻译的汉语隐喻逻辑释义方法研究