Because of the low quality of lexicon knowledge base and the lack of semantic understanding in the current semantic-based opinion mining research, this project proposed a FrameNet-based Chinese affective lexicon ontology construction method and an ontology and deep semantic analysis based opinion mining method. The study includes: 1) building semantic frames for Chinese affective lexical units, expressing semantic relations between the words through Ontology, which has such qualities as highly scientific semantic description ability, fine-grained classification and strong representing ability etc.; 2) through the method of combining TCRF (tree CRFs) statistical model and the rule base, achieving automatic annotation of frame semantic elements and sentimental attributes, so that getting deep understanding of argument structures within sentences; 3) developing an opinion mining system with the affective lexicon ontology and automatic frame elements annotation as key technologies, which could automatically extract topics, opinions, opinions holders, sentimental attributes etc., with high processing accuracy, strong semantics analysis and reasoning ability. The study team has a good foundation of many years of cooperation and has accumulated wealthy study achievements in terms of Chinese FrameNet construction and automatic semantic annotation in common areas, with many available Chinese text analysis tools, so the project has strong viability.
本项目针对目前基于语义的观点挖掘研究中词汇知识库质量不高、系统语义理解能力不足的问题,提出基于FrameNet词典资源的中文评价词汇本体构建方法以及基于本体和深层语义分析的观点挖掘方法。研究内容包括:1)构建中文评价词汇的语义描述框架,通过本体表达词汇之间的语义关联,该词汇本体在框架语义理论和FrameNet的支撑下,具备语义描述科学、语义分类细化、表示能力强等特点。2)通过TCRF(树条件随机场)统计模型和规则库相结合的方法,实现框架语义元素以及情感属性的自动标注,达到对句子内部论元结构的深层理解。3)以评价词汇本体和框架元素自动标注为关键技术,开发一个观点挖掘系统,自动提取文本中的主题、观点、观点持有者、情感属性等,系统将具有较高的处理精度、较强的语义分析及语义推理能力。项目团队在通用领域汉语框架的构建和自动语义标注方面积累了丰富的成果和多项可用的中文文本分析工具,项目可行性较强。
【主要研究内容】本项目针对目前观点挖掘研究中词汇知识库质量不高、语义理解能力不足的问题,提出基于FrameNet的中文评价词汇本体构建方法以及基于本体和深层语义分析的观点挖掘方法。具体包括:设计基于框架的中文评价语义表示模型,构建中文评价语义词典、评价语义标注语料库、评价属性知识库等语义资源;利用语义词典和语义标注语料库进行评价知识抽取,构建评价本体知识库,并通过与外部语义资源的开放和互联,利用知识图谱工具构建中文评价知识图谱;以评价知识本体为数据来源,结合VIKOR多属性法对顾客评价进行测算;实现基于评价知识本体的个性化观点挖掘。【重要结果】基于框架的评价语义表示模型由文本层、概念层和本体层构成,其文本跨度小、语义表示粒度细,并支持概念语义推理。评价词汇知识库以框架为词语分类依据,共构建了73个框架,涉及520个评价词,描述了词语的情感值信息;评价词典对领域内语料的覆盖面达到93.9%。采用基于词典和模式匹配规则的方法,标注了大规模顾客评论文本,构建了中文评价语义标注语料库,含评论短语4.5万余个;经测试,评价语义标注的正确率达到83.9%,召回率达到71.2%。中文评价知识本体具有语义知识共享和开放互联能力,是机器可读、可理解的语义资源。利用评价本体获得了手机商品和酒店服务评价属性和权重,利用VIKOR多属性法有效测量了顾客评价。基于评价本体实现了基于概念的观点挖掘和跨实体、跨属性的综合性观点挖掘,满足用户个性化和智能化检索需求。【科学意义】本研究为情感分析领域的语义资源匮乏问题提供了有效的解决方案;为智能化商品评价信息检索、情感问答和个性化推荐提供了关键资源支持;为顾客满意和顾客价值等相关研究领域提供了新的数据分析方法和有效的计算模型;为文本挖掘进入语义层面和情感领域、实现智能化商业服务做了有益的探索。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
WEB2.0环境下基于本体学习的观点挖掘研究
基于词汇语义网络的中文深层语义分析
中文领域本体学习及半自动构建方法研究
基于回答集语义的观点挖掘方法研究