Target extraction and polarity recognition is an important research task in sentiment analysis. However, for the target extraction task, the existing research work neglects the hierarchy and completeness of the target, which brings many difficulties for the accurate sentiment analysis applications. And for the polarity recognition task, the existing research just focuses on the obvious comments that have obvious polarity features and neglects the unobvious comments, which leads to the polarity loss for some targets. To solve these problems, the task of hierarchical structure analysis of target is proposed, in which the hierarchical structure can be described by three layers: product brand, attribute and sub-attribute. This task aims to mine the complete relationships inside the target. Besides, the comments of the target can be classified into two parts: obvious comments and unobvious comments according to the polarity features, the novel algorithms are studied for them separately. The main contents are: the unsupervised method for target hierarchical structure analysis; obvious comment oriented sentence compression based method for appraisal collocation extraction; the unobvious comment oriented graph model based method for polarity recognition. The project aims to do deep research on related tasks and mine the sentiment information from the product reviews more accurately and deeply. It can provide more technical supports for sentiment analysis applications, such as sentiment summarization and e-commerce.
评价对象的抽取与极性识别研究是面向产品评论的情感倾向性分析领域的重要研究任务。然而对于评价对象的抽取任务,现有研究忽视了评价对象的层次性和完整性,为精准的情感倾向性分析应用带来了很大的困扰;对于评价对象的极性识别任务,现有研究仅关注含有评价词语等明显极性特征的显式评价,忽略了极性特征不明显的隐式评价,造成部分评价对象的极性丢失。基于此,本项目提出评价对象层次结构分析的研究任务,表现为产品品牌、属性和子属性三个层次组成的层次结构,挖掘评价对象内部完整的层次关系。同时,将评价对象对应的评价文本分为显式评价和隐式评价,分别进行极性算法研究。具体内容有:评价对象层次结构的无指导识别算法;面向显式评价的基于句子压缩的评价搭配抽取算法;面向隐式评价的基于图的篇章内外特征相融合的极性识别算法。本项目旨在深入研究相关算法,更精确、有深度且全面的挖掘评论中的情感信息,为情感文摘、电子商务等应用提供技术支持。
评价对象的抽取与极性识别研究是面向产品评论的情感倾向性分析领域的重要研究任务。然而对于评价对象的抽取任务,现有研究忽视了评价对象的层次性和完整性,为精准的情感倾向性分析应用带来了很大的困扰;对于评价对象的极性识别任务,现有研究仅关注含有评价词语等明显极性特征的显式评价,忽略了极性特征不明显的隐式评价,造成部分评价对象的极性丢失。基于此,本项目提出评价对象层次结构分析的研究任务,表现为产品品牌、属性和子属性三个层次组成的层次结构,挖掘评价对象内部完整的层次关系。同时,将评价对象对应的评价文本分为显式评价和隐式评价,分别进行极性算法研究。为了解决上述的研究任务,本项目提出了一整套面向评价对象的情感倾向性分析框架,重点对多项关键技术进行攻关,并提出了新颖实用的算法。具体如:分别对评价对象层次结构分析的两个步骤基于深度学习的思想提出新颖的算法来解决评价对象不完整的问题;基于句子压缩的评价搭配抽取将解决由于句法分析结果不准确而带来的干扰问题;基于图的篇章内外特征相融合的算法避免了含有隐式评价的评价句内部极性特征不充分的情况,更全面的对评价对象进行极性识别。同时,受本项目的资助,我们取得了一系列的研究成果:构建细粒度情感分析语料一套,并为国际评测SemEval2016年的情感分析评测提供了中文语料;发表学术论文21篇,其中SCI 6篇,EI 10篇,顶级/重要国际会议7篇(CCF A/B类);申请专利1项。在情感倾向性分析领域参与培养博士生 2 名,硕士研究生 5 名。该项目的研究可以将无结构化的评论文本转化为结构化的情感信息数据库,这些成果会进一步推动情感倾向性分析的基础研究工作,并为文本情感倾向性分析的应用如情感文摘及电子商务等提供关键技术支撑。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
基于引用极性和评论挖掘的论文综合评价模型研究
面向产品评论的隐式情感建模理论与方法研究
面向中文网络评论的产品特征挖掘方法研究
层次式面向对象并行应用框架技术的研究