Fine-grained opinion mining aims to extract opinions in one sentence, parsing their structures and obtaining the fine-grained elements such as sentiment polarities, holders, targets and etc. These information can facilitate user decisions, thus fined-grained opinion mining can offer useful information for a number of applications. Commonly-used methods first decompose the task into several sub-tasks, and then exploit classification and sequence-labeling models to solve them, which are incapable of using global features and also suffer the local optimization problem for each task. Instead, this project attempts to apply shift-reduce algorithms for find-grained opinion mining. The shift-reduce models can facilitate the using of global features, and can also jointly model all the sub-tasks in a single model, thus can alleviate the problems in past methods. The project aims to study the shift-reduce fined-grained opinion mining by three aspects: (1) modeling methods, (2) feature representation and (3) data. The final goal is to build a state-of-the-art fined-grained opinion mining system that satisfies the practical requirements of applications, and also to make contributions for shift-reduce algorithms.
细粒度意见挖掘的目的是抽取句子中的意见或者观点,并分析出其详细的意见要素信息,例如情感极性,意见持有者和意见对象等等。这些信息能够极大的方便用户决策,因此细粒度的意见挖掘对很多实际应用都有着非常重要的价值。过去的方法一般将这一任务进行分解得到若干子任务,然后采用分类或者序列标注的方法来分别进行处理,这类方法面临的主要问题是局部特征局部优化问题。本项目拟将基于移进归约的算法应用在这一任务上,不仅可以使得全局特征能够被充分的使用,而且能够将它所包含的所有子任务进行联合的分析,这样便缓解了过去方法所面临的主要问题。本项目拟从建模、特征和数据三个角度来对基于移进归约的细粒度意见挖掘算法进行展开研究,最终目的是实现一个能满足实际应用需求的高性能的意见挖掘系统,并且在移进归约算法层面上也有一定的贡献。
细粒度意见挖掘是指对给定的一个用户意见句,自动抽取句子中的意见或者观点,并分析详细的意见要素信息,例如情感极性,意见持有者和意见对象等。这一任务能够辅助相关管理者与决策层对互联网用户生成内容进行监督、管理和控制,从而进一步能促进包括舆情自动监控、产品优化建议以及广告精准投放等上层应用,具有重要的研究价值。细粒度意见挖掘包括一系列具体子任务,本项目采用移进归约的算法实现对细粒度意见挖掘端到端的处理,采用一个单一模型对所有子任务进行联合的分析与建模,避免了传统串联模型中的局部优化和错误传播问题。项目执行期间,我们基本按照项目申请书中的研究计划开展工作,并根据实际需要额外完成了一些辅助性的相关研究。首先,我们设计并实现了一个性能高度优化、基于移进归约、端到端的细粒度意见挖掘模型;其次,我们提出一些深度学习特征建模的方法,包括句法语义结构特征的编码方式,并将它们成功应用在端到端的细粒度意见挖掘模型中,取得了较好的效果;最后,我们利用了众包数据以及双语数据来进一步改善移进归约细粒度意见挖掘模型的性能。由于在具体的研究过程中,不少研究成果是首先在一些其它相对简单和成熟的任务上尝试成功的,然后再迁移到细粒度意见挖掘上来,因此也产出了不少额外研究成果,包括移进归约模型的进一步得到拓展,深度学习系统框架的优化,噪音数据的优化使用以及结构化特征的高效建模等。目前,我们基本完成了项目申请书中提出的各项工作目标,其中有代表性的工作包括:发表16篇论文,其中CCF A类论文2篇,CCF B类论文8篇;人工标注细粒度意见挖掘数据1万句(三类意见要素以上);实现基于移进归约的细粒度意见挖掘系统。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
搭配驱动意见挖掘研究
基于情感分析的产品评论意见挖掘研究
网络意见挖掘若干前沿问题研究
大规模数据挖掘中嵌入式数据归约的稀疏模型与算法研究