Aspect-based sentiment classification is an importance topic in sentiment analysis, opinion mining and social media analysis. Recently, researchers focus on text features and text classification models. However, the confined semantic information from the text limits the performance of classifier. In practice, the interactive information between users in social media and the knowledge of aspect from knowledge base will provide more semantic information. In this project, we aim to use multi-source representation learning to improve aspect-based sentiment analysis in social media. Firstly, we will utilize syntactic structure and sentiment information by attention mechanism to map the text into low dimensional vector space in order to represent the text based on the context. Then, we will introduce user interactive information into representation learning by heterogeneous network embedding. In the knowledge representation, we plan to use multi-source restricted knowledge representation to learn the representation of aspect and introduce the aspect level knowledge representation into sentiment analysis by attention mechanism. Finally, we will design an End-to-End architecture to map the text, user and aspect knowledge into an unified representation for sentiment analysis in social media. The result of our work will improve the research of sentiment analysis in social media, and it will be also implemented in practical applications such as financial prediction by sentiment analysis.
属性情感分类是社交媒体文本情感分析与挖掘领域的重要研究问题。现有方法主要利用文本内部特征构建分类模型,由于文本包含的语义信息有限,导致分类性能受限。考虑到社交媒体中的用户交互信息以及开放知识库的属性知识可以提供更多语义知识来源,本项目拟开展基于多源语义表示学习的社交媒体文本属性情感分类研究。具体包括:利用文本结构与情感信息进行注意力机制下的表示学习,研究基于上下文语境的文本情感语义表示方法;通过异质网络节点嵌入模拟面向用户、内容和属性,研究融合用户交互信息的文本情感语义表示方法;通过多源约束下的知识表示对属性进行情感推理与消歧,研究融合开放知识库的文本情感语义表示方法;应用端到端的学习机制,实现文本、用户与属性知识的统一语义表示,研究基于多源语义表示的属性情感分类方法。在此基础上,构建面向证券领域的情感分类示范应用。本研究将推动社交媒体文本情感分析的基础研究,也为社交媒体相关应用提供借鉴。
本项目从“文本-用户-属性知识”三个层面出发,建立融合“文本-用户-属性知识”的统一语义表示学习框架,开展基于多源语义表示学习的社交媒体文本属性情感分类研究,主要包括:首先,在文档表示方面,充分考虑视角与上下文之间的关系、上下文中不同词语之间的语义联系、词序信息等,开展了基于上下文语境的文本情感语义表示方法和基于深度学习的视角级文本情感分类两方面研究。其次,在知识表示方面,根据上下文将词汇进行知识、概念层面的抽象,并在语义层面考虑词汇之间的语义联系,设计了融合文本概念化与网络表示的“文本-知识”语义表示。然后,在多源语义融合方面,利用节点在网络中的高阶相似性、节点结构相似性和属性信息,设计融合“文本-节点关系-属性信息”的统一语义表示,并应用于情感属性多标签分类。接着,研究结合表示学习和迁移学习的跨领域情感分类方法,有效缓解了若干领域缺乏情感标注样本的问题。最后,集成上述研究成果设计构建面向证券领域的情感分类原型系统,并应用于产学研项目“大数据驱动的金融智能服务平台”,取得了较好的示范应用效果。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
跨社交网络用户对齐技术综述
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
基于深度表示和迁移学习的社交媒体多模态情感分析
社交媒体中文本情感语义计算理论和方法
面向社交媒体的多语种文本情感分析方法研究
基于深度迁移学习的跨领域文本情感分类方法研究