基于多源语义表示学习的社交媒体文本属性情感分类研究

基本信息
批准号:61772135
项目类别:面上项目
资助金额:16.00
负责人:廖祥文
学科分类:
依托单位:福州大学
批准年份:2017
结题年份:2018
起止时间:2018-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:黄锦辉,吴运兵,冯沛璋,林嘉雯,杨定达,谢媛媛,刘德元,张凌鹰,吴晓静
关键词:
社交媒体文本挖掘情感分析观点挖掘自然语言处理情感分类
结项摘要

Aspect-based sentiment classification is an importance topic in sentiment analysis, opinion mining and social media analysis. Recently, researchers focus on text features and text classification models. However, the confined semantic information from the text limits the performance of classifier. In practice, the interactive information between users in social media and the knowledge of aspect from knowledge base will provide more semantic information. In this project, we aim to use multi-source representation learning to improve aspect-based sentiment analysis in social media. Firstly, we will utilize syntactic structure and sentiment information by attention mechanism to map the text into low dimensional vector space in order to represent the text based on the context. Then, we will introduce user interactive information into representation learning by heterogeneous network embedding. In the knowledge representation, we plan to use multi-source restricted knowledge representation to learn the representation of aspect and introduce the aspect level knowledge representation into sentiment analysis by attention mechanism. Finally, we will design an End-to-End architecture to map the text, user and aspect knowledge into an unified representation for sentiment analysis in social media. The result of our work will improve the research of sentiment analysis in social media, and it will be also implemented in practical applications such as financial prediction by sentiment analysis.

属性情感分类是社交媒体文本情感分析与挖掘领域的重要研究问题。现有方法主要利用文本内部特征构建分类模型,由于文本包含的语义信息有限,导致分类性能受限。考虑到社交媒体中的用户交互信息以及开放知识库的属性知识可以提供更多语义知识来源,本项目拟开展基于多源语义表示学习的社交媒体文本属性情感分类研究。具体包括:利用文本结构与情感信息进行注意力机制下的表示学习,研究基于上下文语境的文本情感语义表示方法;通过异质网络节点嵌入模拟面向用户、内容和属性,研究融合用户交互信息的文本情感语义表示方法;通过多源约束下的知识表示对属性进行情感推理与消歧,研究融合开放知识库的文本情感语义表示方法;应用端到端的学习机制,实现文本、用户与属性知识的统一语义表示,研究基于多源语义表示的属性情感分类方法。在此基础上,构建面向证券领域的情感分类示范应用。本研究将推动社交媒体文本情感分析的基础研究,也为社交媒体相关应用提供借鉴。

项目摘要

本项目从“文本-用户-属性知识”三个层面出发,建立融合“文本-用户-属性知识”的统一语义表示学习框架,开展基于多源语义表示学习的社交媒体文本属性情感分类研究,主要包括:首先,在文档表示方面,充分考虑视角与上下文之间的关系、上下文中不同词语之间的语义联系、词序信息等,开展了基于上下文语境的文本情感语义表示方法和基于深度学习的视角级文本情感分类两方面研究。其次,在知识表示方面,根据上下文将词汇进行知识、概念层面的抽象,并在语义层面考虑词汇之间的语义联系,设计了融合文本概念化与网络表示的“文本-知识”语义表示。然后,在多源语义融合方面,利用节点在网络中的高阶相似性、节点结构相似性和属性信息,设计融合“文本-节点关系-属性信息”的统一语义表示,并应用于情感属性多标签分类。接着,研究结合表示学习和迁移学习的跨领域情感分类方法,有效缓解了若干领域缺乏情感标注样本的问题。最后,集成上述研究成果设计构建面向证券领域的情感分类原型系统,并应用于产学研项目“大数据驱动的金融智能服务平台”,取得了较好的示范应用效果。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020

廖祥文的其他基金

相似国自然基金

1

基于深度表示和迁移学习的社交媒体多模态情感分析

批准号:61763007
批准年份:2017
负责人:蔡国永
学科分类:F0603
资助金额:41.00
项目类别:地区科学基金项目
2

社交媒体中文本情感语义计算理论和方法

批准号:61632011
批准年份:2016
负责人:秦兵
学科分类:F0211
资助金额:265.00
项目类别:重点项目
3

面向社交媒体的多语种文本情感分析方法研究

批准号:61806038
批准年份:2018
负责人:徐琳宏
学科分类:F0606
资助金额:25.00
项目类别:青年科学基金项目
4

基于深度迁移学习的跨领域文本情感分类方法研究

批准号:61906110
批准年份:2019
负责人:赵传君
学科分类:F0606
资助金额:24.00
项目类别:青年科学基金项目