基于情感知识库构建、领域适应和终身学习的社交媒体情感分析方法

基本信息
批准号:61672288
项目类别:面上项目
资助金额:62.00
负责人:夏睿
学科分类:
依托单位:南京理工大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:章成志,许凤,李翔,周清清,郑士梁,王乐义,何声欢,李银波
关键词:
情感分析文本挖掘自然语言处理社交媒体分析机器学习
结项摘要

Social media sentiment analysis has been a research frontier and hotspot in the field of natural language processing and text mining. It is also an important application that needs to be further solved in the social network and big data society. Although the traditional sentiment analysis techniques have been widely concerned and in-depth studied, the characters of social media texts, such as “feature-sparse”, “topic-dynamic” and “data-massive”, have brought new challenges in sentiment analysis. In order to solve these problems, in this project, we propose a new social media sentiment analysis framework, from the perspective of sentiment lexicon construction, text representation, data sampling and lifelong learning. We first propose an automatic social media sentiment lexicon construction method via a combination of statistic information and linguistic knowledge. On this basis, we propose a social media text representation method via synonym expansion and antonym replacement, a social media data importance sampling method via instance weight regularization, and a social media lifelong machine learning algorithm via incremental stacking learning, respectively. The final goal of this project is to set up a domain adapted, large scale suitable, and continuously learned social media sentiment analysis system.

社交媒体情感分析是自然语言处理和文本挖掘领域的前沿问题和研究热点,也是社交网络和大数据时代情感分析技术面向应用辄需解决的重要问题。尽管传统的情感分析已经得到广泛关注和深入研究,然而社交媒体文本的“特征稀疏、话题动态、数据海量”等特点,给情感分析研究带来了新的挑战。本项目针对上述问题,从情感知识库构建、文本表示、数据采样和终身学习的角度,提出一种社交媒体文本情感分析统计机器学习模型新框架。首先提出融合统计信息和语言知识的社交媒体领域情感知识库自动构建方法,在此基础上,提出基于同义扩展和反义置换的文本表示特征迁移方法、基于权重抑制正则化的领域适应权重采样算法和基于堆栈式增量学习的海量动态数据终身学习模型,最终建立一个高效鲁棒的、领域自适应的、适合大规模数据场景的、不断学习和更新的社交媒体情感分析系统。

项目摘要

社交媒体情感分析是自然语言处理和文本挖掘领域的前沿问题和研究热点,也是社交网络和大数据时代情感分析技术面向应用辄需解决的重要问题。本项目针对社交媒体文本“特征稀疏、话题动态、数据海量”等特点,主要开展了以下四个方面的研究工作:1.社交媒体文本情感分析文本表示与情感分类模型研究;2.社交媒体文本情感分析数据采样与领域适应问题研究;3.社交媒体文本领域情感知识库构建与情感分析终身学习模型研究;4.社交媒体文本情绪分析与原因抽取问题研究。项目执行期间,项目负责人以第一或通讯作者发表高水平论文18篇,其中在自然语言处理和人工智能领域的顶级会议ACL、EMNLP、AAAI、IJCAI、COLING发表论文11篇,由清华大学出版社出版学术专著1部,申请国家发明专利11项,获得授权1项。获得自然语言处理领域顶级会议ACL2019杰出论文奖。面向国家网络信息内容安全需求,项目组研制了一套针对网络突发事件的应急演练系统,并在江苏省网信办获得成功应用。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020

夏睿的其他基金

批准号:81601546
批准年份:2016
资助金额:17.00
项目类别:青年科学基金项目
批准号:61305090
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目

相似国自然基金

1

基于层次化情感本体和深度学习的社交媒体视觉内容情感分析

批准号:61702462
批准年份:2017
负责人:李祖贺
学科分类:F06
资助金额:20.00
项目类别:青年科学基金项目
2

基于深度表示和迁移学习的社交媒体多模态情感分析

批准号:61763007
批准年份:2017
负责人:蔡国永
学科分类:F0603
资助金额:41.00
项目类别:地区科学基金项目
3

基于在线评论情感分析的社交媒体用户推荐

批准号:71601119
批准年份:2016
负责人:尹裴
学科分类:G0112
资助金额:17.00
项目类别:青年科学基金项目
4

面向社交媒体的多语种文本情感分析方法研究

批准号:61806038
批准年份:2018
负责人:徐琳宏
学科分类:F0606
资助金额:25.00
项目类别:青年科学基金项目