微博热点事件的情感趋势分析与预测研究

基本信息
批准号:61402134
项目类别:青年科学基金项目
资助金额:24.00
负责人:徐冰
学科分类:
依托单位:哈尔滨工业大学
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:杨沐昀,梁颖红,张扬,张春越,乔秀明,朱少杰,段超群,马莹莹
关键词:
文本情感分析情感趋势分析社会计算情感预测深度学习
结项摘要

With the rapid development of social networks, short messages, e.g. microblog and tweet, has become the main stream of information release by the Internet users, which provides new channel to analysis and predict the public opinion. Focusing on the Chinese microblog, this project proposes to explore the sentiment trends of hot events. On the basis of various user features and text features, it employs the deep learning method to improve the sentiment analysis of the hot events. Afterwards, it investigates the quantification of sentiment trends and, together with multi-outside-factors related to the event, the public opinion is finally approximated and predicted via an Bayesian approach. This study pushes the current information analysis into the human sentiment level, providing substantial help for understanding the impact of the group sentiment to the politics, life and business decision. Theoretically, it investigate the feasibility of Multivariate statistical analysis of the unstructured social information, esp. via deep learning and Bayesian model.

随着社会网络的快速发展,以微博为代表的文本已经成为互联网信息发布的重要形式,也为民意的分析与预测提供了新的途径。本课题以中文微博为对象,探索针对热点事件的情感趋势分析与预测方法。在综合获取各种用户特征和文本特征的基础上,课题引入深度学习方法进行热点事件的情感分析,进而以多维情感特征为基础对用户情感趋势进行量化,最终通过贝叶斯模型综合多种信息对事件的情感趋势曲线进行拟合,完成预测建模。从应用角度看,该课题是舆情深入分析的关键技术,对于了解经济活动和社会事件中的人群态度、探索社会群体心理规律具有明显的实用价值,支持政治、经济和生活合理决策。从理论上,该课题是对非结构化的社会信息进行多元统计分析和计算的有益尝试,引入深度学习提高情感分析效果,并采用贝叶斯模型提高趋势预测效果。

项目摘要

随着社会网络媒体的快速发展,用户产生的各种评论性主观文本的数量迅猛增长,如何快速、高效地对网络媒体上的情感信息进行识别、分类、抽取、判断,并进一步对用户的转发行为和舆情发展趋势进行准确分析和预测已经成为迫切的社会需求。课题研究主要围绕如下三个方面展开:. 在情感信息分类和情感要素抽取方面,课题组开展了四项研究:基于联合深度学习的热点话题情感分类,基于双向循环神经网络的评价对象抽取研究,基于LSTM-CNN深度学习模型的评价对象情感倾向性研究,基于条件随机域模型的比较要素抽取研究。情感分类技术和情感要素抽取技术已在国内情感分析研究中达到了较高水平,在2015年和2016年中国中文信息学会主办的国内公开、权威的情感分析评测(COAE)中均取得了参与项目第一名,相关技术成果已应用在情感分析系统和对话系统中。. 在热点话题的情感趋势分析和预测方面,课题组分别对长期热点话题和短期热点话题的不同特点进行建模研究。对于短期热点话题开展的研究包括基于指数自回归预测方法、基于GBDT的非线性回归预测方法和基于CNN的预测方法;实验结果表明基于GBDT的方法在预测误差设定在5%以下时准确率可达到80%。对于长期热点话题我们提出了基于子主题分离的预测方法,将长期话题的发展分为爆发期、过渡期、消退期和潜伏期四个阶段,对于不同波峰之间的数据分别进行预测,实验结果表明该方法对于话题热度的分类准确率达到86%,整体趋势预测也取得了较好的结果。. 在微博用户转发行为及情感预测方面,课题组提出了基于主题模型的用户转发行为预测方法。该项研究在用户历史信息和用户行为及情感之间建立关系,分析影响转发行为的因素,并预测用户的转发行为。实验结果表明,本项目提出的方法对转发行为预测结果F1值可达到70%,在转发情感预测方面情感预测正确率为64%。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

黄河流域水资源利用时空演变特征及驱动要素

黄河流域水资源利用时空演变特征及驱动要素

DOI:10.18402/resci.2020.12.01
发表时间:2020
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019

徐冰的其他基金

批准号:51803232
批准年份:2018
资助金额:25.00
项目类别:青年科学基金项目
批准号:40971214
批准年份:2009
资助金额:40.00
项目类别:面上项目
批准号:41271099
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:51579158
批准年份:2015
资助金额:63.00
项目类别:面上项目
批准号:81704133
批准年份:2017
资助金额:20.00
项目类别:青年科学基金项目
批准号:81403112
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:81471435
批准年份:2014
资助金额:73.00
项目类别:面上项目
批准号:11101295
批准年份:2011
资助金额:23.00
项目类别:青年科学基金项目
批准号:81703513
批准年份:2017
资助金额:20.10
项目类别:青年科学基金项目

相似国自然基金

1

微博事件预测与内容建模方法研究

批准号:61379044
批准年份:2013
负责人:徐罡
学科分类:F0203
资助金额:75.00
项目类别:面上项目
2

基于群体智能的微博情感分析研究

批准号:61300222
批准年份:2013
负责人:文坤梅
学科分类:F0207
资助金额:23.00
项目类别:青年科学基金项目
3

基于时空语义的微博突发事件检测与短期预测研究

批准号:71273010
批准年份:2012
负责人:赵洁
学科分类:G0409
资助金额:55.00
项目类别:面上项目
4

基于多语言微博文本的新疆热点事件检测关键技术研究

批准号:61561047
批准年份:2015
负责人:赵晖
学科分类:F0113
资助金额:34.00
项目类别:地区科学基金项目