微博事件预测与内容建模方法研究

基本信息
批准号:61379044
项目类别:面上项目
资助金额:75.00
负责人:徐罡
学科分类:
依托单位:中国科学院软件研究所
批准年份:2013
结题年份:2017
起止时间:2014-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:钟华,孙耀,白琳,张建华,王涛,唐建,吴雨龙,付冉
关键词:
情感分析Web数据挖掘事件预测观点挖掘
结项摘要

Microblog has become a research hot-spot in Social Media. Now, it is very popular that People reveal events around them, express their sentiments and hear others' opinions in Microblog, So, the research on Microblog is very emergent to instantly learn bursty events, mine human sentiments and opinions. In the project, we want to reach the aim of instantly learn bursty events, mine human sentiments and opinions from Microblog. Differently with traditional news, Microblog brings us the challenging for the reasons: short and noisy content, diverse and fast changing topics, and large data volume. Resolving the challenging isn't easy. We try to analyze the peculiar characters of Microblog to degrade those difficulties and model Microblog' contents, including topic model, trend prediction model, sentiment model and opinion model. Topic model is attained based on Microblog peculiar characters, in order to get a high effective topic detect approach. Similarly, utilizing the time series to build the trend prediction model is to predict the event future popular trend; utilizing sentiment words and sentiment aspect to build the Microblog sentiment model is to classify the people' sentiment; utilizing the opinion words, syntactic templates and LDA variance to build the opinion model is to capture people's opinions. The project will produce some academic paper, software, patent and so on, which has provide the theoretical and technical foundation for the research and application of Microblog, event prediction, sentiment and opinion mining.

微博已经发展为社会传媒(Social Media)的主要形式,人们在微博上披露事件、发表评论、倾听观点已经成为常态,研究微博对于及时获取社会事件、大众情感、大众观点具有重要意义。本项目以微博为研究对象,从分析微博特征入手,规避微博短小、非正式写作风格、噪音大、主题更多样等不利因素,利用微博特征、统计分析、相似度测量等方法,建立微博主题模型,力求获得高精度微博主题获取算法;利用时间序列构建事件预测模型,实现尽可能早地预测微博事件流行趋势;利用情感词汇、情感方面构建情感模型,分析大众对事件的情感趋向,利用观点动词、句法以及LDA变形构建观点模型,获得大众对事件的主流观点。在本项目执行过程中形成高质量学术论文、可执行软件系统、发明专利及软件著作权,其研究成果为我国进一步开展微博研究、情感观点挖掘、事件预测研究领域提供了重要的理论和技术技术。

项目摘要

微博是为社会传媒(Social Media)的主要形式之一,人们在微博上披露事件、发表评论、倾听观点已经成为常态,研究微博对于及时获取社会事件、大众情感、大众观点具有重要意义。.本项目提出的“微博事件预测与内容建模方法”主要研究微博特征,建立微博主题模型、情感模型和观点模型,由此判定大众情感,进而形成大众主流观点;在内容建模基础上,建立微博事件预测模型,预测事件的流行趋势。其目标是通过微博来预测社会事件的产生以及依据跟随者(微客) 的评论形成大众情感和主流观点,对于开展大众、社会、传媒多方面研究具有积极意义和应用价值。.本项目的核心是构建基于微博的观点获取方法,我们提出“观点动词”的概念,建立了基于观点动词的观点获取方法,形成“观点动词—主题—方面”模型;此外,我们研究了基于LDA的观点挖掘模型,其出发点:认为“一个评论可以认为是观点语句与Topic的混合”。基于这一思想,进一步将Topic与观点动词相对应,对主题进一步细分类,分为目标主题、观点主题等几个方面,并对Latent Dirichlet allocation进行改造,设计了基于LDA的观点挖掘算法。基于观点和主题模型,研究了微博事件时间序列模型,同时针对微博的特性,考虑微博回复等特征,建立了微博事件预测模型。.在本项目的研究成果为进一步开展情感观点挖掘等领域的研究具有积极意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019

徐罡的其他基金

批准号:81001130
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目

相似国自然基金

1

微博热点事件的情感趋势分析与预测研究

批准号:61402134
批准年份:2014
负责人:徐冰
学科分类:F0211
资助金额:24.00
项目类别:青年科学基金项目
2

基于时空语义的微博突发事件检测与短期预测研究

批准号:71273010
批准年份:2012
负责人:赵洁
学科分类:G0409
资助金额:55.00
项目类别:面上项目
3

基于用户言语行为的微博内容挖掘研究

批准号:61272291
批准年份:2012
负责人:李文捷
学科分类:F0211
资助金额:80.00
项目类别:面上项目
4

面向事件时间感知的微博检索研究

批准号:61572494
批准年份:2015
负责人:王斌
学科分类:F0211
资助金额:64.00
项目类别:面上项目