基于语义理解的面向特定主题的微博舆情监控技术研究

基本信息
批准号:61303190
项目类别:青年科学基金项目
资助金额:23.00
负责人:李莎莎
学科分类:
依托单位:中国人民解放军国防科技大学
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:余杰,文健,汪祥,朱湘,邓镭
关键词:
舆情自然语言处理语义库微博语义理解
结项摘要

Network public opinion monitoring is one of the most concerned problems of governments and researchers. Forthermore, microblog is the most important and difficult application to monitor, since its content grows fast and is not regular or dense. In this project, we are going to research key technology to monitor microblog for subject oriented, to increaing the performance of real-time-ability and accuracy. Firstly, to avoid the the difficulty of applying traditinal method to the nonregular mcroblog data, we will research a method to reduce the noise from microblog data.Secondly,we will research how to build a microblog database related to the interest of users that is suitable for mcroblog data, and propose a formal expression method of mcroblog data. Thirdly,in the face of high traffic of microblog data and the real-time requiement when monitoring public sentiment of microblog, we will propose an effcient method to deal with microblog data. Fouthly, we will build an inter-active monitoring mechnisim to make the microblog database learn itself by exchanging with human and machine. This would continuly increase the accuracy of monitoring when using the monitor systems.

网络舆情监控是当前政府和研究领域最关心的问题之一,而微博又是舆情监控的重点和难点。本项目以目前主流的中文微博为研究对象和平台,针对微博内容产生及传播迅速、非正规化、信息稀疏等特点,对面向特定主题的微博舆情监控的关键技术进行研究,通过对主题和微博文本的充分的语义理解,增强面向特定主题的舆情感知和追踪的实时性和准确性。首先,针对微博数据非正规化导致传统自然语言处理技术难以应用的特点,研究消除微博数据噪音的正规化方法;其次,针对微博数据语言个性化、多样化以及多变性所导致的已有本体库不适用问题,研究适用于微博数据的微博知识库的建立与更新;然后,针对微博文本篇幅短小所造成的信息稀疏问题,提出微博数据的语义化表示方法;接着,针对微博数据所具有的高速数据流特点以及微博舆情监控的实时性要求,研究基于语义搜索的高效流数据处理算法;最后,建立可交互监控机制,通过监控过程中的人机交互,实现监控模型的不断完善。

项目摘要

本项目以目前主流的微博为研究对象和平台,针对微博内容产生及传播迅速、非正规化、信息稀疏等特点,对面向特定主题的微博舆情监控的关键技术进行研究,通过对主题和微博文本的充分的语义理解,增强面向特定主题的舆情感知和追踪的实时性和准确性。课题组严格按照研究计划推进研究工作,圆满完成了课题拟定目标,短文本信息表示、舆情热点追踪等多方面都取得了多个关键技术突破,并在新浪微博、推特等微博平台实际数据上实验验证和分析了算法的可行性和有效性,部分成果得到国内外同行的关注和引用。本课题的主要研究成果包括:基于词向量语义聚类的微博噪音过滤技术、基于实体链接技术的微博知识库构建方法、基于概念的短文本表示方法、基于情感的话题热度预测技术、基于深度置信网络的热点追踪技术以及基于用户信息反馈水军检测方法。课题组共在国内外学术期刊、学术会议上发表论文13篇,其中国际英文期刊1篇,EI检索11篇。培养博士研究生3人、硕士研究生6人。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

基于图卷积网络的归纳式微博谣言检测新方法

基于图卷积网络的归纳式微博谣言检测新方法

DOI:10.3785/j.issn.1008-973x.2022.05.013
发表时间:2022
4

生物炭用量对东北黑土理化性质和溶解有机质特性的影响

生物炭用量对东北黑土理化性质和溶解有机质特性的影响

DOI:10.19336/j.cnki.trtb.2020112601
发表时间:2021
5

极地微藻对极端环境的适应机制研究进展

极地微藻对极端环境的适应机制研究进展

DOI:10.7685/jnau.201807013
发表时间:2019

李莎莎的其他基金

批准号:11301480
批准年份:2013
资助金额:22.00
项目类别:青年科学基金项目
批准号:81000852
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目

相似国自然基金

1

基于主题建模的微博语义理解与热点话题识别研究

批准号:61363058
批准年份:2013
负责人:马慧芳
学科分类:F0607
资助金额:45.00
项目类别:地区科学基金项目
2

面向微博客空间实时舆情监控的观点挖掘关键技术研究

批准号:61100026
批准年份:2011
负责人:冯时
学科分类:F0202
资助金额:23.00
项目类别:青年科学基金项目
3

基于主题发现的图像语义理解与识别

批准号:61165009
批准年份:2011
负责人:李志欣
学科分类:F0604
资助金额:50.00
项目类别:地区科学基金项目
4

面向网络舆情分析的微博社会化短文本分析技术研究

批准号:61370116
批准年份:2013
负责人:杨建武
学科分类:F0214
资助金额:73.00
项目类别:面上项目