Network public opinion monitoring is one of the most concerned problems of governments and researchers. Forthermore, microblog is the most important and difficult application to monitor, since its content grows fast and is not regular or dense. In this project, we are going to research key technology to monitor microblog for subject oriented, to increaing the performance of real-time-ability and accuracy. Firstly, to avoid the the difficulty of applying traditinal method to the nonregular mcroblog data, we will research a method to reduce the noise from microblog data.Secondly,we will research how to build a microblog database related to the interest of users that is suitable for mcroblog data, and propose a formal expression method of mcroblog data. Thirdly,in the face of high traffic of microblog data and the real-time requiement when monitoring public sentiment of microblog, we will propose an effcient method to deal with microblog data. Fouthly, we will build an inter-active monitoring mechnisim to make the microblog database learn itself by exchanging with human and machine. This would continuly increase the accuracy of monitoring when using the monitor systems.
网络舆情监控是当前政府和研究领域最关心的问题之一,而微博又是舆情监控的重点和难点。本项目以目前主流的中文微博为研究对象和平台,针对微博内容产生及传播迅速、非正规化、信息稀疏等特点,对面向特定主题的微博舆情监控的关键技术进行研究,通过对主题和微博文本的充分的语义理解,增强面向特定主题的舆情感知和追踪的实时性和准确性。首先,针对微博数据非正规化导致传统自然语言处理技术难以应用的特点,研究消除微博数据噪音的正规化方法;其次,针对微博数据语言个性化、多样化以及多变性所导致的已有本体库不适用问题,研究适用于微博数据的微博知识库的建立与更新;然后,针对微博文本篇幅短小所造成的信息稀疏问题,提出微博数据的语义化表示方法;接着,针对微博数据所具有的高速数据流特点以及微博舆情监控的实时性要求,研究基于语义搜索的高效流数据处理算法;最后,建立可交互监控机制,通过监控过程中的人机交互,实现监控模型的不断完善。
本项目以目前主流的微博为研究对象和平台,针对微博内容产生及传播迅速、非正规化、信息稀疏等特点,对面向特定主题的微博舆情监控的关键技术进行研究,通过对主题和微博文本的充分的语义理解,增强面向特定主题的舆情感知和追踪的实时性和准确性。课题组严格按照研究计划推进研究工作,圆满完成了课题拟定目标,短文本信息表示、舆情热点追踪等多方面都取得了多个关键技术突破,并在新浪微博、推特等微博平台实际数据上实验验证和分析了算法的可行性和有效性,部分成果得到国内外同行的关注和引用。本课题的主要研究成果包括:基于词向量语义聚类的微博噪音过滤技术、基于实体链接技术的微博知识库构建方法、基于概念的短文本表示方法、基于情感的话题热度预测技术、基于深度置信网络的热点追踪技术以及基于用户信息反馈水军检测方法。课题组共在国内外学术期刊、学术会议上发表论文13篇,其中国际英文期刊1篇,EI检索11篇。培养博士研究生3人、硕士研究生6人。
{{i.achievement_title}}
数据更新时间:2023-05-31
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于图卷积网络的归纳式微博谣言检测新方法
生物炭用量对东北黑土理化性质和溶解有机质特性的影响
极地微藻对极端环境的适应机制研究进展
基于主题建模的微博语义理解与热点话题识别研究
面向微博客空间实时舆情监控的观点挖掘关键技术研究
基于主题发现的图像语义理解与识别
面向网络舆情分析的微博社会化短文本分析技术研究