面向社交媒体的多粒度主题演化关键问题研究

基本信息
批准号:61403238
项目类别:青年科学基金项目
资助金额:24.00
负责人:陈千
学科分类:
依托单位:山西大学
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:谭红叶,白亮,李艳红,王智强,张鹏,赵传君
关键词:
主题生命周期主题演化事件漂移多粒度主题社交媒体
结项摘要

With the rapid development of web 2.0 technology, social media has sparked a revolution in information technology with unprecedented vitality, and now is penetrating and changing the way people live and work. Identifying potential topics structure and their evolution pattern on time efficiently and accurately in massive information from social media plays an important role in the development of the whole national economy. Compared to traditional media, social media is more dynamic, interactive, massive and noisy, which makes the topics in it characterize multi-grained in space and evolved in time. These put forward new challenges to data mining: the model should handle multi-grained and evolutional data, while the algorithm must process massive, real-time and heterogeneous data. The project will carry out the research of topic pattern mining on social media, including: (1) modeling structures of multi-grained topics; (2) incremental recognition of topics in social media; (3) cycle evolution pattern mining of multi-grained topics; (4) event-based shift evolution pattern mining. The project not only has comprehensive application value in fields of anti-corruption, opinion monitoring, advertising injecting, public security and prediction on users’ interests, but also has important academic value in fields of information retrieval and recommendation, machine learning and social networking.

随着web2.0技术的蓬勃发展,社交媒体以前所未有的生命力引发新的信息技术革命,渗透并改变人们的生活工作方式。从海量社交媒体信息中识别其蕴含的潜在主题结构,并高效准确地挖掘主题在时间上的演化模式对国民经济的发展起着举足轻重的作用。相比较于传统媒体,社交媒体信息具有高度动态性、交互性、海量性、噪声多等特征,使得主题具有空间多粒度特征和时间演化特征,要求模型能处理多粒度和演化数据的同时,算法能处理海量、实时、异构数据,这些对数据挖掘领域提出了新的挑战。本项目面向社交媒体开展主题演化模式挖掘研究,主要内容:1.多粒度主题结构建模;2.社交媒体中主题增量识别算法研究;3.多粒度主题周期演化模式挖掘研究;4.事件漂移演进模式挖掘研究。本项目对反腐倡廉、舆情监测、广告投放、公共安全、用户兴趣预测等多个应用领域具有广泛的应用价值,同时,对信息检索和推荐、机器学习和社会网络等学科领域具有重要学术价值。

项目摘要

相比较于传统媒体,社会媒体能提供关于任何主题或事件实时细粒度的信息,这些主题从个人和公众的两个角度反映了时间上舆情信息演化规律。社会媒体的主题演化分析对于公共安全、广告投放、社区管理具有重大现实意义。从海量社交媒体信息中识别其蕴含的潜在主题结构,并高效准确地挖掘主题在时间上的演化模式是本项目的研究目标。本项目围绕社会媒体特点,对主题识别和演化的模型及算法进行了系统研究,包括:(1)主题结构建模,提出一种多粒度语义层次本体树主题结构模型,有效表达了主题空间时间结构语义;(2)主题识别研究,提出基于背景因子分析的主题检测方法,保证了算法快速收敛;提出基于特征本体的在线主题检测及主题优化方法,保证了语义可解释性;提出两阶段新主题发现框架,极大降低时间复杂度;针对主题语义解释性不足,打破词袋模型中独立性假设;提出一种基于markov决策过程的主题检测技术,较好地解决了语义缺失及检测效率问题;(3)主题演化研究,提出增量的基于特征本体的主题演化算法,应用于用户兴趣建模研究;提出一种结合iHMM的非参贝叶斯模型用于研究科技文献中主题的属性生命周期演化情况。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
3

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

DOI:10.3799/dqkx.2020.083
发表时间:2020

陈千的其他基金

相似国自然基金

1

新闻与社交媒体协同的主题演化摘要研究

批准号:61402191
批准年份:2014
负责人:胡珀
学科分类:F0211
资助金额:26.00
项目类别:青年科学基金项目
2

基于知识图谱的社交媒体大数据主题发现与趋势预测关键问题研究

批准号:61772366
批准年份:2017
负责人:黄震华
学科分类:F0211
资助金额:63.00
项目类别:面上项目
3

基于多主题和网络模型的社交媒体电子医疗用户推荐研究

批准号:71501040
批准年份:2015
负责人:杨东辉
学科分类:G0112
资助金额:17.40
项目类别:青年科学基金项目
4

基于社交媒体用户模型的多粒度虚拟社区建模研究

批准号:61603229
批准年份:2016
负责人:郑建兴
学科分类:F0603
资助金额:20.00
项目类别:青年科学基金项目