基于知识图谱的社交媒体大数据主题发现与趋势预测关键问题研究

基本信息
批准号:61772366
项目类别:面上项目
资助金额:63.00
负责人:黄震华
学科分类:
依托单位:华南师范大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:李江峰,向阳,刘春梅,鄂世嘉,袁书寒,吕东东,贾圣宾,赵振岐,荣光辉
关键词:
主题演化主题发现知识图谱大数据社交媒体
结项摘要

Social media big data contains abundant information resources, which enables people more efficiently to discover deep-level topics and forecast their future evolution trend. However, social media big data is usually multi-mode, high degree of fragmentation, strong correlation and high noise. And these characteristics make the existing methods of discovering and forecasting topics have great disadvantages in usability, accuracy, timeliness and self-adaptability. Based on the above facts, we use the research mentality of “theoretical analysis→numerical calculation→application validatation”. Firstly, we automatically construct and optimize the large-scale probability knowledge graph, and use it as the cornerstone of topic discovery and trend forecasting. Secondly, we make full use of the merits of multi-order tensor representation, and propose theories and methods of the integrated tensor representation for social media big data. On the basis of which, the temporal hierarchical feature model is constructed to model multi-granularity features, and then the deep features of social media big data are effectively extracted by means of the deep learning technology. Thereby, using the implied data semantic information and semantic reasoning ability of our constructed knowledge graph, we achieve the discovery of deep-level topics and accurate prediction of their evolution trends. We expect that our research findings will play an important role on the domains of social public security, E-commerce, public health care, and internet deep information services, etc.

社交媒体大数据中蕴含着丰富的信息资源,这使得人们能够更有效地发现深层主题以及预测其未来的发展趋势。然而由于社交媒体大数据所具有的多模态、碎片化程度高、强关联和高噪声等特性,使得现有方法在可用性、准确性、时效性与自适应能力等方面存在较大的不足。为此,本项目拟以“理论分析→数值计算→应用验证”为思路展开研究,首先自动化构建与优化大规模概率知识图谱,并将其作为主题发现与趋势预测的语义基石;其次,充分利用多阶张量表示的优点,提出社交媒体大数据的一体化张量表示理论及方法,在此基础上,构建时序层次特征模型进行多粒度特征建模,并借助深度学习技术有效提取社交媒体大数据的深层特征;从而利用概率知识图谱所隐含的数据语义信息以及强大的语义推理能力来实现深层次主题的发现与发展趋势的精准预测。我们预计,本项目的研究成果将在社会公共安全、电子商务、民众医疗健康和互联网深度信息服务等领域发挥重大作用。

项目摘要

随着日积月累,社交媒体大数据,蕴含着丰富的社会信息,其中包含着大量重要社会事件线索信息的网络映射,而这些网络映射信息通常看似杂乱无章的。深度分析和挖掘社交媒体大数据,快速精准地发现其中所隐含的深层次主题,进而在现有被发现主题的基础上,有效预测社会事件未来发展的态势,是促进国家社会治安稳定和知识经济可持续发展的重要手段。然而我们发现,社交媒体大数据有着许多自身的特点,包括多模态、时效性强、内容简短、碎片化程度高以及关联性强等。这些特点,使得现有方法在深层次主题发现和趋势预测方面面临着一些新的挑战。为了有效解决上述问题和挑战,本项目以“理论分析数值计算应用验证”三个层次展开,首先对大规模知识图谱的构建过程进行深度优化,并将知识图谱作为社交媒体大数据主题发现、演化与趋势预测的语义基石;其次,针对社交媒体大数据的自身特点,充分利用多阶张量表示的优点,提出社交媒体大数据的一体化张量表示理论;在此基础上,构建时序层次特征模型进行多粒度特征建模,并借助深度学习技术有效提取社交媒体大数据的深层特征,从而利用知识图谱所隐含的数据语义信息以及强大的语义推理能力来实现社交媒体大数据深层次主题的发现和发展趋势的精准预测。本项目的研究成果在社会公共安全、民众医疗健康、互联网深度信息服务和电子商务等领域能够发挥积极作用。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

DOI:10.3799/dqkx.2020.083
发表时间:2020

黄震华的其他基金

批准号:61272268
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:60903032
批准年份:2009
资助金额:17.00
项目类别:青年科学基金项目

相似国自然基金

1

面向社交媒体的多粒度主题演化关键问题研究

批准号:61403238
批准年份:2014
负责人:陈千
学科分类:F0605
资助金额:24.00
项目类别:青年科学基金项目
2

社交媒体健康知识发现与个性化诊疗方法研究

批准号:71572013
批准年份:2015
负责人:颜志军
学科分类:G0209
资助金额:47.00
项目类别:面上项目
3

基于知识图谱的社交媒体管理分析关键技术研究

批准号:U1936104
批准年份:2019
负责人:邵蓥侠
学科分类:F0210
资助金额:71.00
项目类别:联合基金项目
4

新闻与社交媒体协同的主题演化摘要研究

批准号:61402191
批准年份:2014
负责人:胡珀
学科分类:F0211
资助金额:26.00
项目类别:青年科学基金项目