基于迁移学习的社交网络虚假新闻检测关键技术研究

基本信息

批准号：61906039

项目类别：青年科学基金项目

资助金额：24.00

负责人：方兰婷

学科分类：

依托单位：东南大学

批准年份：2019

结题年份：2022

起止时间：2020-01-01 - 2022-12-31

项目状态：已结题

项目参与者：

关键词：

虚假新闻迁移学习传播模型图神经网络舆情分析

结项摘要

The spread of fake news in social networks would cause serious damage to politic, economy and society. The fake news can be detected by using classification models based on content and propagation structure. One of the significant challenges for fake news detection is the lack of data. For instance, the posts in social networks are usually short texts, which contain limited information. It is impractical to get labeled posts and propagation logs for the newly emerged events. As a result, it is difficult to train an effective model for detecting fake news. To tackle the challenge of data sparsity, we propose a fake news detection model based on transfer learning. Specifically, we learn from the posts and propagation structures for the past fake news and transfer the learned knowledge to detect fake news for new events. In this proposal, we first extract common features that are shared among fake news for different events and event-specific features. Then we investigate the propagation of fake news in social networks and identify the key opinion leaders. We propose a classifier to identify fake news based on their propagation structure. Finally, we propose a mix model based on transfer learning to combine the two previous models. The key challenges in this study include multi-model feature analysis, propagation model analysis, stance classification, graph convolutional neural network based propagation graph classification and transfer learning, etc. Our system can be applied to help improve the network ecosystem.

社交网络中虚假新闻的传播对政治、经济和社会有巨大的潜在危害，通过构建基于新闻内容和传播结构的分类模型可以实现虚假新闻的检测。然而，学习分类模型需要大量的标注数据，社交网络中很多事件对应的新闻，尤其是新出现的新闻，并不能收集到足够多的与事件相关的标注数据。为此，本项目拟研究基于迁移学习的虚假新闻检测方法，从已经大量传播、有较多标注数据的过往虚假新闻上学习虚假新闻的泛化特征，并用于提高针对特定事件的虚假新闻的检测上。研究不同事件对应的虚假新闻在其文本内容和传播结构上与真实新闻的泛化区别，研究具体事件对应的虚假新闻在其文本内容和传播结构上与真实新闻的独特区别，研究基于文本和传播结构的混合虚假新闻检测模型。重点研究所遇到的关键科学问题：多模态特征提取、传播能力计算、立场分析、基于图卷积神经网络的传播图分类和迁移学习算法等。取得一些创新性的研究成果，以期为网络生态环境的健康提供关键技术支撑。

项目摘要

社交网络中虚假信息对政治、经济和社会有巨大的潜在危害，寻求积极有效地方法对虚假信息进行监管治理对于构建生态健康的网络舆论环境、维护社会治安、应对信息战和舆论战至关重要。本项目研究内容主要包括（1）研究互联网中的虚假信息检测。提出了一种无监督的谣言检测模型ptVAE。 ptVAE由三个主要组件组成：用户意见模块，传播特征模块和交叉对齐模块；提出一种基于CharacterBert-CRF模型的诈骗词库构建方法，基于诈骗网站和内容和源码自动生成诈骗词库。（2）研究了词嵌入集成模型，集成多个已有的词向量（例如word2vec, GloVe）或者词向量模型（例如BERT）和知识图谱。（3）研究了基于图数据挖掘的表示学习和异常行为检测方法。提出了一种新的模型AER-AD，AER-AD主要包括表示模块和预测模块两个模块；提出了一种基于随机森林和深度自编码高斯混合模型的无监督入侵检测方法RF-DAGMM。（4）研究了社交网络中的信息传播模型，由于双曲空间对嵌入树或者复杂网络结构的天然优势，区别于传统的欧几里得空间建模方法，本项目研究了双曲空间中信息传播。在本项目资助下，共发表论文7篇，申请专利3项。此外，本项目还有2篇论文在审，2篇文章正在修改。其中，以本项目为第一标注且项目申请人为第一/通讯作者的论文包括：IEEE Transactions on Knowledge and Data Engineering （CCF A类期刊）论文2篇，Proceeding of the VLDB Endowment（CCF A类会议）论文1篇，Remoting Sensing (JCR 1区期刊)论文1篇。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：

发表时间：

DOI：

发表时间：2020

DOI：10.11842/wst.20190724002

发表时间：2020

DOI：

发表时间：2021

方兰婷的其他基金

相似国自然基金

社交网络虚假新闻检测关键技术研究

批准号：U1936105

批准年份：2019

负责人：陈晨

学科分类：F0210

资助金额：70.00

项目类别：联合基金项目

基于认知计算的虚假新闻检测与分析

批准号：71902179

批准年份：2019

负责人：白洁

学科分类：G0209

资助金额：18.00

项目类别：青年科学基金项目

基于机器学习的社交网络垃圾检测技术研究

批准号：61772099

批准年份：2017

负责人：徐光侠

学科分类：F0205

资助金额：61.00

项目类别：面上项目

基于位置的社交网络关键技术研究

批准号：61373024

批准年份：2013

负责人：李国良

学科分类：F0202

资助金额：80.00

项目类别：面上项目

基于迁移学习的社交网络虚假新闻检测关键技术研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

一种基于多层设计空间缩减策略的近似高维优化方法

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于多色集合理论的医院异常工作流处理建模

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移

方兰婷的其他基金

相似国自然基金