非均衡概念漂移网络舆情大数据流挖掘模型、算法与评价机制研究

基本信息
批准号:61672178
项目类别:面上项目
资助金额:64.00
负责人:翟云
学科分类:
依托单位:中国共产党中央委员会党校
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:杨炳儒,米振强,刘密霞,董明发,杨涛,王莹,孙冰,万义飞,刘静
关键词:
智能优化数据挖掘非平衡概念漂移大数据网络
结项摘要

Mining internet public opinion becomes a new research issue in the area of data mining. The previous study is in context of the static and balanced big data streams distribution, consequently the traditional theories and methods have troubled by previously unknown difficulties and challenges when faced with the imbalanced, dynamic and abrupt public opinion big data streams. Because this project is to generalize the conventional public opinion mining technology from the ideal state to the reality state, it will inevitably be extended into the studies line of imbalanced and big data with concept drift. In the scenario of the imbalanced data streams of internet public opinion, we intend to research systematically the technologies of public opinion mining be accompanied by concept drift with main contributions as follows: 1) To innovate the ensemble classifiers model for the imbalanced internet public opinion big streams with concept drift;2) To construct the ensemble method for the multiple base classifiers with time stamp; 3)To propose resampling methods for the base classifiers in the ensemble classifiers model;4)To put forward the transformation model from the imbalanced concept drift big data flow to the appropriate scale; 5)To reveal the coupling mechanism for the concept drift and dynamic theme evolution; 6)To propose evaluation mechanism and validation evaluation methods for the ensemble classifiers model for the imbalanced big data streams with concept drift. The significance of this project can be summarized as follows: The project aims to explore new ways for solving knowledge representation and system construction for processing dynamic and big data streams, with the main thread of "Classifier ensemble (model) - Large data stream reduction and sample (instance) - Dynamic thematic evolution (semantic) - Multi-measure measurement (evaluation)",and reveals the mechanism and laws in mining imbalanced data streams with concept drift, such that is will further enrich the technologies, methods and applications for mining imbalanced big data sets and data streams with concept drift. Furthermore, the study has great theoretical significance and far-reaching practical value for mining imbalanced big data streams with concept drift in the real situation.

网络舆情挖掘日渐成为研究热点。但先前研究基于静态、均衡分布、规模适量情境,面对非均衡分布、突变、主题演化的大数据流,传统理论和方法遇到了一定困难和挑战。本研究旨在将传统挖掘技术从理想态向现实态的泛化更新,故必导致向非均衡概念漂移大数据流路线的拓展延伸。研究主要问题有:1)构建非均衡概念漂移大数据流集成分类器挖掘模型;2)研究基于时间戳的基分类器动态权重集成方法;3)构建非均衡概念漂移大数据流向适度规模数据流的平滑转化算法;4)构建该模型内涵的采样方法;5)研究概念漂移与动态主题演化时序耦合规律;6) 构建挖掘评价机制及验证方法。本项目旨在探索非均衡概念漂移情境下“分类器集成(模型)—大数据流精简及采样(样本)—动态主题演化(语义)—多测度衡量(评价)”具有系统逻辑的知识表征与系统建模新路径,揭示非平衡概念漂移大数据流与动态主题演化的融合挖掘机理,对舆情数据流挖掘具有一定理论意义与实践价值。

项目摘要

本研究突破国内外非均衡网络舆情数据流局限于学习方法和演化机制的传统路线,着眼于提升复杂情境下大数据流学习速度和提升分类精度,另辟蹊径,构建非均衡网络舆情数据流学习算法和分类模型。我们已按照研究计划要求完成研究计划要点,具体包括:(1)研究了非均衡概念漂移大数据流集成分类器挖掘模型;(2)研究基于时间戳的基分类器动态权重集成方法,并针对IoT 环境下社交网络模型作了研究;(3)构建异质信息网络(heterogeneous information networks)中非均衡概念漂移大数据流挖掘模型;(4)基于开放网络信息源的实体挖掘方法研究、岭回归在动态学习权重矩阵中的应用以及智能感知分析三个方面展开技术方法的研究,进一步挖掘动态主题演化时序耦合规律和评价模型。围绕本研究方向,已出版学术著作2部,发表学术论文26篇,其中,SCI/SCIE期刊论文8篇,EI期刊论文2篇,CSSCI及中文核心期刊论文11篇,圆满完成项目预期研究目标。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于铁路客流分配的旅客列车开行方案调整方法

基于铁路客流分配的旅客列车开行方案调整方法

DOI:
发表时间:2021
2

多能耦合三相不平衡主动配电网与输电网交互随机模糊潮流方法

多能耦合三相不平衡主动配电网与输电网交互随机模糊潮流方法

DOI:10.13334/j.0258-8013.pcsee.190276
发表时间:2020
3

一种基于多层设计空间缩减策略的近似高维优化方法

一种基于多层设计空间缩减策略的近似高维优化方法

DOI:10.1051/jnwpu/20213920292
发表时间:2021
4

奥希替尼治疗非小细胞肺癌患者的耐药机制研究进展

奥希替尼治疗非小细胞肺癌患者的耐药机制研究进展

DOI:
发表时间:2020
5

基于综合治理和水文模型的广西县域石漠化小流域区划研究

基于综合治理和水文模型的广西县域石漠化小流域区划研究

DOI:10.14050/j.cnki.1672-9250.2017.02.014
发表时间:2017

翟云的其他基金

相似国自然基金

1

分布式数据流的集成模式挖掘模型和概念漂移检测算法研究

批准号:60873145
批准年份:2008
负责人:毛国君
学科分类:F0607
资助金额:30.00
项目类别:面上项目
2

基于集成学习的分布式XML数据流的挖掘模型与概念漂移挖掘方法研究

批准号:61773415
批准年份:2017
负责人:毛国君
学科分类:F0603
资助金额:64.00
项目类别:面上项目
3

融入概念漂移情境的商业数据流挖掘及可靠性研究

批准号:71071141
批准年份:2010
负责人:琚春华
学科分类:G0112
资助金额:28.00
项目类别:面上项目
4

空间数据流的概念漂移问题研究

批准号:41571394
批准年份:2015
负责人:李宏伟
学科分类:D0114
资助金额:60.00
项目类别:面上项目