Aiming at current situation of classical data analysis cannot the requirements including satisfying computability, validity and efficiency in the context of big data, exploring new theories and methods of granular computing for big data has important theoretical significance and application value. Aiming at the three characteristics of big data, i.e., scale, multi-modality and incremental, the project will carry out in-depth and systematic study from the data granulation, multi-granularity pattern discovery and integration, cross-granularity reasoning and application demonstration etc. Specifically, main contents of the project include: (1) Explore the multi-view granulation mechanism of big data, and give the basic strategies of data granulation and corresponding algorithms; (2) Study the knowledge representation, multi-granularity modeling and decision-making mechanisms of multi-modality information; (3) Build the reasoning mechanism of multi-granularity/ cross-granularity using uncertain decision-making flow chart, and propose the corresponding inference algorithms; (4) Based on the astronomical and social media data, develop two typical application demonstrations including solar activity forecast system and public monitoring and warning system. These research results have important theoretical value for large data analysis and mining, and provide basic theory and applicable techniques for data analysis in the context of big data.
针对传统数据分析技术无法满足大数据可计算性、有效性以及时效性等要求的现状,探索大数据分析的粒计算新理论与新方法具有重要的理论意义与应用价值。本项目针对大数据的规模性、多模态性以及增长性三个特点,从数据粒化、多粒度模式发现与融合、多粒度/跨粒度推理与应用示范等方面着手开展深入系统的研究。具体内容包括:(1)探求大数据的多视角粒化机理,给出数据粒化的基本策略与算法;(2)研究多模态信息的知识表示、多粒度建模与决策机制;(3)运用不确定决策流图构建多粒度/跨粒度推理机制,并提出相应的推理算法;(4)以社会媒体数据、天文数据为载体,构建一套公共安全监控与预警系统,实现对公共安全事件发现、跟踪、分析与预警等,构建基于概念本体粒化和不确定流图的太阳活动预报模型。并搭建面向公共安全的大数据分析预警、空间天气预报两个仿真系统进行验证,为应对大数据挑战下的军民数据分析需求提供基础理论与技术手段。
大数据呈现出的大规模性、多模态性与增长性等特征,使得传统的数据分析理论、方法与技术面临着可计算性、有效性与时效性等严峻挑战。项目围绕大数据环境下多粒度数据挖掘的核心挑战,重点在大规模数据的特征降维、信息粒化与粒计算模型、多粒度数据分析与挖掘、网络大数据挖掘等方面开展了理论研究,并在空间天气预报与基于新闻评论的舆情分析等领域进行了应用研究。具体地:(1)在高效特征降维方面,提出了符号数据、混合数据、动态数据和多模态数据的特征降维方法;发展了基于多核模糊粗糙集、子空间聚类、递归正则化和区分矩阵的特征降维方法。(2)在信息粒化与粒计算模型方面,提出了符号数据、集值数据、函数数据和动态数据的高效聚类算法;发展了基于样本稳定性度量、类簇质量评估、划分有效性评价的聚类集成算法;建立了局部粗糙建模方法。(3)在多粒度数据分析与挖掘方面,提出了多核、多视角、多标记的高效分类学习算法;发展了基于信息熵、标签信任度的聚类集成高效算法。(4)在网络大数据挖掘方面,提出了面向拓扑与多源信息环境的链路预测方法和基于社区专家的推荐算法,提出了面向评论、跨语言、非平衡文本的情感倾向分析算法。(5)在应用研究方面,研制了空间太阳活动预报系统、灾害性天气预报系统、面向新闻评论的舆情分析系统和文本情感分析技术资源开放与服务平台。项目研究成果丰富了粒计算的基础理论体系,为大数据的分析与挖掘提供了技术支撑。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
论大数据环境对情报学发展的影响
硬件木马:关键问题研究进展及新动向
基于细粒度词表示的命名实体识别研究
服务经济时代新动能将由技术和服务共同驱动
面向大数据的粒计算理论与方法
面向高维数据的粒计算理论与方法
面向大数据降维的粒计算理论与鱼群优化方法研究
面向复杂数据的粒计算知识发现方法研究