Granular computing is an effective method in the field of intelligent information processing and complex problem solving. Exploring new theories and methods of granular computing for big data has important theoretical significance and application value. Aiming at the three characteristics of big data, i.e., scale, multi-modality and incremental, the project will carry out in-depth and systematic study from the data granulation, multi-granularity pattern discovery and integration, cross-granularity reasoning and application demonstration etc. Specifically, main contents of the project include: (1) Explore the multi-view granulation mechanism of big data, and give the basic strategies of data granulation and corresponding algorithms; (2) Study the knowledge representation, multi-granularity modeling and decision-making mechanisms of multi-modality information; (3) Build the reasoning mechanism of multi-granularity/ cross-granularity using uncertain decision-making flow chart, and propose the corresponding inference algorithms; (4) Based on the astronomical and micro-blog data, develop two typical application demonstrations including solar activity forecast system and micro-blog social recommendation system. Aiming at key scientific issues of data mining with big data, we will build a series of computing models and propose some efficient algorithms. These research results have important theoretical value for large data analysis and mining, and provide technology support for the rapid development of big data industry.
粒计算是智能信息处理领域中大规模复杂问题求解的有效方法,探索大数据分析的粒计算新理论与新方法具有重要的理论意义与应用价值。本项目针对大数据的规模性、多模态性以及增长性三个特点,从数据粒化、多粒度模式发现与融合、多粒度/跨粒度推理与应用示范等方面着手开展深入系统的研究。具体内容包括:(1)探求大数据的多视角粒化机理,给出数据粒化的基本策略和算法;(2)研究多模态信息的知识表示、多粒度建模与决策机制;(3)运用不确定决策流图构建多粒度/跨粒度推理机制,并提出相应的推理算法;(4)分别以天文数据、微博数据为载体,建立太阳活动预报系统和微博社会化推荐系统两个典型应用示范。本项目瞄准大数据挖掘中的关键科学问题,建立一系列计算模型与高效算法,研究成果对大数据的分析挖掘具有重要理论价值,也必将为我国大数据产业的快速发展提供技术支撑。
大数据呈现出的大规模性、多模态性与增长性等特征,使得传统的数据分析理论、方法与技术面临着可计算性、有效性与时效性等严峻挑战。项目围绕大数据环境下多粒度数据挖掘的核心挑战,重点在大数据的特征降维、基于聚类的信息粒化、多粒度知识发现、网络数据分析与挖掘等方面开展了理论研究,并在空间天气预报、基于新闻评论的舆情分析、智慧科技信息服务等领域进行了应用研究。具体地:(1)在大数据的特征降维方面,提出了面向混合数据、动态数据和多模态数据的一系列粗糙特征选择高效算法;拓展了基于多视角协同、子空间聚类、多视角标记等一系列特征降维方法。(2)在基于聚类的信息粒化方面,提出了符号数据、多视图数据和动态数据的高效聚类粒化算法;提出了基于样本稳定性、类簇质量评估以及信息熵理论的聚类集成高效算法。(3)在多粒度知识发现方面,建立了线性时间复杂度的局部粗糙建模方法;设计了大规模数据聚类、分类的多层次结构学习方法;提出了基于度量学习的多模态学习算法。(4)在网络数据分析与挖掘方面,提出了面向冷启动、多源、复杂拓扑信息环境的链接预测方法;提出了基于多粒度用户兴趣建模、社区专家的推荐算法;提出了面向评论、跨语言、非平衡文本的情感倾向分析算法。(5)在应用研究方面,研制了空间太阳活动预报系统、基于多粒度的森林火灾预报系统、面向新闻评论的舆情分析系统、智慧科技信息服务平台、文本情感分析技术资源开放与服务平台。项目研究成果系统地发展了数据建模的粒计算理论与方法体系,为大数据的分析与挖掘提供了技术支撑。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
论大数据环境对情报学发展的影响
硬件木马:关键问题研究进展及新动向
基于细粒度词表示的命名实体识别研究
服务经济时代新动能将由技术和服务共同驱动
面向大数据的粒计算理论与方法
面向高维数据的粒计算理论与方法
面向大数据降维的粒计算理论与鱼群优化方法研究
面向复杂数据的粒计算知识发现方法研究