Modern society has entered the era of big data. One of the problems with the current widespread concern is how to mine knowledge from big data efficiently and real-time in order to improve people's decision-making ability. Granular computing is a new computing paradigm in information processing. It has been successfully applied to the field of knowledge discovery, etc. Aiming at big data presented in huge size, multi-source, heterogeneous, dynamic and uncertain characteristics, the project studies the key mining techniques of multi-source, heterogeneous and dynamic data, where granular computing theory is as the basis, typical rough set models are as objects, incremental learning is as the means and cloud computing framework is as the platform. The main contents of the project include: 1) Research on mining methods of homogeneous dynamic data under the variation of multidimensional granularities; 2) Exploration on multi-level granulation analysis and knowledge discovery techniques of heterogeneous dynamic data; 3) Study on collaborative incremental computing model and learning methods of multi-source heterogeneous dynamic data; 4) Investigation of efficient algorithms and optimization strategies based on the parallel framework of cloud computing. Solutions to these problems can not only provide a basis to build an approximate calculation method of across data sources in the big data environment and form the new multi-level integration theoretical framework for multi-source heterogeneous dynamic data, but also play an important role in promoting improvement of the ability to handle big data and implementation of efficient conversion from big data to knowledge.
现代社会已经迈入大数据时代,当前人们普遍关注的问题之一是如何从大数据中进行高效实时地挖掘知识,以提高人们的决策能力。粒计算是信息处理中一种新的计算范式,已成功应用到知识发现等领域。本项目针对大数据呈现的体量巨大、多源异构、动态性和不确定性等特点,以粒计算理论为基础,以典型粗糙集模型为对象,以增量学习技术为手段,以云计算并行框架为平台,来研究大数据中多源异构动态数据挖掘关键技术,具体内容包括:1)多维粒度变化下同构动态数据挖掘方法研究;2)异构动态数据的多层次粒化分析与知识发现技术研究;3)多源异构动态数据协同增量计算模型与学习方法研究;4)基于云计算并行框架的高效算法设计与优化策略研究。这些问题的解决不仅可为大数据环境下构建跨数据源的近似计算方法提供依据,以形成面向多源异构动态数据的多层次融合新型计算理论体系,而且对于提高处理大数据的能力,实现从大数据到知识的高效转化具有重要的促进作用。
如何从具有海量、动态、多源、异构和不确定性等显著特征的大数据中高效实时地获取有价值的知识是当前人工智能领域中一个热点研究问题。本项目以粒计算理论为基础,以典型粗糙集模型为对象,以增量学习技术为手段,以云计算并行框架为支撑平台,研究大数据环境中多源异构动态数据挖掘关键技术,主要取得了以下成果:1)针对同构动态数据,提出了多维粒度变化下基于粗糙集及其典型扩展模型中的动态知识发现理论和方法,设计出增量式更新近似集、特征选择和高效同构动态数据挖掘算法;2)针对异构动态数据,给出了多层次粒化分析方法,提出了高效的融合方法,建立了面向异构动态数据的高效知识发现理论和方法,设计了基于粒计算的异构动态数据挖掘高效算法;3)基于多源异构动态数据的特性,建立了面向多源异构动态数据的多层次粒化模型,提出了多源异构动态数据高效融合的方法,构建了多源异构动态数据协同增量计算模型,并设计出面向多源异构动态数据的高效挖掘算法;4)基于云计算并行框架,构建了面向多源动态数据协同增量计算模型及其高效的并行挖掘算法。本项目共出版著作2部,在国内外重要期刊和会议发表论文50篇(SCI检索33篇,EI检索9篇),获得国际会议优秀论文奖1次和全国会议优秀学生论文奖2次,获得发明专利2项,申请发明专利5项,培养多名研究生。这些成果为大数据分析与挖掘的研究提供了学术思想与技术路线。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
多源数据驱动CNN-GRU模型的公交客流量分类预测
瞬态波位移场计算方法在相控阵声场模拟中的实验验证
混采地震数据高效高精度分离处理方法研究进展
多源数据挖掘的关键技术研究
基于语义网的微生物多源异构数据整合关键技术研究
基于多源异构数据的知识图谱补全及验证关键技术研究
基于多源软件数据挖掘的修改分析与预测关键技术研究