Data streams have a potentially infinite amount, and appear continuously, and their characteristics are dynamically changing. In the face of data streams, how to represent knowledge reasonably and discover potentially useful information quickly and accurately is an urgent problem to be solved for current granular computing. In the case of limited machine storage capacity, the traditional finite-domain static granular computing methods are difficult to accurately grasp the dynamic hierarchical structure of data streams. Infinite-domain dynamic granular computing can solve the problem effectively. This project constructs an infinite-domain dynamic granular computing model based on data streams, study the uncertainty analysis and knowledge discovery of granular. The main contents include the following aspects. (1) Construct the infinite-domain dynamic granular using generalized neighborhood systems, analyze its topological structure and hierarchical structure, deduce the core granularity space by morphisms, and study their isomorphism between the core granularity space and the original space. (2) Topological entropy and singular value decomposition entropy are proposed as the uncertainty measure of infinite-domain dynamic granular, which reflects the precision of dynamic layering. (3) For the core granularity space of data streams, using sliding window technology, the singular value decomposition entropy is taken as the attribute importance index. Then dimension reduction is performed. And the correlation coefficient of the singular value is used for clustering analyzing. These works will prove the above uncertain measure methods contribute to effectively mine the useful information of data streams. These results can provide more powerful theoretical support for knowledge discovery.
面对数量潜在无限、产生持续不断、特征动态变化的数据流,如何合理表示知识,从中快速、准确发现潜在有用信息,是目前粒计算迫切需要解决的问题。在机器存储能力有限的情况下,传统有限论域静态粒计算方法很难准确把握数据流的动态分层递阶结构,无限论域动态粒计算可以有效解决这一问题。本项目基于数据流特征构造无限论域动态粒计算模型,研究粒的不确定性分析与知识发现。主要内容包括:(1)利用广义邻域系统构造无限论域动态粒,分析拓扑结构和分层递阶结构,基于态射导出核心粒度空间,研究核心空间与原空间的同构;(2)提出拓扑熵、奇异值分解熵作为无限论域动态粒的不确定度量,体现动态分层的精确程度;(3)针对数据流的核心粒度空间,运用滑动窗技术,将奇异值分解熵作为属性重要性指标,进行维度约简。利用奇异值的关联系数进行聚类分析,验证上述不确定度量方法有助于高效挖掘数据流的有用信息。研究成果可为知识发现提供更有力的理论支撑。
当今时代是个数据时代,如何从复杂数据中发现新的模式与知识,挖掘其中有价值的信息是我们需要解决的重要问题。粒计算理论通过模拟人脑认知机制,对数据进行粒化形成抽象概念,是获取海量数据中潜在、有用知识的重要工具。本项目主要基于复杂现实数据,研究粒的不确定性分析与知识发现。主要内容包括:(1)利用广义邻域系统构造了粒空间,以二元关系下构造的邻域系统为例,研究了粒空间中的核心粒度空间,并将Wang,Zhu等人提出的基于一致函数的同态进行了推广,提出用态射解决任意两个近似空间间、两个知识库间及两个信息系统间的信息融合问题,这一数学概念的引入再次夯实了粒计算理论的数学基础。(2)提出了区间值毕达哥拉斯犹豫模糊集的概念,并对它的性质进行了全面的研究。包括其得分函数、犹豫模糊数的排序、各种集成算子等。(3)完成了若干粒计算模型中的不确定性度量准则研究并提出了众多度量方法。例如,提出更符合实际情形的毕达哥拉斯模糊集的模糊熵和模糊交叉熵,并且进一步拓展该模型到区间值毕达哥拉斯犹豫模糊集模型,研究了区间值毕达哥拉斯犹豫模糊熵、相似性度量和相关系数等。除此之外,还完成了区间二型模糊集的混合交叉熵和混合熵,概率q-rung orthopair犹豫模糊集的距离测度、集成算子等。完成了覆盖近似空间下粗糙区间值直觉模糊集的修正粗糙度和模糊熵的研究等。(4)进一步加深了对语言型Z-number理论的不确定性研究,讨论了犹豫区间毕达哥拉斯语言型Z-number的距离测度,多维Z-number数的熵测度等。(5)利用奇异值分解熵构造金融时序和众多影响因素指标间的相关系数,并以此为重要度,对各种影响因素进行属性约简。上述问题的研究不仅在理论上丰富了粒计算理论,同时也促进了粒计算在属性约简、模式识别、多属性群决策等方向上的应用发展。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
内点最大化与冗余点控制的小型无人机遥感图像配准
服务经济时代新动能将由技术和服务共同驱动
卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比
滴状流条件下非饱和交叉裂隙分流机制研究
面向动态复杂数据的粒化模型与知识发现研究
网络动态商业数据流的协同知识发现机制研究
面向复杂数据的粒计算知识发现方法研究
面向动态数据认知的知识发现理论模型与方法