Fining spatial prevalent co-location patterns from spatially uncertain data sets is one of the popular spatially uncertain data mining tasks. The uncertain data mining has received a lot of attention and developed many advanced technologies recently, as the data generated from a wide range of data sources is inherently uncertain. However, there are still a number of unique challenges in the uncertain data mining field. To the problems of the precise probabilities about uncertainty are difficult to obtain and the spatially constrained conditions are ubiquitous, this project plans to efficiently mining prevalent co-locations with imprecise probabilities from the spatially uncertain data sets, under considering the spatially constrained conditions and visualization support. In detail, we plan to make the following investigations: firstly, the theories and algorithms of finding spatial prevalent co-locations with imprecise probabilities from spatially uncertain data sets will be studied; Secondly, the descriptions, definitions and system of the spatially constrained conditions are explored in order to finding prevalent co-location patterns better; Thirdly, visualizing mining process and results in finding spatial prevalent co-locations are presented; Finally, the effectiveness and efficiency of the theories, models and algorithms proposed in this project are verified with an extension set of applications using real data sets. By this project, the theories, models and algorithms of the spatially uncertain data mining will be expanded. At the same time, the efficient and effective algorithms and techniques will support for finding prevalent co-locations in the applications better, where the spatially uncertain data sets are with imprecise probabilities and spatially constrained conditions.
空间不确定co-location模式挖掘是空间不确定数据挖掘的一个重要分支。近年来,不确定性数据挖掘普遍受到学术界的关注并取得了瞩目的成果。但是仍然存在诸多期待解决的技术难点和挑战问题。本项目针对不确定性数据的精确概率难以获取以及空间约束条件客观存在的实际情况,系统研究带不精确概率和空间约束条件的不确定co-location模式挖掘及其人机交互模式下的可视化知识发现,具体研究:(1)带不精确概率的不确定co-location模式挖掘的理论、模型和算法;(2)不确定co-location模式挖掘中空间约束的描述与定义、约束条件的分类体系;(3)不确定co-location模式挖掘过程及结果的可视化;(4)采用实际数据集检验及分析研究成果的有效性和可用性。本研究对现有空间不确定性数据挖掘理论、模型和算法是一个重要的发展,同时为带不精确概率和约束的不确定co-location挖掘提供技术支持。
空间并置(co-located)模式的挖掘是空间数据挖掘的一个重要分支,它用于发现空间特征之间的关联关系。目前,虽然对空间co-location模式挖掘的研究和应用取得了一些成果,但是仍然存在诸多期待解决的技术难点和挑战问题。本项目针对空间不确定性数据的精确概率难以获取以及空间约束条件客观存在的实际情况,研究了带不精确概率和约束条件的空间co-location模式挖掘的理论和算法,研究成果丰富了空间数据挖掘的理论和技术,促进了空间co-location模式挖掘的应用。主要成果包括:(1)以概率区间描述不确定性数据的存在概率,提出概率区间下的可能世界模型,以及概率区间下的co-location模式及其挖掘算法,解决精确概率难以获取的实际情况;(2)通过分别统计特征的实例在候选表实例中出现的个数,和不在表实例中出现的个数,合并重复的计算,提出一个优化的计算候选模式的频繁性概率的动态规划算法和一个可伸缩的近似算法;(3)定义top-k概率频繁co-location模式的相关概念,提出计算top-k概率频繁co-location模式的矩阵方法,开发了一个挖掘top-k概率频繁co-location模式的后台数据库原型系统;(4)定义加权co-location模式概念,转换空间实例的存在时间为权重,设计有效的挖掘算法,以解决带时间约束的co-location模式的挖掘问题;(5)给出基于障碍进行空间区域划分的思想,提出障碍导向的co-location模式及其挖掘算法;(6)定义模糊空间数据(模糊特征/模糊属性/模糊实例)上co-location模式挖掘的相关概念,包括模糊参与率、模糊参与度等。提出模糊度阈值范围内模糊特征的co-location模式及其挖掘算法、模糊实例的co-location模式及其挖掘算法、带模糊属性的co-location模式及其挖掘算法。在包括《IEEE Transactions on Knowledge and Data Engineering》(TKDE)、《计算机科学与探索》等国内外重要期刊和包括WAIM、BNCOD、NDBC等重要学术会议上发表学术论文10篇,其中SCI 收录1篇;EI收录6篇次。完成一部学术专著《空间模式挖掘理论与方法》的撰写工作。培养中青年教师4名,培养博士研究生2名,硕士研究生12名。
{{i.achievement_title}}
数据更新时间:2023-05-31
Efficient photocatalytic degradation of organic dyes and reaction mechanism with Ag2CO3/Bi2O2CO3 photocatalyst under visible light irradiation
涡度相关技术及其在陆地生态系统通量研究中的应用
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
领域驱动空间co-location模式挖掘技术研究
基于不精确概率理论的多变量极端洪水估计方法及其应用
不确定数据的空间co-location模式挖掘技术研究
概率约束混合整数规划理论和方法研究