Cluster analysis is a key to identifying the internal structure of data, especially to process the complex big data. To deal with the data information with uncertainty, a data-driven three-way decision dynamic clustering theory model will be established and studied in this project, based on the decision risk theory, the rough set theory, and the multi-granularity intelligent problem solving mechanism. Its key research points are: to express the three-way decision clustering model by using interval sets; to propose a three-way decision rough set method for non-precision clustering; to study the evaluation criteria function quantitatively combining with decision-theoretic rough set model, and solve the basic problem to find the right size of clusters automatically in cluster analysis; to study the transformation mechanism between different granular cluster spaces, to propose a multi-granularity three-way decision dynamic clustering model which is flexible between different levels in problem solving; using the information theory and the game theory, to propose an automatic computing method for decision thresholds used in the three-way decision clustering model, and build a data-driven three-way decision ensemble clustering model; the verification tests are performed in the social networks services such as the community discovery. The research results of this project will contribute to build intelligent clustering models and efficient algorithms, to accomplish big data mining of complex network structures, and provide a new theoretical model for identifying internal structure of complex systems.
聚类分析是识别数据内在结构的关键,特别是对于复杂大数据处理尤为重要。本项目拟综合考虑决策风险,结合粗糙集理论,借鉴人类多粒度智能化问题求解机制,建立一种数据驱动的、能够处理不确定性复杂数据信息的、多粒度动态三支决策聚类理论模型与方法。主要研究内容有:构建三支决策聚类的区间集描述模型,提出非精确聚类的粗糙集三支决策聚类方法;结合决策粗糙集定量地研究聚类结果评价标准函数,提出数据驱动的发现合适规模的簇结构方法;建立不同粒度空间的簇转换模型,提出适应不同层次问题求解的多粒度动态三支决策聚类方法;结合信息熵和博弈论提出三支决策聚类模型中决策阈值的自动计算方法,建立数据驱动的三支决策集成聚类模型;并在社区发现等社交网络关键应用中进行验证测试。本项目的研究成果,将有助于建立高效可行的数据驱动的智能聚类模型和算法,实现复杂网络结构的大数据挖掘,为复杂大数据系统的内在结构辨识提供新的理论模型和计算。
聚类分析理论与方法的研究在描述数据、识别数据内在结构、衡量不同数据源间相似性等方面具有极其重要的意义。随着信息技术和不确定性理论的发展,人们对聚类技术的发展提出了新的需求,传统聚类方法的局限性日益显现,并主要体现在:缺乏完善的不确定性聚类分析理论框架及有效评价手段,无法有效应对不确定性数据环境;缺乏动态聚类分析机制,难以有效应对动态数据环境;在大数据环境下,难以有效应对大体量、不完备、高维度、混合属性和多视图等特点的数据。针对以上问题,本项目开展了以下研究:1) 研究了聚类的三支表示方法,提出了基于两个集合描述的三支聚类表示方法。2) 研究了数据驱动的聚类分析方法,基于数据驱动的聚类结果评价函数,提出数据驱动的自动确定聚类类簇数的计算方法。3) 研究了动态三支决策聚类方法,提出了基于树结构的增量三支聚类方法。4) 针对重叠社区发现问题,提出了三支决策的重叠社区发现算法,以及基于三支决策的重叠社区演化检测方法。5) 研究了三支决策集成聚类中模型的描述、一致性函数的构建,建立了三支决策集成聚类模型、渐进三支聚类方法和基于Spark 的选择性聚类集成框架。6) 研究了面向复杂数据及应用的三支聚类方法,分别提出了面向高维、多视图数据、不完备数据、混合属性数据等复杂类型数据的三支决策聚类方法,并针对分级组织机构成员的评价问题提出了三支评价模型。作为会议主席(或共同主席)组织召开1次国际会议,3 次国际研讨会和全国会议3 次。应邀作全国会议特邀报告4 次。发表论文40 篇(已被SCI/EI 收录27 篇),主编国际会议论文集1 本,著作1 部,获得国家发明专利授权4 项。在CRSSC-CWI-CGrC2014、CRSSC-CWI-CGrC-3WD2017和CAC2017分别获得最佳学生论文奖2次和工程师论文大赛三等奖1次。
{{i.achievement_title}}
数据更新时间:2023-05-31
三级硅基填料的构筑及其对牙科复合树脂性能的影响
瞬态波位移场计算方法在相控阵声场模拟中的实验验证
不确定失效阈值影响下考虑设备剩余寿命预测信息的最优替换策略
气力式包衣杂交稻单粒排种器研制
计及焊层疲劳影响的风电变流器IGBT 模块热分析及改进热网络模型
基于粒计算的动态三支决策理论与方法
多属性群决策的多粒度三支建模理论与方法
工业大数据的三支多粒度智能决策模型与方法
三支决策空间理论研究