Clustering analysis for multi-type relational data is one of the improtant tasks of multi-relational data mining, which is very important for analyzing the topological structures, understanding the functions, recognizing the hidden patterns, and predicting the behaviors of multi-type relational data. It can be widely used in bioinformatics, World Wide Webs, social networks, geographic information system and so on. The current methods of clustering analysis for multi-type relational data have limitions on large scale data, complex and uncertain environment. Recently, with rising of statistical relational learning, a lot of work use statistical relational models to deal with multi-relational learning problem in the complex and uncertain environment, and have achieved good results. Relational markov network is one of representative statistical relational models, which combines markov network and relational schema, and has excellent capabilities of uncertainty processing and expressing complex relationship among data. Relational markov network has been used successfully in link prediction, collaborative classification, information extraction and so on. However, it can not be used for clustering analysis because of its discriminative learning characteristics, and its learning efficiency should be improved further.This project will make some expansion and improvement on relational markov network for the purpose of clustering analysis, and transform it from the discriminate model into the generation model as well as enhancing the expression ability. Then find some methods to improve its learning efficiency through combined with the intelligent optimization technology. Furtherly propose two kinds of relational markov network-based clustering analysis methods for multi-type relational data from the horizontal and vertical two aspects.This project has important theory significance and application value for promoting multi-relational data mining research.
多关系数据的聚类分析作为多关系数据挖掘的重要任务之一,对于分析多关系数据的拓扑结构、理解其功能、发现其隐含模式和预测其行为等具有重要意义,在生物信息学、WWW、社会网、地理信息系统等领域具有广泛应用,但现有方法对大规模数据、复杂关系及不确定环境的处理能力有限。关系Markov网将Markov网与数据库的关系模式相结合,具有出色的多关系表示及不确定性处理能力,成功解决了链接预测、协作分类等任务,但其判别学习的特点妨碍了其在聚类分析中的应用,且其学习效率有待进一步提高。本项目以多关系数据的聚类分析为目的,在发挥关系Markov网优势基础上,对其进行扩展与改进,增强其表达能力,并将其改造成产生式模型;结合智能优化技术研究能提高其学习效率的方法;并进一步从横向、纵向两个角度,提出基于关系Markov网混合模型和基于关系团模板的聚类分析方法。该研究对促进多关系数据挖掘研究具有重要理论意义和应用价值。
多关系数据的聚类分析作为多关系数据挖掘的重要任务之一,对于分析多关系数据的拓扑结构、理解其功能、发现其隐含模式和预测其行为等具有重要意义,在生物信息学、WWW、社会网、地理信息系统等领域具有广泛应用。为了增强现有方法在复杂关系及不确定环境下的处理能力,本项目研究了基于统计关系模型的多关系数据聚类分析方法,并研究了基于随机搜索的参数优化方法,并对这些方法的应用开展研究,取得如下研究结果。(1)在模型及参数优化方面,提出了增量式概论图模型、两阶段粒子群优化算法,及基于混沌鲶鱼效应的改进人工蜂群算法。所提出的概率图模型用贝叶斯网表示数据及其间关系,用马尔科夫地毯选择相关数据,具有随环境变化增量式学、学习时间复杂性低、准确性高的特点;所提出的两阶段粒子群优化算法,在白天、夜晚两阶段交叉迭代进行,其应用到模型的参数优化方面,更容易跳出局部极值,有利于搜索全局最优解;所提出的基于混沌鲶鱼效应的改进人工蜂群算法,采用随机性更高的混沌序列初始化蜂群,并引入了混沌鲶鱼蜂,及其与跌入局部极值的蜂群之间的有效竞争协调机制,从而增进蜂群跳出局部最优解的能力,并应用其对模型参数进行了优化。(2)在多关系数据的聚类分析方面,提出了基于q个加权中心点的模糊关系聚类算法,和基于多个矩阵、多个加权中心点的模糊多关系聚类算法。所提出的基于q个加权中心点的模糊关系聚类算法,在现有基于一个中心点的划分聚类算法基础上,用q个加权中心点来表示类簇,能够更加准确的表示类簇内部的结构信息,具有更好的聚类效果;所提出的基于多个矩阵、多个加权中心点的模糊关系聚类算法,组合了多矩阵数据表示和多个加权对象类簇表示的优点,能够描述类簇内部的丰富信息,学习矩阵相关权重,对多关系数据获取最优模糊划分。(3)在复杂网络社区发现和数据融合两个方面,对研究结果进行了应用。在复杂网络社区发现方面,研究了马尔卡夫动力学方法与网络社区结构的关系,提出了基于链接动力学的复杂网络社区发现方法,以发现网络中的链接社区;研究了基于生成模型发现网络中结点和链接社区的方法,提出了基于链接的社区发现生成模型。在数据融合方面,将增量概率图模型应用到多个传感器数据的融合;将聚类结果与凸函数证据理相结合,完成海量信息的融合。上述研究结果发表学术论文8篇,其中SCI检索3篇。该研究对促进多关系数据挖掘、机器学习研究具有理论意义和应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于MCPF算法的列车组合定位应用研究
智能煤矿建设路线与工程实践
现代优化理论与应用
血管内皮细胞线粒体动力学相关功能与心血管疾病关系的研究进展
WMTL-代数中的蕴涵滤子及其应用
基于多关系数据挖掘的跨媒体推荐关键技术研究
基于多张量的多关系强关联子图发现方法研究
基于迁移学习的异构聚类多关系社会网络划分方法研究
基于概率语义分析的多关系图多类标分类方法研究