高维混合型数据聚类及应用研究

基本信息
批准号:61170130
项目类别:面上项目
资助金额:56.00
负责人:孙浩军
学科分类:
依托单位:汕头大学
批准年份:2011
结题年份:2015
起止时间:2012-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:王声瑞,孙梅,姜大志,陈钦梧,张凯东,闫美娟,胡春丽
关键词:
信息融合聚类分析混合型数据遗传算法
结项摘要

高维混合型数据聚类问题的研究是近年来数据挖掘研究中提出的新问题,因数据的复杂性使得在全空间上聚类效果不理想。本项目瞄准这一焦点问题,通过研究多种类型数据的信息融合,建立基于遗传算法构建高维混合型数据的子空间聚类模型,开发适用于海量高维数据聚类分析的有效方法,以及在银行客户信用评价中的应用研究。主要研究方向:(1)用模糊逻辑研究多种类型数据的信息融合,解决目前信息融合中的信息丢失问题;(2)探索用遗传算法建立高维混合数据聚类子空间搜索模型,研究适应于子空间聚类评估的适应度,为评估子空间聚类效果提供依据,建立基于蚁群算法的主动进化变异机制,使收敛速度提高,而又不会陷入局部极小;(3)开展在银行客户信用评估聚类中的应用研究。

项目摘要

高维混合型数据聚类问题的研究是近年来数据挖掘研究中提出的新问题,因数据的复杂性使得在全空间上聚类效果不理想。本项目瞄准这一焦点问题,通过研究多种类型数据的信息融合,建立基于信息熵理论构建高维混合型数据的子空间聚类模型,开发适用于海量高维数据聚类分析的有效方法,以及在医学数据预测评价中的应用研究。主要研究成果(1)用信息熵理论研究多种类型数据的信息融合,提出了两种混合数据间相似度的度量方法,在一定程度上解决目前信息融合中的信息丢失问题;(2)探索用全信息熵理论建立高维数据聚类子空间搜索模型,特别在分类型数据聚类问题,研究适应于子空间聚类子空间合并和子簇类合并机制,在理论上探讨了高维数据子空间簇类的结构,首次提出了基于类簇的基本子空间和核心子空间的概念,其结果与实际数据相匹配;(3)开展了在医学数据挖掘的研究,通过对医院重症病人是实时血压值进行聚类分析,以及基于高斯回归模型和理查德分量分解模型进行趋势分析,在一定时间段内对病人发生急性低血压情况进行预测,达到良好的的效果;(4)电子商务中的协同过滤算法在一定程度上提高了推荐效果,我们通过对用户-项目评分矩阵进行基于支持度的项目聚类的方法,减少最近邻居集的搜索空间,提高了推荐效果。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
3

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
4

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
5

混采地震数据高效高精度分离处理方法研究进展

混采地震数据高效高精度分离处理方法研究进展

DOI:10.3969/j.issn.1000-1441.2020.05.004
发表时间:2020

孙浩军的其他基金

相似国自然基金

1

高维稀疏数据聚类研究

批准号:70771007
批准年份:2007
负责人:武森
学科分类:G01
资助金额:16.00
项目类别:面上项目
2

基于约束的高维数据聚类

批准号:61272374
批准年份:2012
负责人:张宪超
学科分类:F0607
资助金额:80.00
项目类别:面上项目
3

聚类导向的字典学习及基于稀疏表示的高维数据聚类研究

批准号:71271027
批准年份:2012
负责人:武森
学科分类:G0112
资助金额:54.00
项目类别:面上项目
4

高维时间过程型数据的聚类及变量选择分析

批准号:11301064
批准年份:2013
负责人:黄伟
学科分类:A0403
资助金额:22.00
项目类别:青年科学基金项目