高维多表示数据(多态或多视图数据及其经变换所得表示数据的总称)广泛存在于多媒体处理、多语种文本识别、无线传感网络等领域,对其降维分析是模式识别的重要任务之一,因降维是提高识别系统预测或泛化性能的重要一环。然而此类数据所含的诸如配对、监督和结构等信息给降维带来了挑战,如何综合利用则是实现有效降维的关键。现有相关工作仅关注此类数据的单一配对或单一监督信息,忽视了对这些信息的综合利用,从而导致性能和应用受限。本课题旨在已有工作基础上,发展出一个能综合利用各信息的一般性多表示数据降维框架并设计出一系列有效降维算法,以克服现有不足。整个工作围绕建模、算法设计和实现、理论分析和实验对比等方面系统展开。此外,鉴于监督信息稀少所导致的现有分类策略的低效,拟拓展研究分类器设计新策略。本项目的研究不仅推广了现有单纯的半配对和单纯的半监督降维方法,而且这也是首次对半监督半配对多表示数据开展的研究。
背景:高维多视图数据的降维是机器学习的主要任务之一,是提高学习泛化性的重要手段。现实多视图数据中存在的多种形式的不完全配对信息给分析带来了挑战,针对这些挑战,本项目开展了如下研究。.内容:以降维为研究主导,拓展研究多视图分类学习,并辅之以其基础的单视图学习研究,侧重围绕多(和单)视图数据在给定各种不充分信息情形下的1)降维;2)分类和3)单视图分析等展开。内容涉及建模、算法设计和实现、相关的理论分析和实验对比等研究,并取得如下主要成果:.1)多视图数据降维方面,针对多视图数据中仅有部分或没有任何监督信息或仅有部分配对信息可用前提下,建立了一个统一的半监督半配对广义相关分析框架(S2GCA),由此将现有一系列相关分析,如CCA、半配对CCA (SemiCCA和Semi-LRCCA)、半监督CCA和判别CCA(DCCA)等纳入其中。它的一般性使其能灵活用于多态数据分析。已获18次他引,包括11次SCI他引。受该框架启发,进一步提出了1.1)一个无监督半配对的邻域相关分析框架,1.2)一个仅有部分跨域辅助约束信息的协同多视图度量学习方法,1.3)一个适合处理有序多视图判别信息的相关分析方法,1.4)一个多视图矩阵高斯图模型的联合稀疏学习法和1.5)一个适合高低分辨率图像判别的单一相关分析框架,避免了同类两步建模法的次优性。.2)多视图数据分类学习方面,提出了一系列多视图分类学习法,如,一个基于响应曲面技术的正则化多视图机,一个利用多经验核的随机投影集成学习机,一个基于多态脑图像疾病诊断的半监督相关支持向量回归机和一个多态多任务特征分析机等。.3)单视图数据分析方面,提出了一系列以Laplace图为基础的降维框架和算法,如,一个自适应图构建与降维的联合分析框架和首个Universum判别分析法.同时提出了若干分类学习算法,如,一个结合数据粒度三重结构的分类学习机,一个结合类编码正交性的多分类学习机,一个具有安全意识的半监督可靠学习法和一个基于不定核的判别性驱动的正则化学习框架,等等。诸单视图学习方法可结合多视图数据的可用信息而发展出对应的多视图学习方法。.上述成果(26篇SCIE+5篇核心期刊论文)已有113次他引,包括SCI64次,培养毕业硕/博士生8人。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
面向高维数据集成降维的半监督聚类方法研究
高维缺失数据半监督支持向量机研究
高维缺失数据半监督支持向量机研究
基于成对约束的自适应半监督降维方法研究