Nowadays we are facing with high dimensional and huge amount of data. How to process high dimensional data is a big challenge. The distribution of high dimensional data is very complicated. Geometric structural analysis is an important method to analyze high dimensional data, because the geometric structure of data implies the clustering and classification information of data. Aiming at addressing some drawbacks of existing methods, this project utilizes several mathematical tools, e.g., sparse representation, semi-Riemannian geometry, and kernel method, to investigate the mathematical models that can decompose linear or nonlinear multi-submanifolds robustly, and generalize the manifold learning theories and methods based on semi-Riemannian geometry, in order to address the issue of perceptual distance (manifold distance) being smaller than Euclidean distance. To characterize the sparsity in data distribution, this project further explores the operations that can preserve the decomposability and structural sparsity inducibility of norms, as well as the computable high-order sparsity measure, which are the key problems of the current sparse representation theories. Finally, this project studies the corresponding fast algorithms, especially the low complexity randomized algorithms, and their implementations on GPU, so as to overcome the computational difficulties in processing high dimensional data.
当今是高维和海量数据的时代,如何快速有效地处理高维数据是一个巨大挑战。高维数据的分布非常复杂,几何结构分析是分析高维数据的重要方法,因为数据的几何结构蕴涵了数据的聚类和分类信息。本项目针对现有方法的一些不足之处,利用稀疏表示、半黎曼几何、核方法等数学工具,研究鲁棒的线性或非线性多子流形分解的数学模型,并基于半黎曼几何推广流形学习的理论与方法,以解决感知距离(流形上距离)小于欧氏距离的问题。为刻画数据分布的稀疏性,本项目进一步研究保持范数可分解性和促结构稀疏性的运算,以及高阶稀疏性的可计算的度量。这是目前稀疏表示理论的关键问题。本项目还研究相应的快速算法,尤其是低复杂度的随机算法,及其GPU实现,以解决处理高维数据时计算上的困难。
当今是大数据时代,数据往往具有高维特性,因此如何快速有效地处理高维数据是一个巨大挑战。高维数据的分布非常复杂,几何结构分析是分析高维数据的重要方法,因为数据的几何结构蕴涵了数据的聚类和分类信息。.本项目利用稀疏表示、低秩表示等数学工具,研究鲁棒的线性或非线性多子流形分解的数学模型,以及相应的快速算法,尤其是低复杂度的一阶和随机算法,以解决处理高维数据时计算上的困难。.取得的重要结果有:1、理论方面:在子空间聚类模型上取得了系统性的研究成果,并推广到张量聚类模型和非线性的子流形聚类模型,在多个识别与聚类问题上测试错误率可下降一半左右;2、算法方面:提出了线性化交错方向法、广义迭代重加权算法等一系列一阶或随机优化算法,在多个优化问题的求解上均取得了3倍以上的加速;3、应用方面:提出了新的彩色滤波阵列设计理论和更强有力的图像分类方法,夺得2015年ImageNet场景分类竞赛冠军。在重要期刊发表论文33篇(CCF A类15篇,其中IEEE TPAMI 4篇、IEEE TIP 9篇),重要会议发表论文30篇(CCF A类20篇,其中ICCV 3篇、CVPR 9篇、AAAI 5篇),申请或授权国内专利3项。由于本人的出色研究,本人应邀担任CCF A类会议CVPR 2014/2016、ICCV 2015、NIPS 2015的领域主席和AAAI 2016/2017、IJCAI 2016的高级程序委员,CCF A类杂志IEEE TPAMI和IJCV的编委。2016年获得国家自然科学杰出青年基金资助并当选IAPR Fellow。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
监管的非对称性、盈余管理模式选择与证监会执法效率?
主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
针灸治疗胃食管反流病的研究进展
高维相关数据分析的关联结构研究
高维混合非线性结构数据分析及其应用
高维复杂结构数据降维
高维数据分析的分治策略