In the era of big data, feature integration and matching for high-dimensional and heterogeneous data play an important role in the social, economic and national security areas. The high degree of data redundancy brings uncertainty of data processing methods. In-depth analysis of network data and their relationship inference refer to the national strategic requirements..Based on the theoretical foundations of Applied Mathematics and Statistical Computation, and the domain knowledge of human brain’s cognition rules(local, selective, active) and intrinsic characteristics of the processing objects (multi-source, high-dimensional, multi-task), this project studies the latent variable sparse representation and complex networks relationship inference problems for the high-dimensional and heterogeneous data. Heterogeneous image feature extraction and large-scale protein-protein interaction network analysis are two important algorithm validation tasks. In more details, the project studies sparse variable analysis and joint feature selection via local data sampling methods, conduct correlation analysis and transfer learning for multi-source data via higher-order statistics, build new multi-kernel learning models based on multiple metrics and A-optimal experimental design theories, and then solve the corresponding semi-definite programming optimization problems of new constraints..By developing new mathematical theories and numerical optimization algorithms, this project will provide important data characterization and understanding approaches for the complex network data.
随着大数据时代的到来,高维异构数据的特征融合与匹配问题在社会、经济和国家安全等领域中扮演着重要角色。大数据的高度冗余带来了数据处理方法的不确定性,网络数据分析与复杂关系推断涉及到国家的战略需求。.本课题立足应用数学和统计计算方法,从模拟人类大脑的认知规律(局部性,选择性,主动性)和处理对象的固有属性(多源,高维,多任务)出发,以异构图像数据的特征提取和蛋白质分子相互作用网络分析两个具体问题为应用平台,重点研究高维数据的潜变量稀疏表达建模及大规模异构网络关系推断问题。基于局部抽样数据研究稀疏变量分析和关联特征选择,基于高阶统计量分析对多源数据进行相关性分析和迁移学习,基于多重特征和多重度量结构建立满足最优试验设计原理的多核学习模型,并研究带有新约束条件的半定规划计算问题。.本课题通过建立新的数学理论与数值优化算法,对网络环境下的复杂数据提供重要的刻画与分析新途径。
随着大数据时代的到来,高维异构数据的特征融合与匹配问题在社会、经济和国家安全等领域中扮演着重要角色。大数据的高度冗余带来了数据处理方法的不确定性,网络数据分析复杂关系推断涉及到国家的战略需求。本课题立足应用数学和统计计算方法,研究内容围绕一下五部分展开:(1)结构化稀疏表示的多任务学习模型;(2)深度网络构建与异构数据匹配;(3)面向潜变量分析的多重度量学习与图融合算法;(4)面向抽样数据的最优试验设计及自适应投影算法;(5)基于半定规划问题的模型转化与快速计算。.项目取得主要研究成果包括:(1)提出了高维稀疏数据的正则化和稳定重建方法;(2)进行了深度网络构建与异构数据匹配:提出了不变特征提取与多尺度特征融合方法;开发了领域自适应与聚类算法,提出了生物组数据去噪算法。(3)提出了面向潜变量分析采样方法:提出了有限多生成平移不变空间中的随机采样方法和平移不变空间中随机卷积采样与恢复方法。(4)提出了多种面向抽样数据的重构方法:提出了分布式半监督偏度纠正正则化核方法;构建了面向局部结构迁移的学习理论与方法。(5)基于半定规划问题的模型转化与快速计算:建立了多种非线性混沌微分/代数方程;进行了数值逼近算法研究,提出了多种快速的数值逼近方法。.本项目共发表高水平论文69篇,培养了博士研究生11名,以及数十位硕士研究生。.本项目的研究成果为高维异构数据的建模和分析提供了系统的数学理论和数值优化算法,为网络环境下的异构数据分析与特征提取提供了强有力的工具,为结构化稀疏和抽样数据重构奠定了基础,为半定规划的快速建模提供了依据。
{{i.achievement_title}}
数据更新时间:2023-05-31
1例脊肌萎缩症伴脊柱侧凸患儿后路脊柱矫形术的麻醉护理配合
低轨卫星通信信道分配策略
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
面向云工作流安全的任务调度方法
基于细粒度词表示的命名实体识别研究
高维复杂数据的稀疏与低秩建模及推断
高维数据的图模型学习与统计推断
稀疏高维半参数模型的稳健统计推断
高维函数型数据的估计与推断方法研究