Dimension Reduction plays an important role in addressing "curse of dimensionaity" issue, speeding up the computational efficiency of algorithms, enhancing the interpretation to data as well as data visualization. The conventional dimension reduction methods pay less attention to the relationship betwwen high-dimensioal data and response variables. Therefore, the performance of predicting unseen repsonse variables based on such a reduction may not be optimal. To predict the unseen response variables given a high-dimensional dataset, one general and reasonable way is to reduce the dimension of data under the condition that response variables are smoothly changed. That is to say, to investigate real-valued multivariate dimension reduction. In this project, we will consider the pros and cons of current researches in real-valued multivariate dimension reduction, and investigate the following five directions: 1) topological preserved real-valued multivariate dimension reduction; 2) nonlinear embedding-based real-valued multivariate dimension reduction; 3) real-valued multivariate dimension reduction-based data space partitioning; 4) temporal real-valued multivariate dimension reduction; 5) probablistic graph model-based real-valued multivariate dimension reduction. We will select one or more directions in biometric authentic and intelligent transportation systems as the potential applications of the project.
维数约简在处理维数灾问题、帮助加速算法的计算效率和提高可解释性以及数据可视化起着至关重要的作用。常见的维数约简方法较少考虑响应变量与高维数据集间的联系,因而获得的约简空间在预测未知响应变量时性能不是最优的。要基于高维数据集预测未知响应变量,更一般和合理的办法是在约简的同时考虑响应变量是光滑变化的情况,即研究响应变量属于实值多变量域(real-valued multivariate domain)时的维数约简。本项目将针对现有实值多变量维数约简研究的不足,研究以下五个方向:1)保持拓扑结构的实值多变量维数约简方法研究;2)基于非线性嵌入的实值多变量维数约简方法研究;3)基于实值多变量维数约简的数据空间划分;4)时序数据的实值多变量维数约简方法研究;5)基于概率图模型的实值多变量维数约简研究。本项目也将基于以上的研究成果选择生物认证和智能交通领域的一至两个方向展开应用性基础研究。
本任务书针对实值多变量维数约简展开了研究,其对于分析回归意义下的高维数据有重要意义。我们在项目中着重研究以下五个方向:1)、保持拓扑结构的实值多变量维数约简方法研究;2)、基于非线性嵌入的实值多变量维数约简方法研究;3)、基于实值多变量维数约简的数据空间划分;4)、时序数据的实值多变量维数约简方法研究;5)、基于概率图模型的实值多变量维数约简研究。本项目也将基于以上的研究成果选择生物认证和智能交通领域的一至两个方向展开应用性基础研究。 .针对以上研究内容,截至目前,我们提出1)基于代数拓扑结构的主单纯复形;2)基于实值多变量维数约简的数据空间划分;3)针对时序人群计数的半监督维数约简算法;4)基于概率结构的人脸动力图算法; 5)基于随机森林技术的风速预测算法;6)随机分布特征的有效学习表示;7)基于深度网络的美学推断。我们共发表论文14篇,其中IEEE Tranasctions论文5篇, CCF二区会议论文一篇。专利受理3项,授权1项。获得上海市自然科学奖三等奖1个,上海市研究学位论文(硕士论文)一篇。.总体来说,本项目得到了圆满的完成。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
涡度相关技术及其在陆地生态系统通量研究中的应用
粗颗粒土的静止土压力系数非线性分析与计算方法
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
基于气血理论从PINK1/Parkin通路探讨“益气活血”法调控线粒体自噬在心肌能量代谢重构中的作用
基于图优化模型的多视角数据维数约简技术研究
文本自动分类中维数约简方法研究
面向多媒体排序学习的维数约简
面向高维信息的非线性维数约简问题研究