基于波色量子场论的高维数据非监督学习方法

基本信息
批准号:11201017
项目类别:青年科学基金项目
资助金额:22.00
负责人:姜鑫
学科分类:
依托单位:北京航空航天大学
批准年份:2012
结题年份:2015
起止时间:2013-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:郭炳晖,马丽丽,李甍,沈鑫
关键词:
量子场论非监督学习高维数据
结项摘要

Unsupervised learning of high-dimensional data plays an important role in the research and application of dimensionality reduction and data clustering. In many cases, it is a great challenge to characterize the accurate structural properties of the data sets or construct a low-dimensional embedding mapping with the characteristic structure well maintained. The main objective of the proposal is to develop methods of quantum field theory on high-dimensional data manifold, with new applications to data analysis and clustering. The breakthrough point of the project locates at the accurate and global description of the nonlinear data set structure. Concretely, the goals of the project are the following:1) Introduce the quantum transition behavior to describe the similarity of data points, establish a more comprehensive analytical framework to characterize the complex structure of high-dimensional data sets through the analysis of a many-particle system; 2) Unitize Bose quantum field theory methods to seek out the intrinsic characteristics of the data set structure, such as the geodesic distance on the corresponding manifolds, overlapping region of multiple manifolds, cluster structure and so on ; 3) Seek the rigorously solution of the quantum system and give the corresponding efficient algorithms. Develop methods to extract the characteristics of the data set by studying the wave function of many-particles in the Hilbert space. 4) Study the operator form of low-dimensional embedding mapping to propose novel learning methods for high dimensional data mining and clustering analysis. The applicant is experienced in the research of the complex networks and has fruitful achievements in studying the application of quantum bosonic dynamics methods on network analysis. The main goal of the project is to establish a new framework to characterize the structure of high-dimensional data sets and develop novel learning methods, with advances achieved both in theory and applications.

高维数据的非监督学习在降维与聚类方面具有重要的基础研究意义和应用背景。寻求数据集结构特性的准确刻画原理、构造能够高度保持特征结构的低维嵌入映射是当前非监督学习需要面对的一类挑战问题。本项目计划进一步发展我们在复杂系统研究中引入的波色量子场论方法和概念,利用量子哈密顿量来描述数据相似性,对数据流形进行重新演绎,建立能较全面反映高维数据集复杂结构的多粒子系统分析框架;并利用量子场论方法刻画数据集结构的本征特征,如流形上的测地距离、多流形重叠区域等;同时寻求该系统的有效求解,将数据集特征提取转化为Hilbert空间上多粒子波函数的分析问题,并给出低维嵌入映射的算符形式,提出新的高维数据深层次特征挖掘与聚类分析算法。申请人在复杂网络的量子波色动力学刻画方面有着良好的基础,并拥有一系列原创性研究成果。在此基础上,本项目将探索高维数据集新的结构描述框架与学习方法,力图在理论建模与应用方面均取得突破

项目摘要

如何快速有效地挖掘出海量高维数据的内在本征结构和规律性、提取有价值的信息是当前数据统计分析等相关领域研究的核心任务之一。 本项目研究对象是高维数据非监督学习方法,其特色是直接从数据集原始的内在联系与结构出发,发现其内在规律。 研究内容包括发展体现高维数据全局非线性与多流形结构特征的网络嵌入方法,建立数据集结构的(量子)系统描述框架,并提出数据特征属性的动力学函数刻画新方法。项目在执行过程中主要研究了两方面的问题,一是高维数据的空间随机网络嵌入与优化问题,研究了大数据集中非均匀数据相关性分布的统计规律以及流形网络构建和聚类分析。二是对数据集结构的物理系统描述与分析做了初步探索,研究了基于数据集结构的动力学行为(类量子行为与非线性动力学行为)。主要研究成果有:1、给出了高维数据的网络化方法并建立了数据模块性分析的一般性原理。2、给出了数据网络模块性差异的刻画机制及基于反应扩散过程的统计度量,并得到了高维数据全局非线性关系刻画,如利用扩散过程(量子随机游走)的平均首达时分布来刻画数据集中模块的效能指标,提出了Global module first passage time(GMMFPT)指标。3、利用多重网络模型研究了相关性数据集的层次结构。 通过对数据集中各数据点的相关性统计分析建立了两个或多个相关数据集的层次结构分析方法。相关成果发表在Physical Review E, EPL (Europhysics Letters),Journal of Statistical Mechanics: Theory and Experiment等国际知名期刊。项目当前共发表SCI论文11篇,EI论文2篇,目前还有四篇文章在审。项目负责人2013年获教育部自然科学一等奖(排名第四),2014年参加 National Conference on Quantification of Uncertainty in Engineering, Science & Technology (QUEST2014)并被邀请做分会场报告。在国际学术交流方面,项目负责人2013年获德国DAAD青年科学家奖资助并赴海德堡大学国际交叉学科交流中心访问,2015年获国家留学基金委资助赴美国西北大学应用数学系访问。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
3

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015
4

低轨卫星通信信道分配策略

低轨卫星通信信道分配策略

DOI:10.12068/j.issn.1005-3026.2019.06.009
发表时间:2019
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

姜鑫的其他基金

相似国自然基金

1

面向高维数据的稀疏非参核学习方法研究

批准号:61403394
批准年份:2014
负责人:刘兵
学科分类:F0603
资助金额:24.00
项目类别:青年科学基金项目
2

基于熵准则的非监督特征学习方法研究

批准号:61802036
批准年份:2018
负责人:周楠
学科分类:F0211
资助金额:26.00
项目类别:青年科学基金项目
3

高维缺失数据半监督支持向量机研究

批准号:12126333
批准年份:2021
负责人:祝志川
学科分类:A04
资助金额:10.00
项目类别:数学天元基金项目
4

高维缺失数据半监督支持向量机研究

批准号:12126362
批准年份:2021
负责人:唐年胜
学科分类:A04
资助金额:20.00
项目类别:数学天元基金项目