Semi-supervised gradient learning is a new approach growing up recently in the field of statistical learning theory, whose aim is to finish the learning task by using as few as possible expensive labeled gradient data samples and as many as possible cheaper unlabeled gradient samples.This projector devotes to investigate the semi-supervised gradient data modeling for spherical big data. The applications consist of three parts. The first part focuses on the design of the model framework associating with the second order elliptic boundary value problem such as the Dirichlet boundary value, the Neumann boundary value and the Poisson boundary value. The Lax-Milgram lemma and the Hilbert-Schmidt theorem are used to study the eigenvalue distributions and the orthogonality of the eigenvalue series. Thus give the Mercer theorem,the construction of the reproducing kernel Hilbert space and the model design. The second part focuses on the convergence analysis for the designed model established in the first part. The sample error is bounded with the convex approach, the approximation error is bounded with the help of spherical harmonics approximation theory. The third part focuses on the Galerkin algorithm design for the designed model defined in the first part as well. The Galerkin algorithm in solving differential equations will be improved and the Galerkin algorithms for solving the designed model will be provided. . The project is a joint research of spherical harmonics approximation, machine learning and convex analysis, whose completion will lead to the problem of approximation by translations on the unit ball and, provide a typical example for the research of finite element modeling of big data on manifolds.
半监督梯度学习是近几年兴起的机器学习研究的新方法,其思想是尽可能少的利用带标号的珍贵梯度样本,尽可能多的借助无标号便宜梯度样本而实现对于数据的拟合。项目拟借助核正则化半监督梯度学习理论研究球面大数据建模问题。分三个部分完成。第一部分为基于球面二阶椭圆型边值(如Dirichlet边值、Neumann边值、Robin边值)问题的半监督梯度学习模型算法设计问题的研究。 第二部分为算法的收敛性分析的研究。借助凸分析方法给出样本误差,借助球面函数逼近给出逼近误差估计。第三部分为对模型求解的迭代算法的研究。改进现有求解微分方程的Galerkin方法,给出核正则化半监督梯度学习的Galerkin算法。项目为球面构造逼近、机器学习、凸分析的交叉性研究。项目的研究将引发单位球上平移网络逼近问题的研究方向,也将为进一步研究流形上大数据建模的有限元法提供典型范例。
半监督梯度学习的基本思想是尽可能少的利用带标号的珍贵梯度样本,尽可能多的借助无标号便宜梯度样本而实现对于数据的拟合。项目借助核正则化半监督梯度学习方法研究球面大数据建模问题,对基于强凸损失、一致凸损失、Robust损失及基于Sobolev空间中再生核Hilbert空间(RKHS)、再生核Banach空间(RKBS)、函数再生核Hilbert空间(FRKHS)为假设空间的核正则化梯度成批学习以及在线学习算法的收敛性进行系统的研究,形成了核正则化半监督梯度学习算法应用于大数据建模的一种框架,给出了应用不同区域(单位球面、区间、单位球体)的卷积结构构造再生核Banach空间、函数再生核Hilbet空间的一般方法,特别,给出了借助Radon变换构造Radon型函数再生核Hilbert空间(RRKHS)的方法,形成集函数逼近论、凸分析理论、Banach空间几何理论、概率论等领域的交叉性研究。研究发现,学习理论中逼近误差的估计可以归结到经典Fourier逼近的研究,如学习理论中K-泛函与某种光滑模是等价的。针对低分辨率和低质量磁共振脑图像,提出了基于多图谱方法框架下的海马体分割算法;利用监督度量学习模型和低秩约束分解模型,提出了新的多图谱标签融合方法;结合深度神经网络模型和多图谱分割方法的优势,提出了一种基于深度学习图像配准误差矫正的多图谱图像分割方法。 .研究结果显示,核正则化半监督梯度学习算法可被应用于椭圆型边值问题数值解的研究;带参数损失函数中参数的选择会影响半监督学习的收敛速度,特别是D.X. Zhou, Q.Wu, G.B.Ye等学习理论专家在论文中所提出的关于变监督学习算法收敛性的问题得到解决。项目的研究也发现基于复杂数据结构,如Banach空间结构的在线学习算法是可行的且算法的收敛性可以借助函数空间几何理论和技巧来定量刻画;核函数的特征值的衰减速度影响核正则化算法的学习速度;Banach空间的几何参数,如凸性模,也将影响学习速度;核正则化学习算法关于分布的鲁棒性可归结为K泛函的收敛性而得到定量刻画。.项目共计已发表论文18篇(其中SCI论文14篇,SSCI论文1篇,北大核心2篇,EI论文1篇),申请国家发明专利1项,项目组共培养硕士研究生19名(含在读)。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
内点最大化与冗余点控制的小型无人机遥感图像配准
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
数据流半监督分类中的半监督迁移学习研究
面向半监督数据集的智能软测量建模方法研究与应用
基于健康数据分析的半监督在线学习血糖预报建模算法研究
结构化数据的非监督/半监督学习问题研究及应用