面向大量数据的半监督支持向量机的优化方法研究

基本信息
批准号:11601174
项目类别:青年科学基金项目
资助金额:16.00
负责人:熊慧娟
学科分类:
依托单位:华中农业大学
批准年份:2016
结题年份:2019
起止时间:2017-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:汤鑫,谭劲英,杨文宇,袁佩佩,来会会
关键词:
样本均值方法大样本随机优化一阶优化方法支撑向量机
结项摘要

Semi-supervised support vector machine is one of most popular technology in machine learning. Based on different selection of regularized functions and loss functions, the problem can be modeled as a smooth nonconvex programming or a nonsmooth programming. Large-scale learning is a hot topic in the fields of machine learning. The project will present efficient algorithms for several optimization problems which arise in large scale semi-supervised support vector machines with different regularization function and loss function. .Efficient numerical algorithms for smooth nonconvex programming will considered first, which arise from the model established by semi-supervised support vector machine based on L2 regularized function and hinge loss function. Based on existing strategies including online algorithm, stochastic algorithm and mini-batch dynamic sample selection in supervised learning, some new efficient algorithms will be given for solving smooth nonconvex semi-supervised support vector machines such as online gradient method, weighted accelerated stochastic gradient method and mini-batch dynamic sample size selection gradient method. For nonsmooth semi-supervised support vector machines, based on existing smooth approximation technique, methods for smooth nonconvex semi-supervised support vector machines will be extended. It is expected that our work will make contributions to optimization methods for machine learning and will be helpful for related applications.

半监督支持向量机是机器学习领域的热点技术。根据正则化函数和损失函数的不同取法,该问题的数学本质为特殊的光滑非凸或非光滑优化模型。面向大规模数据(样本点个数几十万乃至上千万个,样本维数上万维)的学习问题是目前机器学习领域的热点和难点。本课题拟在大型监督学习的在线策略、随机取样策略、分批动态取样策略的基础上,给出面向大量数据(即:样本数量多)的半监督支持向量机模型的有效算法,具体内容包括:对基于L2 正则化函数和光滑凸损失函数得到的光滑非凸规划模型,分别给出新的变步长在线梯度算法及收敛性、新的加权加速随机梯度算法、新的分批动态取样梯度型算法;对基于L1 正则化函数和非光滑损失函数得到的非光滑规划模型,基于光滑逼近技巧,结合随机取样策略以及分批动态取样策略,分别给出新算法,建立收敛性分析。我们期望本项目的研究有助于相关应用问题的求解,并进一步推动优化方法在机器学习前沿研究领域的应用。

项目摘要

半监督支持向量机是机器学习中的重要技术,根据正则函数和损失函数的不同,该问题本质上是光滑非凸优化模型或者非光滑优化模型。考虑到实际问题中出现的大量样本数据, 本课题考虑该模型的专门算法。我们在大型监督学习的在线策略、随机取样策略、分批动态取样策略的基础上,对带有大量数据的半监督支持向量机的各种模型给出有效算法。我们基于随机取样策略和分批动态取样策略,对基于L2正则化函数的光滑非凸模型、基于L1正则化函数的非光滑模型,分别给出新算法并建立收敛性分析。此外,我们考虑了相关算法在机器学习中的鲁棒稀疏重构、鲁棒变量选择以及图像处理和人脸识别中的部分应用。 截至项目结题,发表项目相关论文4篇,投稿待接收1篇,待投论文2篇。本课题的研究有助于相关应用问题的求解,推动了优化方法在机器学习前沿研究领域的应用,并为后续更深入的抗噪对抗性学习的研究做准备。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

黄河流域水资源利用时空演变特征及驱动要素

黄河流域水资源利用时空演变特征及驱动要素

DOI:10.18402/resci.2020.12.01
发表时间:2020
2

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
3

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
4

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

DOI:10.3969/j.issn.1002-0268.2020.03.007
发表时间:2020
5

气载放射性碘采样测量方法研究进展

气载放射性碘采样测量方法研究进展

DOI:
发表时间:2020

熊慧娟的其他基金

批准号:11226304
批准年份:2012
资助金额:3.00
项目类别:数学天元基金项目

相似国自然基金

1

高维缺失数据半监督支持向量机研究

批准号:12126333
批准年份:2021
负责人:祝志川
学科分类:A04
资助金额:10.00
项目类别:数学天元基金项目
2

高维缺失数据半监督支持向量机研究

批准号:12126362
批准年份:2021
负责人:唐年胜
学科分类:A04
资助金额:20.00
项目类别:数学天元基金项目
3

复杂多流形半监督问题的非平行支持向量机方法研究

批准号:61603338
批准年份:2016
负责人:陈伟杰
学科分类:F0603
资助金额:19.00
项目类别:青年科学基金项目
4

半监督支持向量机的截断凝聚同伦算法及复杂性分析

批准号:11226304
批准年份:2012
负责人:熊慧娟
学科分类:A0501
资助金额:3.00
项目类别:数学天元基金项目