机器学习算法的margin理论

基本信息
批准号:61375051
项目类别:面上项目
资助金额:79.00
负责人:林通
学科分类:
依托单位:北京大学
批准年份:2013
结题年份:2017
起止时间:2014-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:杨李,林旸,郭朕臣,戚峰,王勃,黄波,吕晋
关键词:
间隔统计学习理论PAC贝叶斯助推算法机器学习
结项摘要

From computational biology to search engine problems, machine learning algorithms have emerged as the dominant and ubiquitous tool in computer science. Statistical learning theory can not only provide insights to the performance of existing learning algorithms, but also help design new or improved algorithms. From neural networks to support vector machines (SVM) and boosting, the margin theory plays a key role in the design and the analysis of these algorithms. This project aims at the study of margin theory from the three aspects: (1) Generalization bound for boosting based on the margin distribution, (2) PAC-Bayesian margin bound for linear classifiers like SVM, (3) the effects of margin on the label complexity for active learning algorithms. The main clue of this project is the margin theory, which is applied to several learning algorithms and is corroborated through extensive experiments. Our goal is to seek ground breakthroughs and innovative ideas in statistical learning theory.

从计算生物学到搜索引擎,机器学习算法已经成为计算机科学中占据主导地位、并且无处不在的强大工具。统计学习理论不但能对现有学习算法的性质提供理论分析,也能用于推导新的或者改进的学习算法。从神经网络、支撑向量机(SVM)到boosting,margin理论都起到了关键性的作用。因此本项目拟从如下三个方面,对margin理论进行深入研究:(1) 基于margin分布的boosting泛化界,(2) PAC-贝叶斯框架下线性分类器(如SVM)的margin界,(3) 主动学习算法中margin对标签复杂度的作用。本项目将以margin理论为研究主线,紧密联系多种学习算法,并通过实验来验证理论的正确性,力争在统计学习理论方面取得突破与创新。

项目摘要

Margin理论在机器学习中占据了重要地位,例如神经网络、支撑向量机SVM、和boosting都需要利用margin理论来给予解释。该项目的主要研究内容是:(1)基于margin分布的boosting泛化界;(2)PAC-贝叶斯框架下的线性分类器如SVM的margin上界;(3)主动学习算法中margin对标签复杂度的作用。根据研究学术前沿动态变化,我们对研究内容做了适当调整,取得重要结果如下:(1)在SVM的margin上界方面,我们提出了基于欧拉弹性杆的几何正则项,给出了求解算法,并理论证明了该算法的Bayes统计相合性。(2)在流形学习上,我们提出了保持局部正交性的对齐方法LOPA。(3)在疾病诊断和基因关联检验的应用方面,我们利用以margin为基础的机器学习算法,得到了较好的实验结果。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
3

转录组与代谢联合解析红花槭叶片中青素苷变化机制

转录组与代谢联合解析红花槭叶片中青素苷变化机制

DOI:
发表时间:
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

DOI:10.3799/dqkx.2020.083
发表时间:2020

林通的其他基金

批准号:60302005
批准年份:2003
资助金额:15.00
项目类别:青年科学基金项目
批准号:61075119
批准年份:2010
资助金额:35.00
项目类别:面上项目
批准号:60775006
批准年份:2007
资助金额:25.00
项目类别:面上项目

相似国自然基金

1

深度神经网络的margin理论

批准号:61573026
批准年份:2015
负责人:王立威
学科分类:F0605
资助金额:64.00
项目类别:面上项目
2

基于马氏抽样的机器学习理论与算法研究

批准号:61370002
批准年份:2013
负责人:邹斌
学科分类:F0201
资助金额:62.00
项目类别:面上项目
3

天气雷达精准降水估计机器学习理论与算法研究

批准号:61906190
批准年份:2019
负责人:杨雪冰
学科分类:F0608
资助金额:24.00
项目类别:青年科学基金项目
4

面向大数据的随机森林机器学习理论与算法研究

批准号:61602482
批准年份:2016
负责人:张英华
学科分类:F06
资助金额:21.00
项目类别:青年科学基金项目