基于稀疏优化的鲁棒多示例学习方法研究

基本信息
批准号:61906201
项目类别:青年科学基金项目
资助金额:27.00
负责人:罗廷金
学科分类:
依托单位:中国人民解放军国防科技大学
批准年份:2019
结题年份:2022
起止时间:2020-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:
关键词:
多示例学习非凸鲁棒模型重加权优化理论生物医疗数据分析 稀疏优化
结项摘要

Multi-instance learning is one of the most newest research topics in the fields of both statistical data analysis and machine learning. This project aims at analyzing multi-instance data in the open learning environment by robust models from three aspects, i.e. in theory, methodology and application. In theoretical aspect, we will discuss the description mechanism of feature correlation of multi-instance data and the construction of the unified sparse optimization framework. In methodology, we will try to construct copula of correlated feature for multi-instance data based on the sparse and low rank constraints. Besides, by using previous constructed feature structure, we will construct the novel robust multi-instance learning methods based on sparse optimization to solve the challenges of feature and label changes of multi-instance data. Meanwhile, we will also design the specific algorithms to solve our proposed optimization problems. In applications, based on our previous results, we will dedicate to the functional annotation problem of protein coding isoforms in biomedical data mining. The above three aspects are tightly related. The researches in theory and methodology can provide useful guidance for applications. The researches in applications can provide real background for theoretical and methodological investigations. The works in this project can not only extend the research areas of traditional machine learning, but also provide meaningful guidance for the solution to problems in real applications.

多示例学习是近年来统计数据分析和机器学习中出现的一个新的研究课题。本项目以多示例学习为背景,针对开放学习环境下多示例数据特征关联结构理论、方法和应用问题开展研究。理论上主要探讨多示例数据特征相关性描述机理和稀疏优化统一框架构建问题。方法上,一方面,研究基于稀疏和低秩约束的多示例数据特征关联结构构建方法;另一方面,根据已构建的特征关联结构,研究针对标签缺失和标签变化情形的基于稀疏优化的鲁棒多示例学习方法,并基于稀疏优化框架设计其快速求解算法。应用中,在理论和方法的基础上主要研究生物医疗数据挖掘中的蛋白质编码异构体功能标注问题。这三个部分紧密相连,理论和方法研究为应用研究提供指导,应用研究为理论和方法研究提供背景。课题研究不仅能够丰富和拓展机器学习的理论和方法,同时对于解决实际中许多具体应用问题也有重要的指导意义。

项目摘要

多示例学习是是国际机器学习领域的重要研究课题之一,相关技术被广泛应用于图像分割、药物发现、生物医疗数据挖掘等领域。本项目以多示例学习为背景,针对开放学习环境下特征和标注信息不完全等问题开展了多示例数据特征关联结构理论、学习方法和实际应用等方面的研究,完成了原定研究计划,取得了诸多有价值的成果。主要包括:(1) 针对不同凸性和光滑条件的优化问题设计了重加权优化框架,并基于该框架设计了一系列快速优化算法;(2) 针对数据特征噪声干扰和缺失问题,提出了系列噪声鲁棒的特征学习方法和特征缺失的多示例学习方法;(3)针对标注信息缺失问题,提出了系列融合分布信息和单侧标记信息的多示例学习方法;(4)针对标注信息不足和数据不平衡问题,提出了系列标签信息增强方法;(5) 面向实际军事需求,开展了多项多示例学习方法在军事情报数据筛选领域的创新研究,有效性地解决了数据筛选中的一些关键问题,已发挥了显著的军事效益。项目研究期间共发表论文14篇,其中SCI检索11篇,CCF A 类期刊/会议(TPAMI、TKDE、中国科学F辑: 信息科学)4篇;B 类期刊/会议(Pattern Recognition、Frontiers of Computer Science和ICME)6篇。本项目成果已经引起国际同行的广泛关注,引用源包括IEEE TCYB, IEEE TNNLS, IEEE TAI, IEEE TETCI, Pattern Recognition, ACM MM和IJCAI等。在本项目资助下申请专利/软著6项,同时培养了多名研究生。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

DOI:10.16085/j.issn.1000-6613.2022-0221
发表时间:2022
4

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
5

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021

罗廷金的其他基金

相似国自然基金

1

基于信息熵联合稀疏表示的鲁棒多视角学习方法研究

批准号:61702057
批准年份:2017
负责人:王玉龙
学科分类:F0605
资助金额:23.00
项目类别:青年科学基金项目
2

基于类属特征学习的高效鲁棒多标记学习方法研究

批准号:61806005
批准年份:2018
负责人:黄俊
学科分类:F0604
资助金额:28.00
项目类别:青年科学基金项目
3

稀疏相位检索的鲁棒优化理论与算法研究

批准号:11801130
批准年份:2018
负责人:阎爱玲
学科分类:A0405
资助金额:25.00
项目类别:青年科学基金项目
4

基于鲁棒优化的非友好环境多视角几何问题研究

批准号:61105130
批准年份:2011
负责人:张立伟
学科分类:F0306
资助金额:22.00
项目类别:青年科学基金项目