基于最大间隔的多示例学习算法设计与分析

基本信息
批准号:61202270
项目类别:青年科学基金项目
资助金额:23.00
负责人:肖燕珊
学科分类:
依托单位:广东工业大学
批准年份:2012
结题年份:2015
起止时间:2013-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:左亚尧,李杨,谢锐,张泽彬,张奇,周鑫
关键词:
多示例学习
结项摘要

Multiple-instance learning is an important research area in machine learning and pattern recognition. In order to cope with the multiple-instance learning problems, this project designs several support vector machine based multiple-instance learning models. Firstly, present a similarity based multiple- instance learning model to incorporate the ambiguous instances into learning the classifier, so that the classification boundary can be refined to be more accurate. Secondly, propose a multiple-instance transfer learning model that transfers the knowledge to the target task from multiple related tasks via auxiliary classifiers. Compared to the multi-task multiple-instance learning methods, transferring the knowledge of related tasks via auxiliary classifiers can improve the training efficiency. Thirdly, put forward a semi-supervised multiple-instance clustering model by introducing the pairwise constraints. Lastly, design a model to handle the absent features in multiple-instance ranking by redefining the ranking functions of instances in lower dimensional spaces. Compared to the traditional missing-data imputation methods, it can avoid the noises caused by the inappropriate imputation.

多示例学习是机器学习和模式识别中的重要研究领域,本项目拟设计基于支持向量机的最大间隔多示例学习算法,对多示例学习问题进行研究。首先,针对多示例包中歧义性较大的示例,本项目提出基于相似度的多示例分类算法,通过相似度权重把歧义性较大的示例整合到分类器学习中,提高分类边界划分的精确性。其次,对于多示例分类中的知识迁移问题,构建基于分类器的多示例迁移学习算法,通过设计分类器之间的耦合参数,实现相关任务到目标任务的有效知识迁移。再次,在多示例聚类基础上引入成对约束,建立基于成对约束的半监督多示例聚类算法,通过成对约束先验信息的引入来提升多示例聚类性能。最后,设计在特征缺失情况下的多示例排序算法,通过在低维子空间中对排序函数进行重新定义,避免传统填补法中因数据填充不正确而产生的噪音。本项目旨在通过以上问题的解决为多示例学习算法的研究提供思路。

项目摘要

在传统分类学习中,训练集由不同的示例组成,每个示例具有一个分类标记。跟传统分类学习不同,多示例学习的训练集由若干个具有分类标记的多示例包组成,每个多示例包含有若干个没有分类标记的示例。多示例分类学习的目的是,通过已标记的多示例包建立分类器,对未知的多示例包进行预测。本项目设计了一批基于支持向量机的最大间隔多示例学习算法。针对多示例包中歧义性较大的示例,提出了基于相似度的多示例分类算法;为了实现多个多示例学习任务之间的联动学习,构建了基于分类器的多示例迁移学习算法;在多示例聚类基础上引入成对约束,建立了基于成对约束的半监督多示例聚类算法。针对多示例排序中的数据特征缺失问题,提出了基于特征缺失的多示例排序算法。通过本项目的研究,共发表SCI刊物论文7篇,国际会议论文3篇。其中,SCI刊物论文包括1篇《IEEE Transactions on Neural Networks and Learning Systems》(一区SCI期刊, IF: 4.291),1篇《IEEE Transactions on Cybernetics》(二区SCI期刊,IF: 3.469),2篇《IEEE Transactions on Knowledge and Data Engineering》(二区SCI期刊, IF: 2.067),2篇《Knowledge and Information Systems》(二区SCI期刊, IF: 1.782)等。另外,申请发明专利4项,培养硕士研究生3人。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
4

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
5

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019

肖燕珊的其他基金

批准号:61672169
批准年份:2016
资助金额:63.00
项目类别:面上项目

相似国自然基金

1

基于尺度化凸壳的最大间隔学习算法研究

批准号:61105004
批准年份:2011
负责人:刘振丙
学科分类:F0605
资助金额:22.00
项目类别:青年科学基金项目
2

基于高斯过程模型的多示例多标记学习算法研究

批准号:61503058
批准年份:2015
负责人:贺建军
学科分类:F0603
资助金额:22.00
项目类别:青年科学基金项目
3

基于深度多示例学习的视频理解与内容安全分析

批准号:61876100
批准年份:2018
负责人:丁昕苗
学科分类:F0604
资助金额:64.00
项目类别:面上项目
4

基于深度和多示例学习的m6A-seq数据分析质量提升算法研究

批准号:61902323
批准年份:2019
负责人:刘泽
学科分类:F0213
资助金额:26.00
项目类别:青年科学基金项目