基于最大间隔的多示例学习算法设计与分析

基本信息

批准号：61202270

项目类别：青年科学基金项目

资助金额：23.00

负责人：肖燕珊

学科分类：

依托单位：广东工业大学

批准年份：2012

结题年份：2015

起止时间：2013-01-01 - 2015-12-31

项目状态：已结题

项目参与者：左亚尧,李杨,谢锐,张泽彬,张奇,周鑫

关键词：

多示例学习

结项摘要

Multiple-instance learning is an important research area in machine learning and pattern recognition. In order to cope with the multiple-instance learning problems, this project designs several support vector machine based multiple-instance learning models. Firstly, present a similarity based multiple- instance learning model to incorporate the ambiguous instances into learning the classifier, so that the classification boundary can be refined to be more accurate. Secondly, propose a multiple-instance transfer learning model that transfers the knowledge to the target task from multiple related tasks via auxiliary classifiers. Compared to the multi-task multiple-instance learning methods, transferring the knowledge of related tasks via auxiliary classifiers can improve the training efficiency. Thirdly, put forward a semi-supervised multiple-instance clustering model by introducing the pairwise constraints. Lastly, design a model to handle the absent features in multiple-instance ranking by redefining the ranking functions of instances in lower dimensional spaces. Compared to the traditional missing-data imputation methods, it can avoid the noises caused by the inappropriate imputation.

多示例学习是机器学习和模式识别中的重要研究领域，本项目拟设计基于支持向量机的最大间隔多示例学习算法，对多示例学习问题进行研究。首先，针对多示例包中歧义性较大的示例，本项目提出基于相似度的多示例分类算法，通过相似度权重把歧义性较大的示例整合到分类器学习中，提高分类边界划分的精确性。其次，对于多示例分类中的知识迁移问题，构建基于分类器的多示例迁移学习算法，通过设计分类器之间的耦合参数，实现相关任务到目标任务的有效知识迁移。再次，在多示例聚类基础上引入成对约束，建立基于成对约束的半监督多示例聚类算法，通过成对约束先验信息的引入来提升多示例聚类性能。最后，设计在特征缺失情况下的多示例排序算法，通过在低维子空间中对排序函数进行重新定义，避免传统填补法中因数据填充不正确而产生的噪音。本项目旨在通过以上问题的解决为多示例学习算法的研究提供思路。

项目摘要

在传统分类学习中，训练集由不同的示例组成，每个示例具有一个分类标记。跟传统分类学习不同，多示例学习的训练集由若干个具有分类标记的多示例包组成，每个多示例包含有若干个没有分类标记的示例。多示例分类学习的目的是，通过已标记的多示例包建立分类器，对未知的多示例包进行预测。本项目设计了一批基于支持向量机的最大间隔多示例学习算法。针对多示例包中歧义性较大的示例，提出了基于相似度的多示例分类算法；为了实现多个多示例学习任务之间的联动学习，构建了基于分类器的多示例迁移学习算法；在多示例聚类基础上引入成对约束，建立了基于成对约束的半监督多示例聚类算法。针对多示例排序中的数据特征缺失问题，提出了基于特征缺失的多示例排序算法。通过本项目的研究，共发表SCI刊物论文7篇，国际会议论文3篇。其中，SCI刊物论文包括1篇《IEEE Transactions on Neural Networks and Learning Systems》（一区SCI期刊, IF: 4.291），1篇《IEEE Transactions on Cybernetics》（二区SCI期刊，IF: 3.469），2篇《IEEE Transactions on Knowledge and Data Engineering》（二区SCI期刊, IF: 2.067），2篇《Knowledge and Information Systems》（二区SCI期刊, IF: 1.782）等。另外，申请发明专利4项，培养硕士研究生3人。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：

发表时间：2020

DOI：10.3788/CJL201946.0801003

发表时间：2019

DOI：10.13609/j.cnki.1000-0313.2022.04.019

发表时间：2022

DOI：10.7641/CTA.2018.70969

发表时间：2018

肖燕珊的其他基金

批准号：61672169

批准年份：2016

资助金额：63.00

项目类别：面上项目

相似国自然基金

基于尺度化凸壳的最大间隔学习算法研究

批准号：61105004

批准年份：2011

负责人：刘振丙

学科分类：F0605

资助金额：22.00

项目类别：青年科学基金项目

基于高斯过程模型的多示例多标记学习算法研究

批准号：61503058

批准年份：2015

负责人：贺建军

学科分类：F0603

资助金额：22.00

项目类别：青年科学基金项目

基于深度多示例学习的视频理解与内容安全分析

批准号：61876100

批准年份：2018

负责人：丁昕苗

学科分类：F0604

资助金额：64.00

项目类别：面上项目

基于深度和多示例学习的m6A-seq数据分析质量提升算法研究

批准号：61902323

批准年份：2019

负责人：刘泽

学科分类：F0213

资助金额：26.00

项目类别：青年科学基金项目

基于最大间隔的多示例学习算法设计与分析

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于铁路客流分配的旅客列车开行方案调整方法

基于多色集合理论的医院异常工作流处理建模

基于腔内级联变频的0.63μm波段多波长激光器

结直肠癌免疫治疗的多模态影像及分子影像评估

具有随机多跳时变时延的多航天器协同编队姿态一致性

肖燕珊的其他基金

面向多示例数据的分类和多序列回归算法研究

相似国自然基金