Multiple-instance learning is an important research area in machine learning and pattern recognition. In order to cope with the multiple-instance learning problems, this project designs several support vector machine based multiple-instance learning models. Firstly, present a similarity based multiple- instance learning model to incorporate the ambiguous instances into learning the classifier, so that the classification boundary can be refined to be more accurate. Secondly, propose a multiple-instance transfer learning model that transfers the knowledge to the target task from multiple related tasks via auxiliary classifiers. Compared to the multi-task multiple-instance learning methods, transferring the knowledge of related tasks via auxiliary classifiers can improve the training efficiency. Thirdly, put forward a semi-supervised multiple-instance clustering model by introducing the pairwise constraints. Lastly, design a model to handle the absent features in multiple-instance ranking by redefining the ranking functions of instances in lower dimensional spaces. Compared to the traditional missing-data imputation methods, it can avoid the noises caused by the inappropriate imputation.
多示例学习是机器学习和模式识别中的重要研究领域,本项目拟设计基于支持向量机的最大间隔多示例学习算法,对多示例学习问题进行研究。首先,针对多示例包中歧义性较大的示例,本项目提出基于相似度的多示例分类算法,通过相似度权重把歧义性较大的示例整合到分类器学习中,提高分类边界划分的精确性。其次,对于多示例分类中的知识迁移问题,构建基于分类器的多示例迁移学习算法,通过设计分类器之间的耦合参数,实现相关任务到目标任务的有效知识迁移。再次,在多示例聚类基础上引入成对约束,建立基于成对约束的半监督多示例聚类算法,通过成对约束先验信息的引入来提升多示例聚类性能。最后,设计在特征缺失情况下的多示例排序算法,通过在低维子空间中对排序函数进行重新定义,避免传统填补法中因数据填充不正确而产生的噪音。本项目旨在通过以上问题的解决为多示例学习算法的研究提供思路。
在传统分类学习中,训练集由不同的示例组成,每个示例具有一个分类标记。跟传统分类学习不同,多示例学习的训练集由若干个具有分类标记的多示例包组成,每个多示例包含有若干个没有分类标记的示例。多示例分类学习的目的是,通过已标记的多示例包建立分类器,对未知的多示例包进行预测。本项目设计了一批基于支持向量机的最大间隔多示例学习算法。针对多示例包中歧义性较大的示例,提出了基于相似度的多示例分类算法;为了实现多个多示例学习任务之间的联动学习,构建了基于分类器的多示例迁移学习算法;在多示例聚类基础上引入成对约束,建立了基于成对约束的半监督多示例聚类算法。针对多示例排序中的数据特征缺失问题,提出了基于特征缺失的多示例排序算法。通过本项目的研究,共发表SCI刊物论文7篇,国际会议论文3篇。其中,SCI刊物论文包括1篇《IEEE Transactions on Neural Networks and Learning Systems》(一区SCI期刊, IF: 4.291),1篇《IEEE Transactions on Cybernetics》(二区SCI期刊,IF: 3.469),2篇《IEEE Transactions on Knowledge and Data Engineering》(二区SCI期刊, IF: 2.067),2篇《Knowledge and Information Systems》(二区SCI期刊, IF: 1.782)等。另外,申请发明专利4项,培养硕士研究生3人。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于多模态信息特征融合的犯罪预测算法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
一种改进的多目标正余弦优化算法
基于尺度化凸壳的最大间隔学习算法研究
基于高斯过程模型的多示例多标记学习算法研究
基于深度多示例学习的视频理解与内容安全分析
基于深度和多示例学习的m6A-seq数据分析质量提升算法研究