适于非精确信息的数据不均衡学习技术的研究

基本信息

批准号：61105046

项目类别：青年科学基金项目

资助金额：22.00

负责人：刘胥影

学科分类：

依托单位：东南大学

批准年份：2011

结题年份：2014

起止时间：2012-01-01 - 2014-12-31

项目状态：已结题

项目参与者：张敏灵,薛晖,季秋,鲁廷明,谷鹏,方尔庆,归耀城,杨沛

关键词：

多标记学习代价敏感学习非精确信息机器学习样本分布不平衡

结项摘要

在机器学习领域，数据不均衡性广泛存在于真实应用中，主要体现为误分类代价不等和样本分布不平衡，不符合标准机器学习的假设。现有数据不均衡学习技术假设数据的不均衡性是精确刻画的，但多种因素会导致数据不均衡性难以精确刻画。本项目重点在以下四个方面关注数据不均衡的非精确性：（1）领域给定的基于类别的代价信息通常是不精确的；(2)领域给定的基于样本的代价信息通常是不精确的；(3)多标记的歧义性导致代价信息是不精确的；(4)多标记的歧义性导致样本分布不平衡性是不精确的。项目组将针对以上四种形式的数据不均衡的非精确性分别提出一种基于类别的非精确代价敏感学习方法、一种基于样本的非精确代价敏感学习方法、一种代价敏感的多标记学习方法、以及一种多标记数据的样本分布不平衡学习方法。本项目可望在国际期刊、国际会议和国内一级学报上发表高质量论文5-8篇，申请国家发明专利1 项，培养研究生2名。

项目摘要

本项目针对适于非精确信息的数据不平衡学习技术进行研究，研究计划要点包括基于类别的代价信息不精确情况下的学习，基于类别的样本分布不平衡信息不精确情况下的学习，多标记的歧义性导致的样本分布不平衡信息不精确情况下的学习。项目进展顺利，目前取得的研究成果包括7篇论文，其中被EI索引4篇，ISTP索引1篇，其中1篇发表在中国计算机学会认定的B类会议IEEE ICDM’13上，2篇发表在中国计算机学会认定的C类会议IEEE IJCNN’14\PAKDD’13上，1篇被收录在第一本介绍类别不平衡学习技术的著作《Imbalanced Learning: Foundations, Algorithms, and Applications》中。具体成果包括：（1）提出一种基于极大极小多目标优化的代价区间敏感学习方法；（2）提出一种基于纠错输出码的多类类别不平衡方法imECOC，两种基于集成的多类类别不平衡方法EasyEnsemble.M和ChunkCombine；（3）对类别不平衡问题中的极端不平衡问题进行了研究，比较了基于Boosting的常用类别不平衡学习方法在极端类别不平衡问题上的性能，得出了有意义的结论；（4）详细综述了两类的类别不平衡学习中的集成技术；（5）针对短文本这种新形式的数据不均衡性进行研究，提出了一种对短文本进行扩展的方法Crest；（6）提出了一种适用于多标记数据的样本分布不平衡学习方法COCOA。在项目期间，参加国际著名学术会议2次，口头报告1次，参加国内学术会议3次，口头报告2次，特邀报告1次。培养研究生4名，其中毕业1名，在读3名。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：10.13334/j.0258-8013.pcsee.190276

发表时间：2020

DOI：

发表时间：

DOI：

发表时间：2020

DOI：

发表时间：2020

刘胥影的其他基金

批准号：61473087

批准年份：2014

资助金额：84.00

项目类别：面上项目

相似国自然基金

适于移动设备的机器学习技术研究

批准号：61105043

批准年份：2011

负责人：詹德川

学科分类：F0603

资助金额：23.00

项目类别：青年科学基金项目

面向信息非均衡遥感影像变化检测的深度学习模型及其优化方法

批准号：61602385

批准年份：2016

负责人：侍佼

学科分类：F06

资助金额：20.00

项目类别：青年科学基金项目

适于图像分类与标注的安全机器学习技术研究

批准号：61772262

批准年份：2017

负责人：李宇峰

学科分类：F0605

资助金额：67.00

项目类别：面上项目

适于在线媒体内容分类与标注的机器学习技术的研究

批准号：61073097

批准年份：2010

负责人：周志华

学科分类：F0607

资助金额：36.00

项目类别：面上项目

适于非精确信息的数据不均衡学习技术的研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于铁路客流分配的旅客列车开行方案调整方法

多能耦合三相不平衡主动配电网与输电网交互随机模糊潮流方法

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

奥希替尼治疗非小细胞肺癌患者的耐药机制研究进展

基于多色集合理论的医院异常工作流处理建模

刘胥影的其他基金

“新类别发现”学习及其应用

相似国自然基金