适于非精确信息的数据不均衡学习技术的研究

基本信息
批准号:61105046
项目类别:青年科学基金项目
资助金额:22.00
负责人:刘胥影
学科分类:
依托单位:东南大学
批准年份:2011
结题年份:2014
起止时间:2012-01-01 - 2014-12-31
项目状态: 已结题
项目参与者:张敏灵,薛晖,季秋,鲁廷明,谷鹏,方尔庆,归耀城,杨沛
关键词:
多标记学习代价敏感学习非精确信息机器学习样本分布不平衡
结项摘要

在机器学习领域,数据不均衡性广泛存在于真实应用中,主要体现为误分类代价不等和样本分布不平衡,不符合标准机器学习的假设。现有数据不均衡学习技术假设数据的不均衡性是精确刻画的,但多种因素会导致数据不均衡性难以精确刻画。本项目重点在以下四个方面关注数据不均衡的非精确性:(1)领域给定的基于类别的代价信息通常是不精确的;(2)领域给定的基于样本的代价信息通常是不精确的;(3)多标记的歧义性导致代价信息是不精确的;(4)多标记的歧义性导致样本分布不平衡性是不精确的。项目组将针对以上四种形式的数据不均衡的非精确性分别提出一种基于类别的非精确代价敏感学习方法、一种基于样本的非精确代价敏感学习方法、一种代价敏感的多标记学习方法、以及一种多标记数据的样本分布不平衡学习方法。本项目可望在国际期刊、国际会议和国内一级学报上发表高质量论文5-8篇,申请国家发明专利1 项,培养研究生2名。

项目摘要

本项目针对适于非精确信息的数据不平衡学习技术进行研究,研究计划要点包括基于类别的代价信息不精确情况下的学习,基于类别的样本分布不平衡信息不精确情况下的学习,多标记的歧义性导致的样本分布不平衡信息不精确情况下的学习。项目进展顺利,目前取得的研究成果包括7篇论文,其中被EI索引4篇,ISTP索引1篇,其中1篇发表在中国计算机学会认定的B类会议IEEE ICDM’13上,2篇发表在中国计算机学会认定的C类会议IEEE IJCNN’14\PAKDD’13上,1篇被收录在第一本介绍类别不平衡学习技术的著作《Imbalanced Learning: Foundations, Algorithms, and Applications》中。具体成果包括:(1)提出一种基于极大极小多目标优化的代价区间敏感学习方法;(2)提出一种基于纠错输出码的多类类别不平衡方法imECOC,两种基于集成的多类类别不平衡方法EasyEnsemble.M和ChunkCombine;(3)对类别不平衡问题中的极端不平衡问题进行了研究,比较了基于Boosting的常用类别不平衡学习方法在极端类别不平衡问题上的性能,得出了有意义的结论;(4)详细综述了两类的类别不平衡学习中的集成技术;(5)针对短文本这种新形式的数据不均衡性进行研究,提出了一种对短文本进行扩展的方法Crest;(6)提出了一种适用于多标记数据的样本分布不平衡学习方法COCOA。在项目期间,参加国际著名学术会议2次,口头报告1次,参加国内学术会议3次,口头报告2次,特邀报告1次。培养研究生4名,其中毕业1名,在读3名。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
2

温和条件下柱前标记-高效液相色谱-质谱法测定枸杞多糖中单糖组成

温和条件下柱前标记-高效液相色谱-质谱法测定枸杞多糖中单糖组成

DOI:10.3724/ SP.J.1123.2019.04013
发表时间:2019
3

低轨卫星通信信道分配策略

低轨卫星通信信道分配策略

DOI:10.12068/j.issn.1005-3026.2019.06.009
发表时间:2019
4

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

刘胥影的其他基金

批准号:61473087
批准年份:2014
资助金额:84.00
项目类别:面上项目

相似国自然基金

1

适于移动设备的机器学习技术研究

批准号:61105043
批准年份:2011
负责人:詹德川
学科分类:F0603
资助金额:23.00
项目类别:青年科学基金项目
2

面向信息非均衡遥感影像变化检测的深度学习模型及其优化方法

批准号:61602385
批准年份:2016
负责人:侍佼
学科分类:F06
资助金额:20.00
项目类别:青年科学基金项目
3

适于图像分类与标注的安全机器学习技术研究

批准号:61772262
批准年份:2017
负责人:李宇峰
学科分类:F0605
资助金额:67.00
项目类别:面上项目
4

适于在线媒体内容分类与标注的机器学习技术的研究

批准号:61073097
批准年份:2010
负责人:周志华
学科分类:F0607
资助金额:36.00
项目类别:面上项目