Weakly labeled data is one common data scheme in image classification and annotation tasks. To deal with weakly labeled data, weak-supervision learning technique is a hot research area. It is generally accepted that, weak-supervision learning technique using weakly labeled data will achieve better performance than that of using only labeled data. However, recent studies found that blindly using weakly labeled data will hurt the performance, and therefore, how to make weakly labeled data never hurt the performance become an important yet unsolved problem for machine learning. This project proposes to study safe machine learning techniques for image classification and annotation, where the goal is that the performance will be improved when using weakly labeled data, while in the worst case, the performance will not be decreased. The research contents include: proposing a safe weak-supervision learning technique for the use of label correlation; proposing a safe weak-supervision learning technique oriented to complicated performance measures; proposing an efficient and scalable safe weak-supervision learning technique; proposing model selection mechanism for safe weak-supervision learning. It is expected to publish 5-8 high quality papers, apply 2-4 patents, develop a prototype system of image classification and annotation, and supervise multiple graduate students.
弱标记数据是图像分类与标注任务中常见的数据类型,弱监督学习是机器学习技术中处理弱标记数据的一个热门研究领域。一般认为,通过利用弱标记数据,弱监督学习技术可以取得比只利用有标记数据进行监督学习更好的性能。然而近年来的一些研究发现,盲目利用弱标记数据有可能导致性能变坏,而如何确保在利用弱标记数据后性能不致恶化,成为机器学习中一个重要而未解决的问题。本项目拟对图像分类与标注任务中的安全机器学习技术进行研究,目标是通过利用弱标记数据取得性能提升,在最坏情况下也不致性能恶化。主要研究内容:提出面向标记关系利用的安全弱监督学习技术;提出面向复杂性能指标的安全弱监督学习技术;提出高效可扩展的安全弱监督学习技术;提出面向安全弱监督学习的模型选择机制。本项目研究可望产生高水平论文5-8篇,申请专利2-4项,研制一个图像分类与标注原型系统,培养多名研究生。
该项目按照原计划顺利执行,提出了面向标记关系利用的安全弱监督学习方法、提出了面向特定性能指标的安全弱监督学习方法、提出了可扩展更强的安全弱监督学习方法、完善了安全弱监督学习的模型选择机制等成果。在执行期间,项目成果包括IEEE TPAMI、IEEE TKDE等国内外一流期刊6篇,ICML’20、KDD’21等国际一流会议10篇,其中CCF-A类论文13篇,CCF-B类论文2篇,迄今Google Scholar引用263次。围绕核心技术,申请发明专利4项,研制图像分类原型系统1项,培养研究生6名,获系优硕(提名)学位论文3篇,百度奖学金1项,华为-南京大学突出贡献奖2项,国家奖学金7项等,部分研究成果于2021年入选第30届国际人工智能联合会议(IJCAI2021)“Early Career”亮点报告(全球共14位)。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
一种改进的多目标正余弦优化算法
面向工件表面缺陷的无监督域适应方法
采用深度学习的铣刀磨损状态预测模型
适于在线媒体内容分类与标注的机器学习技术的研究
适于移动设备的机器学习技术研究
基于视觉显著与多核学习的图像标注与重排序技术研究
基于神经主题模型的图像分类与标注