基于多样化查询的多标记主动学习研究

基本信息
批准号:61503182
项目类别:青年科学基金项目
资助金额:22.00
负责人:黄圣君
学科分类:
依托单位:南京航空航天大学
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:冯爱民,朱旗,黄飞虎,马迪,高能能,朱快快
关键词:
半监督学习多标记学习主动学习机器学习
结项摘要

Multi-label learning is an important research area of machine learning, where each object is simultaneously associated with multiple labels. Manually annotating a large set of multi-label objects will lead to high cost. Active learning, which selectively queries the most important supervision information from the oracle, can reduce the labeling cost significantly. Most existing methods query all labels of one instance at a time. Such a simple strategy is less effective, and cannot meet the varying requirements of the learning model on the supervision information. This project proposes to study on this important issue, and the research contents include: 1) proposing a multi-label active learning (MLAL) approach by querying the relevance on instance-label pairs; 2) proposing a MLAL approach by querying the relevance ordering of label pairs; 3) analyzing the varying requirements of the learning model and building the theoretical basic for it; 4) designing a MLAL approach to adaptively incorporate different query types. Our project provides a novel direction to further improve the performance of MLAL. It is expected to publish 4-6 papers on high quality journals or conferences and apply 1-2 patents.

多标记学习是机器学习中的一个重要研究方向,其学习对象同时与多个标记相关联,人工标注大量样本将导致高昂代价。主动学习通过选择性地向用户查询部分最有价值的监督信息,可有效减少用户标注代价。现有方法往往采用单一的查询方式向用户询问一个样本的所有标记,效率较低,且无法满足模型在学习过程中随监督信息增加而不断变化的需求。本项目针对这一问题进行研究,主要内容包括:(1)提出基于“示例-标记”对相关性查询的多标记主动学习方法;(2)提出基于标记间相关度排序查询的多标记主动学习方法;(3)分析多标记主动学习中各阶段模型对监督信息的需求变化,并构建其理论基础;(4)设计自适应融合多种查询方式的多标记主动学习方法。本项目为进一步提高多标记主动学习效果开辟了新的思路和方向,成果有望在国内外重要学术期刊和会议上发表高质量论文4-6篇,并申请专利1-2项。

项目摘要

多标记学习是机器学习中的一个重要研究方向,其学习对象同时与多个标记相关联,人工标注大量样本将导致高昂代价。主动学习通过选择性地向用户查询部分最有价值的监督信息,可有效减少用户标注代价。现有方法往往采用单一的查询方式向用户询问一个样本的所有标记,效率较低,且无法满足模型在学习过程中随监督信息增加而不断变化的需求。本项目针对这一问题进行研究,提出基于“示例-标记”对相关性查询的多标记主动学习方法;提出基于标记间相关度排序查询的多标记主动学习方法;提出自适应融合多种查询方式的多标记主动学习方法。发表高水平论文10篇,申请专利3项,培养研究生4名。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

DOI:10.13465/j.cnki.jvs.2020.09.026
发表时间:2020
2

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
3

温和条件下柱前标记-高效液相色谱-质谱法测定枸杞多糖中单糖组成

温和条件下柱前标记-高效液相色谱-质谱法测定枸杞多糖中单糖组成

DOI:10.3724/ SP.J.1123.2019.04013
发表时间:2019
4

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

黄圣君的其他基金

批准号:61876081
批准年份:2018
资助金额:16.00
项目类别:面上项目

相似国自然基金

1

基于社会媒体挖掘的多样化社交关系主动学习

批准号:61772122
批准年份:2017
负责人:王大玲
学科分类:F0202
资助金额:63.00
项目类别:面上项目
2

基于特征学习和标记关联的多标记学习算法研究

批准号:61563016
批准年份:2015
负责人:余鹰
学科分类:F0603
资助金额:39.00
项目类别:地区科学基金项目
3

基于多源特征学习的中文查询纠错方法研究

批准号:61672040
批准年份:2016
负责人:段建勇
学科分类:F0211
资助金额:62.00
项目类别:面上项目
4

基于社会标记精化的多标记学习算法研究

批准号:61202170
批准年份:2012
负责人:卫志华
学科分类:F0605
资助金额:24.00
项目类别:青年科学基金项目