代价敏感的主动学习研究

基本信息
批准号:61876081
项目类别:面上项目
资助金额:16.00
负责人:黄圣君
学科分类:
依托单位:南京航空航天大学
批准年份:2018
结题年份:2019
起止时间:2019-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:刘力平,梁栋,黄飞虎,马迪,耿传兴,颜逸凡,唐英鹏,蔡佳佳,刘朝阳
关键词:
样本选择标记查询代价敏感批模式主动学习
结项摘要

Traditional supervised learning usually requires a large amount of labeled data to train the model, leading to high cost of human annotation. Active learning selectively queries the most valuable information from oracles, and can significantly reduce the cost. However, existing studies on active learning evaluate the cost simply with the number of queried examples, and thus cannot handle the diverse costs from aspects of examples. This project proposes to study on this important issue, and mainly includes the following research contents: for sensitiveness to the querying cost, proposing an active learning approach to deal with diverse annotation difficulties among examples. This project studies the cost-sensitiveness of active learning, and tries to apply the methods to task of risk prediction for news events. It is expected to publish 2-3 high quality papers on important journals and conferences, apply 1 patents.

传统监督学习往往基于大量已标记数据进行模型训练,导致高昂的人工标注代价。主动学习选择性地向专家查询部分最有价值信息,可有效减少学习代价。然而,现有方法简单地将代价等同为标注样本数目,无法有效处理实际应用中在样本等方面存在的代价差异。本项目针对这一问题进行研究,主要内容包括:针对样本查询代价敏感性,提出适应样本多样化标注难度的主动学习方法。本项目针对性的研究主动学习中的代价敏感性,并围绕新闻事件风险预测任务进行应用研究。成果有望在国内外重要学术期刊和会议上发表高质量论文2-3篇,申请专利1项。

项目摘要

传统监督学习往往基于大量已标记数据进行模型训练,导致高昂的人工标注代价。主动学习选择性地向专家查询部分最有价值信息,可有效减少学习代价。然而,现有方法简单地将代价等同为标注样本数目,无法有效处理实际应用中在样本等方面存在的代价差异。为了解决这一问题,本项目针对主动学习中代价敏感性,提出了一种能够适应样本多样化标注难度的主动学习方法,并成功将这一方法应用于新闻事件风险预测任务。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
2

温和条件下柱前标记-高效液相色谱-质谱法测定枸杞多糖中单糖组成

温和条件下柱前标记-高效液相色谱-质谱法测定枸杞多糖中单糖组成

DOI:10.3724/ SP.J.1123.2019.04013
发表时间:2019
3

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

DOI:10.7606/j.issn.1000-7601.2022.03.25
发表时间:2022
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

基于全模式全聚焦方法的裂纹超声成像定量检测

基于全模式全聚焦方法的裂纹超声成像定量检测

DOI:10.19650/j.cnki.cjsi.J2007019
发表时间:2021

黄圣君的其他基金

批准号:61503182
批准年份:2015
资助金额:22.00
项目类别:青年科学基金项目

相似国自然基金

1

代价敏感学习的粗糙集方法

批准号:61379089
批准年份:2013
负责人:闵帆
学科分类:F06
资助金额:75.00
项目类别:面上项目
2

代价敏感的稀疏学习与距离度量学习方法研究

批准号:61562013
批准年份:2015
负责人:刘振丙
学科分类:F0605
资助金额:38.00
项目类别:地区科学基金项目
3

多标签降维中的多重代价敏感学习问题研究

批准号:61502058
批准年份:2015
负责人:万建武
学科分类:F0605
资助金额:21.00
项目类别:青年科学基金项目
4

基于海量数据代价敏感学习的直驱风电机组故障诊断方法研究

批准号:61403046
批准年份:2014
负责人:唐明珠
学科分类:F0301
资助金额:25.00
项目类别:青年科学基金项目