双向主动学习方法及其应用研究

基本信息
批准号:61501457
项目类别:青年科学基金项目
资助金额:20.00
负责人:张晓宇
学科分类:
依托单位:中国科学院信息工程研究所
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:王勇,王海平,王振宇,张凯,王冲华,李明月,易佳
关键词:
分类算法主动学习信息论数据挖掘机器学习
结项摘要

In machine learning, active learning is an important method for effective information utilization, which actively queries the user for labels. In this project, we propose a novel bidirectional active learning algorithm, based on which network information security is studied as an application. To cope with the issue where the labeled instances are limited while the unlabeled instances are abundant and easy to access, we will propose an effective framework for effective classification via two-way exploration into labeled and unlabeled dataset, coordination between model update and upgrade, optimization of human-computer interaction, fusion and extension of existing algorithms, and so on. This project aims at exploring the effective solution for massive data classification through active learning, which is derived from the intensive study of data mining and machine learning. Based on large-scale data analysis, some key issues are to be addressed with the combination of empirical and data-driven techniques. This research work is innovative and practical, which will promote the advance of academic studies and stimulate related applications.

在分类问题中,主动学习能够主动地、有针对地选择最有价值的样本交给专家标注,是一种最大化信息使用效率的机器学习方法。本项目围绕主动学习算法理论,针对大规模数据分类问题中已标注样本获取代价高、数量有限而未标注样本大量存在、易于获取的典型特征,重点选取网络信息安全领域数据作为研究对象,设计和提出一种新型的双向主动学习算法,并在此框架下研究信息双向挖掘模式设计、模型调优与重构协同优化、高效人机交互机制探索创新、算法融合扩展等关键问题,最终形成一整套行之有效的研究方案,以解决大数据环境下海量信息的智能化、低成本化知识获取及分类问题。本项目以信息智能分析算法理论研究为基础,以数据挖掘、机器学习为指导,以人机交互为桥梁,深入研究双向主动学习方法及其应用,解决其中存在的若干关键问题,其研究成果不仅可以促进相关领域的学术研究,而且能够推动信息智能分析的相关实际应用,具有较强的创新性和实用性。

项目摘要

基于大规模数据的高效分析建模是一项具有重要研究意义和应用价值的课题。主动学习通过主动地、有针对地选择最有价值的样本进行标注,实现专家经验的高效利用,是一种最大化信息使用效率的机器学习方法。本项目围绕主动学习算法理论,针对大规模数据分类问题中已标注样本获取代价高、数量有限而未标注样本大量存在、易于获取的典型特征,重点选取实际应用中的大规模、多模态数据作为研究对象,设计和提出一种新型的双向主动学习算法,并在此框架下研究信息双向挖掘模式设计、模型调优与重构协同优化、高效人机交互机制探索创新、算法融合扩展等关键问题,最终形成一整套行之有效的研究方案,以解决大数据环境下海量信息的智能化、低成本化知识获取及分类问题。本项目以信息智能分析算法理论研究为基础,以数据挖掘、机器学习为指导,以人机交互为桥梁,深入研究双向主动学习方法及其应用,解决其中存在的若干关键问题,其研究成果不仅可以促进相关领域的学术研究,而且能够推动信息智能分析的相关实际应用,具有较强的创新性和实用性。本项目按照研究计划逐步开展、顺利实施,突破了若干关键技术,解决了实际应用中的难点问题,形成了海量数据高效智能分析解决方案和原型系统,圆满完成了既定目标,通过大规模数据库上开展的充分实验,验证了本项目所提出方法的有效性。基于本项目研究工作,在国内外高水平期刊、会议上发表学术论文21篇,申请发明专利6项,培养和指导博士/硕士研究生多名。研究成果荣获多项科技奖励,包括:省部级科学技术二等奖1项、省部级科技论文三等奖3项、学术会议优秀论文奖1项。研究成果在创新性和实用性方面获得同行专家的认可。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
5

物联网中区块链技术的应用与挑战

物联网中区块链技术的应用与挑战

DOI:10.3969/j.issn.0255-8297.2020.01.002
发表时间:2020

张晓宇的其他基金

批准号:11326223
批准年份:2013
资助金额:3.00
项目类别:数学天元基金项目
批准号:11702063
批准年份:2017
资助金额:27.00
项目类别:青年科学基金项目
批准号:U1304801
批准年份:2013
资助金额:30.00
项目类别:联合基金项目
批准号:61871378
批准年份:2018
资助金额:61.00
项目类别:面上项目
批准号:31401654
批准年份:2014
资助金额:24.00
项目类别:青年科学基金项目
批准号:61304024
批准年份:2013
资助金额:20.00
项目类别:青年科学基金项目
批准号:51775459
批准年份:2017
资助金额:63.00
项目类别:面上项目
批准号:51702115
批准年份:2017
资助金额:23.00
项目类别:青年科学基金项目
批准号:41201065
批准年份:2012
资助金额:28.00
项目类别:青年科学基金项目
批准号:11501032
批准年份:2015
资助金额:18.00
项目类别:青年科学基金项目

相似国自然基金

1

局部学习方法及其应用研究

批准号:60975037
批准年份:2009
负责人:向世明
学科分类:F0603
资助金额:32.00
项目类别:面上项目
2

面向异分布数据的主动学习方法

批准号:61502117
批准年份:2015
负责人:吴伟宁
学科分类:F0605
资助金额:21.00
项目类别:青年科学基金项目
3

跨模态人脸特征学习方法及其应用研究

批准号:61403024
批准年份:2014
负责人:金一
学科分类:F0304
资助金额:26.00
项目类别:青年科学基金项目
4

叶片双向光谱模型及其农业应用研究

批准号:40701121
批准年份:2007
负责人:颜春燕
学科分类:D0113
资助金额:19.00
项目类别:青年科学基金项目