双向主动学习方法及其应用研究

基本信息

批准号：61501457

项目类别：青年科学基金项目

资助金额：20.00

负责人：张晓宇

学科分类：

依托单位：中国科学院信息工程研究所

批准年份：2015

结题年份：2018

起止时间：2016-01-01 - 2018-12-31

项目状态：已结题

项目参与者：王勇,王海平,王振宇,张凯,王冲华,李明月,易佳

关键词：

分类算法主动学习信息论数据挖掘机器学习

结项摘要

In machine learning, active learning is an important method for effective information utilization, which actively queries the user for labels. In this project, we propose a novel bidirectional active learning algorithm, based on which network information security is studied as an application. To cope with the issue where the labeled instances are limited while the unlabeled instances are abundant and easy to access, we will propose an effective framework for effective classification via two-way exploration into labeled and unlabeled dataset, coordination between model update and upgrade, optimization of human-computer interaction, fusion and extension of existing algorithms, and so on. This project aims at exploring the effective solution for massive data classification through active learning, which is derived from the intensive study of data mining and machine learning. Based on large-scale data analysis, some key issues are to be addressed with the combination of empirical and data-driven techniques. This research work is innovative and practical, which will promote the advance of academic studies and stimulate related applications.

在分类问题中，主动学习能够主动地、有针对地选择最有价值的样本交给专家标注，是一种最大化信息使用效率的机器学习方法。本项目围绕主动学习算法理论，针对大规模数据分类问题中已标注样本获取代价高、数量有限而未标注样本大量存在、易于获取的典型特征，重点选取网络信息安全领域数据作为研究对象，设计和提出一种新型的双向主动学习算法，并在此框架下研究信息双向挖掘模式设计、模型调优与重构协同优化、高效人机交互机制探索创新、算法融合扩展等关键问题，最终形成一整套行之有效的研究方案，以解决大数据环境下海量信息的智能化、低成本化知识获取及分类问题。本项目以信息智能分析算法理论研究为基础，以数据挖掘、机器学习为指导，以人机交互为桥梁，深入研究双向主动学习方法及其应用，解决其中存在的若干关键问题，其研究成果不仅可以促进相关领域的学术研究，而且能够推动信息智能分析的相关实际应用，具有较强的创新性和实用性。

项目摘要

基于大规模数据的高效分析建模是一项具有重要研究意义和应用价值的课题。主动学习通过主动地、有针对地选择最有价值的样本进行标注，实现专家经验的高效利用，是一种最大化信息使用效率的机器学习方法。本项目围绕主动学习算法理论，针对大规模数据分类问题中已标注样本获取代价高、数量有限而未标注样本大量存在、易于获取的典型特征，重点选取实际应用中的大规模、多模态数据作为研究对象，设计和提出一种新型的双向主动学习算法，并在此框架下研究信息双向挖掘模式设计、模型调优与重构协同优化、高效人机交互机制探索创新、算法融合扩展等关键问题，最终形成一整套行之有效的研究方案，以解决大数据环境下海量信息的智能化、低成本化知识获取及分类问题。本项目以信息智能分析算法理论研究为基础，以数据挖掘、机器学习为指导，以人机交互为桥梁，深入研究双向主动学习方法及其应用，解决其中存在的若干关键问题，其研究成果不仅可以促进相关领域的学术研究，而且能够推动信息智能分析的相关实际应用，具有较强的创新性和实用性。本项目按照研究计划逐步开展、顺利实施，突破了若干关键技术，解决了实际应用中的难点问题，形成了海量数据高效智能分析解决方案和原型系统，圆满完成了既定目标，通过大规模数据库上开展的充分实验，验证了本项目所提出方法的有效性。基于本项目研究工作，在国内外高水平期刊、会议上发表学术论文21篇，申请发明专利6项，培养和指导博士/硕士研究生多名。研究成果荣获多项科技奖励，包括：省部级科学技术二等奖1项、省部级科技论文三等奖3项、学术会议优秀论文奖1项。研究成果在创新性和实用性方面获得同行专家的认可。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：10.13334/j.0258-8013.pcsee.190276

发表时间：2020

DOI：10.3778/j.issn.1002-8331.1903-0411

发表时间：2020

DOI：10.19328/j.cnki.2096-8655.2022.02.002

发表时间：2022

DOI：10.13199/j.cnki.cst.2020.07.010

发表时间：2020

张晓宇的其他基金

批准号：11326223

批准年份：2013

资助金额：3.00

项目类别：数学天元基金项目

批准号：11702063

批准年份：2017

资助金额：27.00

项目类别：青年科学基金项目

批准号：U1304801

批准年份：2013

资助金额：30.00

项目类别：联合基金项目

批准号：61871378

批准年份：2018

资助金额：61.00

项目类别：面上项目

批准号：31401654

批准年份：2014

资助金额：24.00

项目类别：青年科学基金项目

批准号：61304024

批准年份：2013

资助金额：20.00

项目类别：青年科学基金项目

批准号：51775459

批准年份：2017

资助金额：63.00

项目类别：面上项目

批准号：51702115

批准年份：2017

资助金额：23.00

项目类别：青年科学基金项目

批准号：41201065

批准年份：2012

资助金额：28.00

项目类别：青年科学基金项目

批准号：11501032

批准年份：2015

资助金额：18.00

项目类别：青年科学基金项目

相似国自然基金

局部学习方法及其应用研究

批准号：60975037

批准年份：2009

负责人：向世明

学科分类：F0603

资助金额：32.00

项目类别：面上项目

面向异分布数据的主动学习方法

批准号：61502117

批准年份：2015

负责人：吴伟宁

学科分类：F0605

资助金额：21.00

项目类别：青年科学基金项目

跨模态人脸特征学习方法及其应用研究

批准号：61403024

批准年份：2014

负责人：金一

学科分类：F0304

资助金额：26.00

项目类别：青年科学基金项目

叶片双向光谱模型及其农业应用研究

批准号：40701121

批准年份：2007

负责人：颜春燕

学科分类：D0113

资助金额：19.00

项目类别：青年科学基金项目

双向主动学习方法及其应用研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于铁路客流分配的旅客列车开行方案调整方法

多能耦合三相不平衡主动配电网与输电网交互随机模糊潮流方法

新型树启发式搜索算法的机器人路径规划

"多对多"模式下GEO卫星在轨加注任务规划

智能煤矿建设路线与工程实践

张晓宇的其他基金

Keller-Segel模型的爆炸解问题的新数值方法

SMILE联合快速角膜胶原交联的生物力学效应及愈合机制研究

经典瞬时感受器电位通道(TRPC)在哮喘气道平滑肌细胞增殖中的作用及其机制研究

社交媒体大数据智能分析与感知

小分子糖影响玉米淀粉老化机制的理论及实验研究

不确定切换系统的鲁棒积分滑模控制及在矿井电气设备中的应用

核辐照影响锆合金的微动磨损特性研究

零维钙钛矿Cs4PbBr6量子点的合成及电致发光性能研究

博格达峰地区雪冰中的污染物信息及成因研究

非线性抛物型偏微分方程奇异问题的高精度紧致有限体积法的开发及其数值分析

相似国自然基金