面向流式数据的在线自步多任务特征学习研究

基本信息
批准号:61806044
项目类别:青年科学基金项目
资助金额:26.00
负责人:李长升
学科分类:
依托单位:电子科技大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:吕凤毛,刘冲,李钟琛,陈龙
关键词:
流式数据分析自步学习特征学习多任务学习
结项摘要

In recent years, A lot of attention has been paid to streaming data analysis from academic community and industry community. Streaming data often have the following characteristics: i) The feature dimension of inputs is often high, and there may be many redundant and noisy features; ii) there are often multiple outputs (or multiple tasks), and there are certain relationship among these outputs (tasks); iii) data is often evolving. In this project, based on these characteristics of streaming data, we will focus on designing a framework of online self-paced multi-task feature learning for dynamic data streams. Specifically, we first build a framework to conduct online multi-task learning and feature learning simultaneously, in order to mine inherent structure of data, and leverage it for improving the model performance. Based on the fact that humans often learn from easy concepts to hard ones in the cognitive process, we will introduce such learning regime to online multi-task learning, making the update of models in a self-paced way. Finally, we will conduct online multi-task feature learning and online self-paced multi-task learning in a unified framework to further improve the performance of the model. This project focuses on designing a series of algorithms for learning the structure of streaming data by leveraging multi-task learning, feature learning, and feature learning, which provides some theoretical insights and practical algorithms for real-world applications.

近年来,流式数据分析得到了学术界和工业界的广泛关注。流式数据常常呈现如下特点:i) 输入数据的特征表示是高维的;ii)输出变量是多维的或者有多个任务同时存在,且变量间或任务间具有某种相关性;iii)数据随着时间的变化会发生"演化"。在本项目中,针对上述流式数据的特点,本申请拟提出在线自步多任务特征学习对流式数据进行挖掘,主要包括:(1)探索建立在线多任务学习和特征学习的统一框架,挖掘流式数据的内在结构;(2)人类在学习的过程中常常先从简单的入手,慢慢再学习复杂的东西。基于这种学习机制,研究在线自步多任务学习算法模型,使得模型学习更加符合人类的学习方式;(3)融合(1)和(2),提出在线自步多任务特征学习的整体框架,进一步提高模型的准确度。本项目立足于借助多任务学习、特征学习和自步学习设计一系列算法,用来挖掘流式数据的内在结构,因此具有理论意义和应用前景。

项目摘要

本项目围绕在线自步多任务特征学习对流式数据进行挖掘,主要包括:(1)建立了在线多任务学习和特征学习的统一框架,挖掘流式数据的内在结构;(2)人类在学习的过程中常常先从简单的入手,慢慢再学习复杂的东西。基于这种学习机制,研究了在线自步多任务学习算法模型,使得模型学习更加符合人类的学习方式;(3)融合(1)和(2),提出了在线自步多任务特征学习的整体框架,进一步提高模型的准确度。共发表学术论文14篇,其中包括中科院JCR-1区期刊或者CCF A类论文10篇。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

DOI:
发表时间:
2

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

DOI:10.11842/wst.20190724002
发表时间:2020
3

智能煤矿建设路线与工程实践

智能煤矿建设路线与工程实践

DOI:10.13199/j.cnki.cst.2020.07.010
发表时间:2020
4

氧化应激与自噬

氧化应激与自噬

DOI:
发表时间:2016
5

现代优化理论与应用

现代优化理论与应用

DOI:10.1360/SSM-2020-0035
发表时间:2020

李长升的其他基金

相似国自然基金

1

基于自步学习的多任务聚类算法研究

批准号:61806043
批准年份:2018
负责人:任亚洲
学科分类:F0603
资助金额:26.00
项目类别:青年科学基金项目
2

面向多标签数据的自步流形学习方法研究

批准号:61806159
批准年份:2018
负责人:杨博
学科分类:F0605
资助金额:26.00
项目类别:青年科学基金项目
3

基于多任务的在线机器学习研究

批准号:61602356
批准年份:2016
负责人:李光夏
学科分类:F0201
资助金额:21.00
项目类别:青年科学基金项目
4

面向复杂数据的多任务学习方法与应用

批准号:61673364
批准年份:2016
负责人:徐林莉
学科分类:F0603
资助金额:62.00
项目类别:面上项目