高维流式大数据的增量特征提取算法研究

基本信息
批准号:61702270
项目类别:青年科学基金项目
资助金额:22.00
负责人:谈超
学科分类:
依托单位:南京师范大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:吉根林,宋凤义,周星星,曹中义,孙鸿艳
关键词:
高维流式大数据增量特征提取
结项摘要

Big data streaming is a process in which large streams of real-time data are processed with the sole aim of extracting insights and useful trends out of it. It is an important research domain in big data era and has wide application prospects in many fields, such as business intelligence, marketing and public services. However, big data stream has exhibited a remarkably dynamic characteristics and its noise distribution is also more complicated, at the same time, there are unavoidable errors in feature extraction for the high dimensional big data stream. Such situations present new challenges for the traditional machine learning and data mining algorithms, especially in the big data stream feature extraction, which is important for the data stream mining. This project thus proposes to optimize the incremental feature extraction algorithms for big data steam. Firstly, according to the dynamic changing characteristics of big data streams, an adaptive incremental feature extraction algorithm is proposed to realize the effective learning of high dimensional data stream. Secondly, a robust incremental feature extraction algorithm is proposed to achieve robust learning of high dimensional data stream according to the big data streams in the environment with noise, this algorithm can also reduce the computational complexity. Finally, an incremental feature extraction optimization algorithm based on regularization is designed. This is aiming at the unavoidable dimensionality reduction errors generated in the feature extraction process for the high dimensional data stream. In summary, this project enacts an effective theory support and technology for adaptive incremental learning in big data mining by the optimization of feature extraction for the high dimensional big data stream.

流式大数据作为大数据的一种重要形态,有着广泛的应用前景。然而,在高维流式大数据的处理过程中,现有机器学习和数据挖掘算法存在难以处理动态特征、噪音环境下算法复杂度高以及特征提取中误差大等问题。为了发现高维数据流内在的结构信息,为后续学习任务的高效顺利进行提供支撑,本项目针对高维流式大数据的增量特征提取算法展开研究:首先,针对流式大数据特征呈动态变化的特点,研究自适应增量特征提取算法,实现高维数据流的有效学习;其次,针对噪音环境下的流式大数据,研究具有鲁棒性的增量特征提取算法,实现高维数据流的鲁棒学习;最后,针对高维数据流特征提取过程中不可避免地产生的降维误差问题,研究基于正则化的增量特征提取优化算法,得到适应不同环境的增量学习优化模型,提高学习效率。项目研究成果将为流式大数据的增量学习提供有效的理论支撑和良好的技术借鉴,实现高维数据流的高效学习,具有重要的理论意义和应用价值。

项目摘要

流式大数据作为大数据的一种重要形态,有着广泛的应用前景。为了发现高维数据流内在的结构信息,为后续学习任务的高效顺利进行提供支撑,本项目针对高维流式大数据的增量特征提取算法展开研究:首先,针对流式大数据特征呈动态变化的特点,研究了自适应学习因子,提出一种新的基于增量切空间的自适应流式大数据学习算法,实现高维数据流的有效学习;其次,针对噪音环境下的流式大数据,设计鲁棒增量特征提取算法,提出了一种基于鲁棒回归的多标签分布降维算法,实现高维数据流的鲁棒学习;最后,针对高维数据流特征提取过程中不可避免地产生的降维误差问题,研究基于正则化的增量学习优化框架,提出了一种结合切空间及特征空间校准的增量流形学习正则优化算法,得到适应不同环境的增量学习优化模型,提高学习效率。.项目在研期间负责人以第一作者身份撰写的论文发表于CCF推荐的A类顶级期刊TKDE,人工智能领域国际顶级学术期刊TCYB(SCI TOP期刊,CCF B,中科院一区,JCR一区,最新影响因子为11.079),CCF C类著名国际学术会议PRICAI,SCI检索的国际学术期刊TST,CCF推荐的A类中文最顶级期刊《计算机研究与发展》等发表论文6篇,指导学术型研究生两名,毕业一名,项目组申请并授权专利一项,项目研究成果将为流式大数据的增量学习提供有效的理论支撑和良好的技术借鉴,实现高维数据流的高效学习,具有重要的理论意义和应用价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
3

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015
4

基于分形维数和支持向量机的串联电弧故障诊断方法

基于分形维数和支持向量机的串联电弧故障诊断方法

DOI:
发表时间:2016
5

基于二维材料的自旋-轨道矩研究进展

基于二维材料的自旋-轨道矩研究进展

DOI:10.7498/aps.70.20210004
发表时间:2021

谈超的其他基金

相似国自然基金

1

基于高维地理数据特征提取的空间数据分析算法研究

批准号:61603293
批准年份:2016
负责人:梁栋
学科分类:F0603
资助金额:21.00
项目类别:青年科学基金项目
2

独立分量分析算法及其在高维数据特征提取中应用研究

批准号:61573014
批准年份:2015
负责人:冶继民
学科分类:F0304
资助金额:51.00
项目类别:面上项目
3

面向流式大数据检索的增量哈希学习方法研究

批准号:61702394
批准年份:2017
负责人:王笛
学科分类:F0211
资助金额:26.00
项目类别:青年科学基金项目
4

基于高维数据特征提取的蛋白质二级结构预测

批准号:61375013
批准年份:2013
负责人:刘毅慧
学科分类:F0304
资助金额:73.00
项目类别:面上项目