面向分布式存储大数据的极速学习机集成方法研究

基本信息
批准号:61503252
项目类别:青年科学基金项目
资助金额:20.00
负责人:何玉林
学科分类:
依托单位:深圳大学
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:尹剑飞,Rana Aamir Raza Ashfaq,Md Abdul Masud,曹伟朋,张文斌,赵兴敏
关键词:
极速学习机简单随机抽样概率密度估计分布式存储大数据集成学习
结项摘要

How to apply the divide-and-conquer strategies to effectively handle the classification problem of big data stored in distributed systems is a big challenge in the filed of big data analysis. In order to tackle this challenge, this project proposal proposes a dynamically selective ensemble learning strategy based on a new machine learning scheme, named extreme learning machine (ELM) which has a very fast training speed and good generalization performance. The main research tasks include: (1) sampling and partitioning to distributed big data based on probability density estimation technology; (2) the uncertainty minimization-based selective ensemble learning algorithm and theory; and (3) the optimized MapReduce implementation to ELM ensemble learning model and its application to smart grid big data. The expected outcomes of this project will set up the theoretical foundations for dividing distributed big data and fusing base ELM models and provide a distributed algorithm framework for development of ELM-based ensemble learning. The outcomes will also provide the implementation technologies for applications of distributed big data classification with the high availability and fault-tolerance. The research results will promote technology innovation and industrial upgrading in the research areas of distributed big data.

如何利用分治-融合快速有效地处理分布式存储大数据的分类问题是当前大数据研究的挑战之一。针对这一挑战,本项目在充分利用极速学习机(Extreme Learning Machine-ELM)训练速度快和泛化能力好优势的基础上,通过对分布式存储大数据执行基于概率密度函数估计的分治,构建不确定性框架下的ELM融合模型,使之能有效地解决TB级分布式存储大数据的分类问题。主要的研究内容包括:(1)基于概率密度估计的分布式存储大数据抽样与划分方法;(2)不确定性框架下的动态选择性ELM集成学习算法与理论;(3)分布式ELM集成模型的MapReduce优化实现及其在智能电网大数据中的应用。预期研究成果将为针对分布式存储大数据的分治-融合提供理论基础,为分布式ELM集成学习系统的设计提供算法框架,为分布式存储大数据的分类应用提供高可用性和高容错能力的实现技术,促进分布式存储大数据研究的技术创新和产业升级。

项目摘要

如何利用分治-融合快速有效地处理分布式存储大数据的分类问题是当前大数据研究的挑战之一。针对这一挑战,本项目在充分利用极速学习机(Extreme Learning Machine-ELM)训练速度快和泛化能力好优势的基础上,通过对分布式存储大数据执行基于概率密度函数估计的分治,构建不确定性框架下的ELM融合模型,使之能有效地解决TB级分布式存储大数据的分类问题。主要的研究内容包括:(1)基于概率密度估计的分布式存储大数据抽样与划分方法;(2)不确定性框架下的动态选择性ELM集成学习算法与理论;(3)分布式ELM集成模型的MapReduce优化实现及其在智能电网大数据中的应用。预期研究成果将为针对分布式存储大数据的分治-融合提供理论基础,为分布式ELM集成学习系统的设计提供算法框架,为分布式存储大数据的分类应用提供高可用性和高容错能力的实现技术,促进分布式存储大数据研究的技术创新和产业升级。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

基于FTA-BN模型的页岩气井口装置失效概率分析

基于FTA-BN模型的页岩气井口装置失效概率分析

DOI:10.16265/j.cnki.issn1003-3033.2019.04.015
发表时间:2019
4

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
5

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

DOI:10.3969/j.issn.1674-0858.2020.04.30
发表时间:2020

何玉林的其他基金

相似国自然基金

1

面向非欧几何数据的分布式内存数据库存储方法研究

批准号:61702250
批准年份:2017
负责人:徐子晨
学科分类:F0202
资助金额:29.00
项目类别:青年科学基金项目
2

基于分治融合与主动学习的极速学习机方法研究

批准号:61402460
批准年份:2014
负责人:王冉
学科分类:F0605
资助金额:24.00
项目类别:青年科学基金项目
3

基于张量极速学习机的多模生物特征融合识别方法

批准号:61673316
批准年份:2016
负责人:张新曼
学科分类:F0304
资助金额:61.00
项目类别:面上项目
4

面向大数据的渐进式集成学习方法与分布式算法研究

批准号:61473194
批准年份:2014
负责人:黄哲学
学科分类:F0603
资助金额:80.00
项目类别:面上项目