海量数据处理中面向任务加速的数据调度策略研究

基本信息
批准号:61300033
项目类别:青年科学基金项目
资助金额:27.00
负责人:任祖杰
学科分类:
依托单位:杭州电子科技大学
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:施巍松,殷昱煜,王朋涛,应俊,朱宝金,陈恂,宣慧嘉,洪晓龙
关键词:
数据调度数据传输数据分发海量数据处理数据预取
结项摘要

With the rapid growth of data volume in many fields such as Internet application, financial telecoms and health care, high-performance massive data processing techniques are required to deal with such big data.Task scheduling and data scheduling optimizations are proved to be effective solutions for upgrading the performance of massive data processing system. Traditional data scheduling focuses on data storage,transfer,copy and replication management, aiming to improve the utilization ratio of storage resource and data access QoS, instead of directly serving the process of task execution. This proposal revisits data scheduling issue from the perspective of task acceleration, and explores the strategies of data prefetch, parallel transfer and distribution for task execution procedure on a massive data processing framework. Data scheduling for task acceleration overcomes the limitation of lack-responsivity to task execution of traditional data scheduling, degrades data I/O cost during the task execution, implements a high-efficiency data scheduling between computation nodes and storage nodes, thereby improving the massive data process system performance.

目前,在互联网应用、金融电信、医疗健康等诸多领域,数据量正在急剧膨胀。为挖掘这些庞大数据潜在的科学或商业价值,需要依赖高效的海量数据处理系统。优化任务调度与数据调度成为提升海量数据处理系统性能的两个重要手段。传统数据调度关注于数据存放、迁移,复制及副本管理,用于提高存储资源利用率及数据访问服务质量。这类调度操作并非针对任务执行过程,因而对任务执行中的数据I/O优化存在响应度不足的局限性。本项目针对海量数据处理任务复杂的计算过程,以降低数据I/O开销、加快任务执行效率为目标,研究面向任务加速的数据调度策略,涵盖数据智能预取、数据协同传输、数据均衡分发等调度策略。面向任务加速的数据调度策略克服传统数据调度的局限性,充分降低任务执行中数据I/O开销,实现计算节点、存储节点间的高效数据调度,对海量数据处理性能提升有重大意义。

项目摘要

目前,在互联网应用、金融电信、医疗健康等诸多领域,数据量正在急剧膨胀。为挖掘这些庞大数据潜在的科学或商业价值,需要依赖高效的海量数据处理系统。优化任务调度与数据调度成为提升海量数据处理系统性能的两个重要手段。传统数据调度关注于数据存放、迁移,复制及副本管理,用于提高存储资源利用率及数据访问服务质量。这类调度操作并非针对任务执行过程,因而对任务执行中的数据I/O优化存在响应度不足的局限性。本项目针对海量数据处理任务复杂的计算过程,以降低数据I/O开销、加快任务执行效率为目标,研究面向任务加速的数据调度策略,涵盖数据智能预取、数据协同传输、数据均衡分发等调度策略。面向任务加速的数据调度策略克服传统数据调度的局限性,充分降低任务执行中数据I/O开销,实现计算节点、存储节点间的高效数据调度,对海量数据处理性能提升有重大意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

面向云工作流安全的任务调度方法

面向云工作流安全的任务调度方法

DOI:10.7544/issn1000-1239.2018.20170425
发表时间:2018
3

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
4

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
5

混采地震数据高效高精度分离处理方法研究进展

混采地震数据高效高精度分离处理方法研究进展

DOI:10.3969/j.issn.1000-1441.2020.05.004
发表时间:2020

任祖杰的其他基金

相似国自然基金

1

面向动态众核的遥感数据处理任务双向调度方法研究

批准号:41701468
批准年份:2017
负责人:张万峰
学科分类:D0114
资助金额:21.00
项目类别:青年科学基金项目
2

倾斜任务调度模型及其在医疗大数据处理中的应用研究

批准号:61572176
批准年份:2015
负责人:唐卓
学科分类:F0204
资助金额:65.00
项目类别:面上项目
3

面向FAST的海量数据处理关键技术研究

批准号:U1531246
批准年份:2015
负责人:朱明
学科分类:A1503
资助金额:200.00
项目类别:联合基金项目
4

基于数据密集指数模型的大尺度遥感数据处理任务调度与执行优化

批准号:41401512
批准年份:2014
负责人:马艳
学科分类:D0113
资助金额:25.00
项目类别:青年科学基金项目