海量数据处理中面向任务加速的数据调度策略研究

基本信息
批准号:61300033
项目类别:青年科学基金项目
资助金额:27.00
负责人:任祖杰
学科分类:
依托单位:杭州电子科技大学
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:施巍松,殷昱煜,王朋涛,应俊,朱宝金,陈恂,宣慧嘉,洪晓龙
关键词:
数据调度数据传输数据分发海量数据处理数据预取
结项摘要

With the rapid growth of data volume in many fields such as Internet application, financial telecoms and health care, high-performance massive data processing techniques are required to deal with such big data.Task scheduling and data scheduling optimizations are proved to be effective solutions for upgrading the performance of massive data processing system. Traditional data scheduling focuses on data storage,transfer,copy and replication management, aiming to improve the utilization ratio of storage resource and data access QoS, instead of directly serving the process of task execution. This proposal revisits data scheduling issue from the perspective of task acceleration, and explores the strategies of data prefetch, parallel transfer and distribution for task execution procedure on a massive data processing framework. Data scheduling for task acceleration overcomes the limitation of lack-responsivity to task execution of traditional data scheduling, degrades data I/O cost during the task execution, implements a high-efficiency data scheduling between computation nodes and storage nodes, thereby improving the massive data process system performance.

目前,在互联网应用、金融电信、医疗健康等诸多领域,数据量正在急剧膨胀。为挖掘这些庞大数据潜在的科学或商业价值,需要依赖高效的海量数据处理系统。优化任务调度与数据调度成为提升海量数据处理系统性能的两个重要手段。传统数据调度关注于数据存放、迁移,复制及副本管理,用于提高存储资源利用率及数据访问服务质量。这类调度操作并非针对任务执行过程,因而对任务执行中的数据I/O优化存在响应度不足的局限性。本项目针对海量数据处理任务复杂的计算过程,以降低数据I/O开销、加快任务执行效率为目标,研究面向任务加速的数据调度策略,涵盖数据智能预取、数据协同传输、数据均衡分发等调度策略。面向任务加速的数据调度策略克服传统数据调度的局限性,充分降低任务执行中数据I/O开销,实现计算节点、存储节点间的高效数据调度,对海量数据处理性能提升有重大意义。

项目摘要

目前,在互联网应用、金融电信、医疗健康等诸多领域,数据量正在急剧膨胀。为挖掘这些庞大数据潜在的科学或商业价值,需要依赖高效的海量数据处理系统。优化任务调度与数据调度成为提升海量数据处理系统性能的两个重要手段。传统数据调度关注于数据存放、迁移,复制及副本管理,用于提高存储资源利用率及数据访问服务质量。这类调度操作并非针对任务执行过程,因而对任务执行中的数据I/O优化存在响应度不足的局限性。本项目针对海量数据处理任务复杂的计算过程,以降低数据I/O开销、加快任务执行效率为目标,研究面向任务加速的数据调度策略,涵盖数据智能预取、数据协同传输、数据均衡分发等调度策略。面向任务加速的数据调度策略克服传统数据调度的局限性,充分降低任务执行中数据I/O开销,实现计算节点、存储节点间的高效数据调度,对海量数据处理性能提升有重大意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

智能煤矿建设路线与工程实践

智能煤矿建设路线与工程实践

DOI:10.13199/j.cnki.cst.2020.07.010
发表时间:2020
2

基于PROSAIL模型和多角度遥感数据的森林叶面积指数反演

基于PROSAIL模型和多角度遥感数据的森林叶面积指数反演

DOI:10.11707/j.1001-7488.20210410
发表时间:2021
3

区块链技术:从数据智能到知识自动化

区块链技术:从数据智能到知识自动化

DOI:
发表时间:2017
4

综述:基于轨道角动量光子态的高维量子密钥分发

综述:基于轨道角动量光子态的高维量子密钥分发

DOI:10.3969/j.issn.1007-5461.2022.01.004
发表时间:2022
5

爆震波与非预混燃料射流相互作用的研究

爆震波与非预混燃料射流相互作用的研究

DOI:10.13675/j.cnki.tjjs.200535
发表时间:2021

任祖杰的其他基金

相似国自然基金

1

面向动态众核的遥感数据处理任务双向调度方法研究

批准号:41701468
批准年份:2017
负责人:张万峰
学科分类:D0114
资助金额:21.00
项目类别:青年科学基金项目
2

倾斜任务调度模型及其在医疗大数据处理中的应用研究

批准号:61572176
批准年份:2015
负责人:唐卓
学科分类:F0204
资助金额:65.00
项目类别:面上项目
3

面向FAST的海量数据处理关键技术研究

批准号:U1531246
批准年份:2015
负责人:朱明
学科分类:A1503
资助金额:200.00
项目类别:联合基金项目
4

基于数据密集指数模型的大尺度遥感数据处理任务调度与执行优化

批准号:41401512
批准年份:2014
负责人:马艳
学科分类:D0113
资助金额:25.00
项目类别:青年科学基金项目