DFS-NetEye: 基于网络度量的分布式文件系统读写调度关键技术研究

基本信息
批准号:61662019
项目类别:地区科学基金项目
资助金额:34.00
负责人:周辉
学科分类:
依托单位:海南大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:段玉聪,常颖,张雨,姚碧圆,黄福武,姜帅,李长远
关键词:
HDFS分布式文件系统网络度量可用带宽
结项摘要

When distributed file system managing big data, it also brings massive parallel data transmission that may lead to regional network congestion and imbalanced usage. .Research has found that, the chunk selection strategy employed by distributed file system can be optimized. The key point is to measure the network status of a distributed system in a real-time manner, and to choose reasonable data node in response to each incoming read/write request. .To prove this idea, this project proposes DFS-NetEye, a network measurement and scheduling system. We explore the possibility of building an open scheduling algorithm test framework, as well as establishing network workload evaluation architecture.

分布式文件系统在管理海量数据的同时,也带来大量并发的网络传输,容易引发或加剧局部网络的拥塞,进而导致数据中心内部网络的不均衡使用。研究发现分布式文件系统读写操作中所采用的数据块选择策略,存在较大的优化空间。关键问题在于如何让系统实时感知其所处网络的状况及变化,在挑选目标数据节点时避开拥塞的网络区域,从而确保网络资源的负载均衡。为证明此设想,在不改变HDFS高容错性和高吞吐量等已有特性的情况下,研发网络度量框架DFS-NetEye,探索读写调度算法通用测试框架,尝试建立网络负载均衡评价体系。

项目摘要

为充分利用所有节点的存储资源以提供超大吞吐量的数据处理服务,也为了在部分节点或网络发生故障时不丢失数据,数据中心越来越多地部署了分布式文件系统,并在此基础上运行着大型数据处理任务。分布式文件系统快速并发地处理着海量的数据,同时也占用了海量的带宽资源,容易引发或加剧局部网络的拥塞,进而导致数据密集型集群内部网络资源的不均衡使用。迫切需要提升分布式文件系统读写操作的网络效率,更均衡地使用网络资源,更高效地管理海量数据集。.本项目研究基于网络度量的分布式文件系统读写调度关键技术,研究如何在名字节点和大量数据节点组成的集群上,让每一个节点都能快速感知周边网络的状况及变化,并据此优化读写操作中的节点选择与路径规划技术,从而更均衡合理地使用网络资源。.本项目按计划顺利执行完成,主要研究三个方面的内容。首先,研究基于分布式文件系统读写调度关键技术,构建网络度量与调度子系统DFS-NetEye。其次,提出了基于端到端可用带宽的度量技术,从理论模型、模拟仿真、到依托计算机集群资源开展实验,验证了技术的可行性。然后,深入拆解了以HDFS为代表的分布式文件系统,把网络度量与感知技术加入到了分布式文件系统的实现中。.项目组的研究取得了两个重要结果,分别是基于主动探测机制的端到端网络度量技术和基于网络度量技术的DFS-NetEye。随着大数据处理需求的快速增长,分布式文件系统的网络均衡性问题将会受到越来越多的关注,各种调度算法都有可能出现,每种算法都有其最佳使用场景和不适用的极端情况。为减少重复工作,也为了让调度算法的研究更便捷高效,项目组分类整理了适用于中小规模集群的测试数据集。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
2

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015
3

基于FTA-BN模型的页岩气井口装置失效概率分析

基于FTA-BN模型的页岩气井口装置失效概率分析

DOI:10.16265/j.cnki.issn1003-3033.2019.04.015
发表时间:2019
4

基于图卷积网络的归纳式微博谣言检测新方法

基于图卷积网络的归纳式微博谣言检测新方法

DOI:10.3785/j.issn.1008-973x.2022.05.013
发表时间:2022
5

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021

周辉的其他基金

批准号:40172075
批准年份:2001
资助金额:6.00
项目类别:面上项目
批准号:20902114
批准年份:2009
资助金额:19.00
项目类别:青年科学基金项目
批准号:49902020
批准年份:1999
资助金额:16.00
项目类别:青年科学基金项目
批准号:91856108
批准年份:2018
资助金额:75.00
项目类别:重大研究计划
批准号:40974069
批准年份:2009
资助金额:40.00
项目类别:面上项目
批准号:21402021
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:21672031
批准年份:2016
资助金额:65.00
项目类别:面上项目
批准号:40574053
批准年份:2005
资助金额:34.00
项目类别:面上项目
批准号:31571811
批准年份:2015
资助金额:65.00
项目类别:面上项目
批准号:50204009
批准年份:2002
资助金额:25.00
项目类别:青年科学基金项目
批准号:21577004
批准年份:2015
资助金额:66.00
项目类别:面上项目
批准号:40104004
批准年份:2001
资助金额:20.00
项目类别:青年科学基金项目
批准号:41172288
批准年份:2011
资助金额:65.00
项目类别:面上项目
批准号:50579091
批准年份:2005
资助金额:30.00
项目类别:联合基金项目
批准号:10772190
批准年份:2007
资助金额:36.00
项目类别:面上项目
批准号:31101334
批准年份:2011
资助金额:22.00
项目类别:青年科学基金项目
批准号:40901165
批准年份:2009
资助金额:18.00
项目类别:青年科学基金项目
批准号:41630314
批准年份:2016
资助金额:250.00
项目类别:重点项目
批准号:41874130
批准年份:2018
资助金额:64.00
项目类别:面上项目
批准号:50979104
批准年份:2009
资助金额:39.00
项目类别:面上项目

相似国自然基金

1

网格文件系统关键技术研究

批准号:60573135
批准年份:2005
负责人:肖侬
学科分类:F0207
资助金额:25.00
项目类别:面上项目
2

分布式设备多目标协同制造的网络综合调度关键技术研究

批准号:61772160
批准年份:2017
负责人:谢志强
学科分类:F0201
资助金额:65.00
项目类别:面上项目
3

分布式闪存文件系统的高效构建技术研究

批准号:61772300
批准年份:2017
负责人:陆游游
学科分类:F0204
资助金额:78.00
项目类别:面上项目
4

分布式文件系统通用化性能评测与缓存调度方法研究

批准号:61702254
批准年份:2017
负责人:顾荣
学科分类:F0204
资助金额:23.00
项目类别:青年科学基金项目