Continued growth in cloud computing places a premium on cost-efficient data center topology design. As a result, reconfigurable data center topology, based on optical circuit switching technologies, has been proposed. Since data center traffic is highly bursty (subject to change within tens of milliseconds), existing proposals have been devoted to minimizing the reconfiguration latency, in order to catch up with the fast-changing data center traffic. However, frequent reconfiguration brings about significant risk to data center operations, hindering its deployment in commercial data centers. In order to reduce the risk of frequent reconfiguration, this project proposes low-frequency reconfigurable topology for the first time. Based on a few months' observation of data center traffic history, we find that data center traffic exhibits some clustering effect. These clusters are slow-varying. If we can design a robust topology based on these traffic clusters, it would be possible that a single topology can handle traffic dynamics in a relative long period of time. This idea also lays the foundation for low frequency topology engineering. This project provides a concrete theoretical analysis and system design for low frequency reconfiguration topology design.
随着云计算的发展,如何以更低的代价构建更高效的数据中心变得至关重要。为此,基于光交换机的动态数据中心拓扑结构应运而生。由于数据中心的流量变化极快(毫秒量级),现有的研究往往致力于如何在微妙量级完成拓扑切换,以使拓扑结构的变化跟上流量的变化。然而,频繁地切换拓扑结构会严重影响数据中心网络的可靠性,使得动态拓扑结构很难应用于实际数据中心系统。为了解决高频切换带来的风险,该项目首次提出低频动态拓扑结构。我们通过观察数据中心数月间的流量变化,发现数据中心的流量具备某些长期分布特性,且该长期分布特性变化缓慢。如果可以根据该长期分布特性对数据中心拓扑结构进行鲁棒性优化,我们得到的拓扑结构就能够在相对较长的时间内很好地处理快速变化的数据中心流量。这就为低频拓扑结构的设计奠定了基础。该项目就低频动态拓扑结构的理论基础与系统设计进行了深入的分析。
背景:随着应用对带宽的需求越来越高,传统胖树架构数据中心的网络功耗已逐步达到难以承受的程度。光交换机由于具有功耗低、带宽高的特点,若能替换数据中心内的部分电交换机,将能有效提升数据中心的带宽功耗比。然而,与电交换机相比,光交换机灵活度较差,难以根据数据中心流量的突发实时切换连接方式。..研究内容:本项目探索一种全新的基于慢切换的光电混合网络控制方案,旨在降低光电混合数据中心的控制难度,降低落地门槛。谷歌2022年8月份新公布的光电混合数据中心采用的也是慢切换。相比之下,前人工作普遍认为应对流量突发必须快速光切换。..主要成果:.1 光交换机与电交换机如何互连:.在数据中心搭建初期,我们需要设计光交换机与电交换机的互连方式,并提供性能保障。这里的挑战是数据中心尚未开始运行,因此流量模式未知。我们首次提出利用“竞争比”来衡量光电交换机之间不同互连方式的理论最坏性能保障,并分析了文献中常见的互连方式的理论性能。成果发表于SIGMETRICS 2022。..2 光交换机如何控制:.我们发现数据中心汇聚层之间的流量具有“弱稳定性”,即历史流量矩阵构成的凸包能够覆盖99%以上的未来流量矩阵;通过针对历史流量凸包对光电混合数据中心拓扑进行鲁棒性优化,使其能够在不频繁切换拓扑的前提下仍能有效应对流量突发。该方法能够大幅降低光交换机切换的频率,使光电混合数据中心更易落地。成果于2022年被IEEE/ACM TON接收。..3 电交换机路由如何控制:.1)2中方案在路由层面采用传统WCMP,而WCMP在应对突发的同时会导致路径长度的增加。因此,我们提出了基于阈值分流的改进路由方案:未超过阈值的流量走最短路径;超过阈值的突发流量调度到其他路径。这种方法可以在不增加路径长度的前提下更好地应对突发,因此相比基于WCMP的方法具有更好的性能。该工作发表于ICNP 2021。.2)在光交换机配置确定后,光电混合数据中心的逻辑拓扑本质上是一个扁平直连拓扑。在这类拓扑中,ECMP/WCMP/KSP是几种常见的路由策略。然而,我们发现这些路由策略存在循环缓冲区依赖的概率接近于1。因此,如果我们在网络中开启PFC,网络就可能触发严重的死锁。我们提出了“虚拟上下路由”方案彻底消除了死锁。成果发表于NSDI 2023...科学意义:.论证了光电混合数据中心慢切换控制方案的可行性。部分成果应用于谷歌数据中心。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
监管的非对称性、盈余管理模式选择与证监会执法效率?
一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能
气相色谱-质谱法分析柚木光辐射前后的抽提物成分
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
快速铸造原型内腔结构设计机理研究及其拓扑优化
大规模水下移动传感器网络拓扑动态性及拓扑优化研究
面向最大交通承载能力的动态路径诱导与路网拓扑耦合优化方法
虚拟化数据中心内存资源预测与动态调配