As a prominent network abstraction, coflow models efficiently capture communication patterns in data centers. Since coflow scheduling in large-scale data centers is $\mathcal{NP}$-hard, the existing literature has predominantly focused on limited environments with $m=2$ network cores, relying on flow splitting, which introduces substantial operational overhead. Crucially, no approximation algorithm with provable performance guarantees has been proposed for the more practical, non-splitting coflow scheduling problem, even for the $m=2$ case, let alone for general hybrid architectures. To bridge this critical gap, this paper investigates the non-splitting problem within a hybrid, heterogeneous parallel network featuring multiple network cores ($m \ge 2$) composed of Electronic Packet Switches (EPS), not-all-stop Optical Circuit Switches (OCS), and all-stop OCS. We propose a unified polynomial-time approximation algorithm that minimizes the makespan across this hybrid environment without incurring any splitting overhead. Let $τ$ denote the maximum flow degree across all ports in the network, $N$ be the number of input/output ports, and $m$ be the number of network cores. In pure EPS environments, the algorithm achieves an approximation guarantee of $\min\left\{τ, m\right\}$. For pure not-all-stop and pure all-stop OCS environments, the guaranteed ratios are $2\min\left\{τ, m\right\}$ and $2\min\left\{2τ-1, m+τ-1\right\}$, respectively. Notably, when specialized to the $m=2$ setting, our algorithm achieves constant bounds of $2$ and $4$ for pure EPS, and pure not-all-stop OCS, respectively, and $2τ+2$ for pure all-stop OCS. By leveraging these constituent bounds, we prove that the overall performance guarantee in the hybrid architecture is upper-bounded by the least-performing switch architecture in the network.


翻译:作为显著的网络抽象模型,共流高效地捕获了数据中心中的通信模式。由于大规模数据中心中的共流调度问题是$\mathcal{NP}$-难的,现有文献主要集中于有限环境(即$m=2$个网络核心),并依赖于引入显著操作开销的流量拆分。关键的是,对于更实用的非拆分共流调度问题,即使对于$m=2$的情况,也尚未提出任何具有可证明性能保证的近似算法,更不用说针对通用混合架构了。为填补这一关键空白,本文研究了混合异构并行网络中的非拆分问题,该网络包含多个网络核心($m \ge 2$),由电子分组交换机(EPS)、非全停光电路交换机(OCS)和全停OCS组成。我们提出了一种统一的多项式时间近似算法,该算法在混合环境中最小化完工时间,且不产生任何拆分开销。设$τ$表示网络中所有端口上的最大流度,$N$为输入/输出端口数,$m$为网络核心数。在纯EPS环境中,该算法达到$\min\left\{τ, m\right\}$的近似比。对于纯非全停OCS和纯全停OCS环境,保证比分别为$2\min\left\{τ, m\right\}$和$2\min\left\{2τ-1, m+τ-1\right\}$。值得注意的是,当特化为$m=2$设置时,我们的算法在纯EPS和纯非全停OCS下分别达到常数界$2$和$4$,在纯全停OCS下达到$2τ+2$。通过利用这些构成界,我们证明混合架构中的整体性能保证受限于网络中性能最差的交换架构。

0
下载
关闭预览

相关内容

在数学和计算机科学之中,算法(Algorithm)为一个计算的具体步骤,常用于计算、数据处理和自动推理。精确而言,算法是一个表示为有限长列表的有效方法。算法应包含清晰定义的指令用于计算函数。 来自维基百科: 算法
【博士论文】集群系统中的网络流调度
专知会员服务
47+阅读 · 2021年12月7日
异质信息网络分析与应用综述,软件学报-北京邮电大学
综述 | 异质信息网络分析与应用综述
专知
27+阅读 · 2020年8月8日
使用 Canal 实现数据异构
性能与架构
20+阅读 · 2019年3月4日
使用tinc构建full mesh结构的VPN
运维帮
68+阅读 · 2018年12月1日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
7+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
8+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
6+阅读 · 6月17日
相关VIP内容
【博士论文】集群系统中的网络流调度
专知会员服务
47+阅读 · 2021年12月7日
异质信息网络分析与应用综述,软件学报-北京邮电大学
相关基金
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员