Reexamining Paradigms of End-to-End Data Movement - 专知论文

会员服务 ·

0

传输 · 端到端 · 链路 · 带宽 · 软件 ·

Reexamining Paradigms of End-to-End Data Movement

翻译：端到端数据传输范式的重新审视

Chin Fang,Timothy Stitt,Michael J. McManus,Toshio Moriya

from arxiv, 19 pages and 13 figures

The pursuit of high-performance data transfer often focuses on raw network bandwidth, where international links of 100 Gbps or higher are frequently considered the primary enabler. While necessary, this network-centric view is incomplete, as it equates provisioned link speeds with practical, sustainable data movement capabilities across the entire edge-to-core spectrum. This paper investigates six common paradigms, ranging from network latency and TCP congestion control to host-side factors such as CPU performance and virtualization that critically impact data movement workflows. These paradigms represent widely adopted engineering assumptions that inform system design, procurement decisions, and operational practices in production data movement environments. We introduce the "Drainage Basin Pattern" conceptual model for reasoning about end-to-end data flow constraints across heterogeneous hardware and software components to address the fidelity gap between raw bandwidth and application-level throughput. Our findings are validated through rigorous production-scale deployments, including U.S. DOE ESnet technical evaluations and transcontinental production trials over 100 Gbps operational links. The results demonstrate that principal bottlenecks often reside outside the network core, and that a holistic hardware-software co-design enables consistent, predictable performance for moving data at scale and speed.

翻译：高性能数据传输的追求往往聚焦于原始网络带宽，其中100 Gbps或更高的国际链路常被视为主要赋能因素。尽管必要，这种以网络为中心的视角并不完整，因为它将配置的链路速度等同于整个边缘到核心频谱中实际、可持续的数据传输能力。本文研究了六种常见范式，从网络延迟和TCP拥塞控制到主机端因素（如CPU性能和虚拟化），这些因素对数据传输工作流产生关键影响。这些范式代表了广泛采用的工程假设，指导着生产数据传输环境中的系统设计、采购决策和操作实践。我们引入了“流域模式”概念模型，用于推理跨异构硬件和软件组件的端到端数据流约束，以解决原始带宽与应用级吞吐量之间的保真度差距。我们的发现通过严格的生产规模部署得到验证，包括美国能源部ESnet技术评估和基于100 Gbps运营链路的跨大陆生产试验。结果表明，主要瓶颈通常位于网络核心之外，而硬件-软件协同设计的整体方法能够为大规模高速数据传输提供一致、可预测的性能。

0

相关内容

《数据基础设施和研发基础设施项目之间互联互通框架》美国国家科学技术委员会最新报告

《数据基础设施和研发基础设施项目之间互联互通框架》美国国家科学技术委员会最新报告

专知会员服务

28+阅读 · 2025年1月4日

《战术数据链感知模拟器标准的不断演变》

《战术数据链感知模拟器标准的不断演变》

专知会员服务

38+阅读 · 2024年12月26日

《美陆军：终端用户设备上地理空间数据的优化策略》最新49页报告

《美陆军：终端用户设备上地理空间数据的优化策略》最新49页报告

专知会员服务

24+阅读 · 2024年10月17日

【WWW2024】重新思考大规模图学习中的节点式传播

【WWW2024】重新思考大规模图学习中的节点式传播

专知会员服务

25+阅读 · 2024年2月12日

《利用边缘计算为物联网系统提供分布式智能》2023最新博士论文

《利用边缘计算为物联网系统提供分布式智能》2023最新博士论文

专知会员服务

48+阅读 · 2023年10月30日

《利用无人机（UAV）提高舰队数据传输能力》107页论文

《利用无人机（UAV）提高舰队数据传输能力》107页论文

专知会员服务

75+阅读 · 2023年8月4日

重磅！工信部《数据传输安全白皮书》发布，90页pdf

重磅！工信部《数据传输安全白皮书》发布，90页pdf

专知会员服务

87+阅读 · 2022年8月6日

《6G 可见光通信技术白皮书（2022）》，中国移动通信有限公司研究院

《6G 可见光通信技术白皮书（2022）》，中国移动通信有限公司研究院

专知会员服务

19+阅读 · 2022年3月23日

【综述论文】A Survey on Dynamic Network Embedding，动态网络嵌入综述论文

【综述论文】A Survey on Dynamic Network Embedding，动态网络嵌入综述论文

专知会员服务

102+阅读 · 2020年6月16日

最新《深度多模态数据分析》综述论文，26页pdf

最新《深度多模态数据分析》综述论文，26页pdf

专知会员服务

302+阅读 · 2020年6月16日

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

38+阅读 · 2023年4月11日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

【Flink】基于 Flink 的流式数据实时去重

【Flink】基于 Flink 的流式数据实时去重

AINLP

14+阅读 · 2020年9月29日

最新《动态网络嵌入》综述论文，25页pdf

最新《动态网络嵌入》综述论文，25页pdf

专知

37+阅读 · 2020年6月17日

用一行tf.data实现数据Shuffle、Batch划分、异步预加载等

用一行tf.data实现数据Shuffle、Batch划分、异步预加载等

专知

21+阅读 · 2019年3月26日

网络表示学习介绍

网络表示学习介绍

人工智能前沿讲习班

18+阅读 · 2018年11月26日

一文概览基于深度学习的超分辨率重建架构

一文概览基于深度学习的超分辨率重建架构

论智

23+阅读 · 2018年3月24日

【论文读书笔记】重新考虑用简单神经网络进行知识表示学习（附代码）

【论文读书笔记】重新考虑用简单神经网络进行知识表示学习（附代码）

专知

14+阅读 · 2018年2月4日

图上的归纳表示学习

图上的归纳表示学习

科技创新与创业

23+阅读 · 2017年11月9日

基于略图挖掘的在不同时空域的网络流式数据实时处理

国家自然科学基金

1+阅读 · 2015年12月31日

多重网络中的级联与传播过程研究

国家自然科学基金

0+阅读 · 2015年12月31日

云计算平台中大规模交互式服务长尾延迟消减关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

多路径通信网络关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

缓存路由器存储架构及其关键技术的研究

国家自然科学基金

0+阅读 · 2015年12月31日

数据中心网络中延时敏感的传输控制协议

国家自然科学基金

0+阅读 · 2015年12月31日

面向有源配电网的数据传输优化及智能过滤机制

国家自然科学基金

0+阅读 · 2015年12月31日

任意网络中的可分数据处理研究

国家自然科学基金

0+阅读 · 2015年12月31日

动态网络中信息传播时间的理论分析与跨层算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

汽车下一代高速数据传输网络基础理论研究

国家自然科学基金

2+阅读 · 2014年12月31日

Nonparametric Distribution Regression Re-calibration

Arxiv

0+阅读 · 2月13日

EntroGD: Scalable Generalized Deduplication for Efficient Direct Analytics on Compressed IoT Data

Arxiv

0+阅读 · 2月10日

Elastic Data Transfer Optimization with Hybrid Reinforcement Learning

Arxiv

0+阅读 · 2月7日

Revisiting the Shape Convention of Transformer Language Models

Arxiv

0+阅读 · 2月6日

Reexamining Paradigms of End-to-End Data Movement

Arxiv

0+阅读 · 2月1日

Reexamining Paradigms of End-to-End Data Movement

Arxiv

0+阅读 · 1月26日

SWORD: A Secure LoW-Latency Offline-First Authentication and Data Sharing Scheme for Resource Constrained Distributed Networks

Arxiv

0+阅读 · 1月19日

Understanding Partial Reachability in the Internet Core

Arxiv

0+阅读 · 1月17日

A Propagation Framework for Network Regression

Arxiv

0+阅读 · 1月15日

Rule Rewriting Revisited: A Fresh Look at Static Filtering for Datalog and ASP

Arxiv

0+阅读 · 1月13日

VIP会员

文章信息

相关主题

最新内容

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

专知会员服务

4+阅读 · 5月31日

比利时发布用于实时战场军事装备识别的离线人工智能系统

比利时发布用于实时战场军事装备识别的离线人工智能系统

专知会员服务

3+阅读 · 5月31日

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

专知会员服务

3+阅读 · 5月31日

超越网格：作战环境对炮兵的影响

超越网格：作战环境对炮兵的影响

专知会员服务

2+阅读 · 5月31日

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

专知会员服务

6+阅读 · 5月31日

综述 | 推理时控制：可信大语言模型的运行时治理全景

综述 | 推理时控制：可信大语言模型的运行时治理全景

专知会员服务

3+阅读 · 5月31日

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

5+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

7+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

5+阅读 · 5月30日

美以伊战争：首次人工智能战争——军事自主性困境

美以伊战争：首次人工智能战争——军事自主性困境

专知会员服务

5+阅读 · 5月30日

《Palantir任务保障性软件安全标准（MA-S2）》

《Palantir任务保障性软件安全标准（MA-S2）》

专知会员服务

18+阅读 · 5月30日

《美海军利用扩展现实增强知识流动研究》300页报告

《美海军利用扩展现实增强知识流动研究》300页报告

专知会员服务

9+阅读 · 5月30日

基于声学的无人机检测技术综述

基于声学的无人机检测技术综述

专知会员服务

10+阅读 · 5月30日

《当代混合战争分析框架：俄乌战争经验教训》

《当代混合战争分析框架：俄乌战争经验教训》

专知会员服务

9+阅读 · 5月30日

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

专知会员服务

14+阅读 · 5月29日

相关VIP内容

《数据基础设施和研发基础设施项目之间互联互通框架》美国国家科学技术委员会最新报告

《数据基础设施和研发基础设施项目之间互联互通框架》美国国家科学技术委员会最新报告

专知会员服务

28+阅读 · 2025年1月4日

《战术数据链感知模拟器标准的不断演变》

《战术数据链感知模拟器标准的不断演变》

专知会员服务

38+阅读 · 2024年12月26日

《美陆军：终端用户设备上地理空间数据的优化策略》最新49页报告

《美陆军：终端用户设备上地理空间数据的优化策略》最新49页报告

专知会员服务

24+阅读 · 2024年10月17日

【WWW2024】重新思考大规模图学习中的节点式传播

【WWW2024】重新思考大规模图学习中的节点式传播

专知会员服务

25+阅读 · 2024年2月12日

《利用边缘计算为物联网系统提供分布式智能》2023最新博士论文

《利用边缘计算为物联网系统提供分布式智能》2023最新博士论文

专知会员服务

48+阅读 · 2023年10月30日

《利用无人机（UAV）提高舰队数据传输能力》107页论文

《利用无人机（UAV）提高舰队数据传输能力》107页论文

专知会员服务

75+阅读 · 2023年8月4日

重磅！工信部《数据传输安全白皮书》发布，90页pdf

重磅！工信部《数据传输安全白皮书》发布，90页pdf

专知会员服务

87+阅读 · 2022年8月6日

《6G 可见光通信技术白皮书（2022）》，中国移动通信有限公司研究院

《6G 可见光通信技术白皮书（2022）》，中国移动通信有限公司研究院

专知会员服务

19+阅读 · 2022年3月23日

【综述论文】A Survey on Dynamic Network Embedding，动态网络嵌入综述论文

【综述论文】A Survey on Dynamic Network Embedding，动态网络嵌入综述论文

专知会员服务

102+阅读 · 2020年6月16日

最新《深度多模态数据分析》综述论文，26页pdf

最新《深度多模态数据分析》综述论文，26页pdf

专知会员服务

302+阅读 · 2020年6月16日

热门VIP内容

开通专知VIP会员享更多权益服务

比利时发布用于实时战场军事装备识别的离线人工智能系统

超越网格：作战环境对炮兵的影响

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

相关资讯

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

38+阅读 · 2023年4月11日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

【Flink】基于 Flink 的流式数据实时去重

【Flink】基于 Flink 的流式数据实时去重

AINLP

14+阅读 · 2020年9月29日

最新《动态网络嵌入》综述论文，25页pdf

最新《动态网络嵌入》综述论文，25页pdf

专知

37+阅读 · 2020年6月17日

用一行tf.data实现数据Shuffle、Batch划分、异步预加载等

用一行tf.data实现数据Shuffle、Batch划分、异步预加载等

专知

21+阅读 · 2019年3月26日

网络表示学习介绍

网络表示学习介绍

人工智能前沿讲习班

18+阅读 · 2018年11月26日

一文概览基于深度学习的超分辨率重建架构

一文概览基于深度学习的超分辨率重建架构

论智

23+阅读 · 2018年3月24日

【论文读书笔记】重新考虑用简单神经网络进行知识表示学习（附代码）

【论文读书笔记】重新考虑用简单神经网络进行知识表示学习（附代码）

专知

14+阅读 · 2018年2月4日

图上的归纳表示学习

图上的归纳表示学习

科技创新与创业

23+阅读 · 2017年11月9日

相关论文

Nonparametric Distribution Regression Re-calibration

Arxiv

0+阅读 · 2月13日

EntroGD: Scalable Generalized Deduplication for Efficient Direct Analytics on Compressed IoT Data

Arxiv

0+阅读 · 2月10日

Elastic Data Transfer Optimization with Hybrid Reinforcement Learning

Arxiv

0+阅读 · 2月7日

Revisiting the Shape Convention of Transformer Language Models

Arxiv

0+阅读 · 2月6日

Reexamining Paradigms of End-to-End Data Movement

Arxiv

0+阅读 · 2月1日

Reexamining Paradigms of End-to-End Data Movement

Arxiv

0+阅读 · 1月26日

SWORD: A Secure LoW-Latency Offline-First Authentication and Data Sharing Scheme for Resource Constrained Distributed Networks

Arxiv

0+阅读 · 1月19日

Understanding Partial Reachability in the Internet Core

Arxiv

0+阅读 · 1月17日

A Propagation Framework for Network Regression

Arxiv

0+阅读 · 1月15日

Rule Rewriting Revisited: A Fresh Look at Static Filtering for Datalog and ASP

Arxiv

0+阅读 · 1月13日

相关基金

基于略图挖掘的在不同时空域的网络流式数据实时处理

国家自然科学基金

1+阅读 · 2015年12月31日

多重网络中的级联与传播过程研究

国家自然科学基金

0+阅读 · 2015年12月31日

云计算平台中大规模交互式服务长尾延迟消减关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

多路径通信网络关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

缓存路由器存储架构及其关键技术的研究

国家自然科学基金

0+阅读 · 2015年12月31日

数据中心网络中延时敏感的传输控制协议

国家自然科学基金

0+阅读 · 2015年12月31日

面向有源配电网的数据传输优化及智能过滤机制

国家自然科学基金

0+阅读 · 2015年12月31日

任意网络中的可分数据处理研究

国家自然科学基金

0+阅读 · 2015年12月31日

动态网络中信息传播时间的理论分析与跨层算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

汽车下一代高速数据传输网络基础理论研究

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员