This work pursues automated planning and scheduling of distributed data pipelines, or workflows. We develop a general workflow and resource graph representation that includes both data processing and sharing components with corresponding network interfaces for scheduling. Leveraging these graphs, we introduce WORKSWORLD, a new domain for numeric domain-independent planners designed for permanently scheduled workflows, like ingest pipelines. Our framework permits users to define data sources, available workflow components, and desired data destinations and formats without explicitly declaring the entire workflow graph as a goal. The planner solves a joint planning and scheduling problem, producing a plan that both builds the workflow graph and schedules its components on the resource graph. We empirically show that a state-of-the-art numeric planner running on commodity hardware with one hour of CPU time and 30GB of memory can solve linear-chain workflows of up to 14 components across eight sites.


翻译:本文致力于实现分布式数据流水线(或称工作流)的自动化规划与调度。我们开发了一种通用的工作流与资源图表示方法,该表示包含了数据处理与共享组件,并配备了相应的网络接口用于调度。基于这些图结构,我们引入了WORKSWORLD——这是一个专为永久性调度工作流(如数据摄取流水线)设计的新领域,适用于领域无关的数值规划器。我们的框架允许用户定义数据源、可用工作流组件以及期望的数据目的地和格式,而无需将整个工作流图显式声明为目标。规划器通过求解一个联合规划与调度问题,生成一个既能构建工作流图,又能将其组件调度到资源图上的规划方案。实验表明,一台配备一小时CPU时间和30GB内存的商用硬件上运行的最先进数值规划器,能够解决跨八个站点、包含多达14个组件的线性链式工作流。

0
下载
关闭预览

相关内容

重磅!《流程行业边缘计算解决方案白皮书》发布, 49页pdf
离散制造业边缘计算 解决方案白皮书,46页pdf
专知会员服务
32+阅读 · 2022年3月23日
工业人工智能驱动的流程工业智能制造
专知会员服务
108+阅读 · 2022年3月9日
可信工业数据空间系统架构1.0白皮书,56页pdf
专知会员服务
81+阅读 · 2022年2月3日
【博士论文】集群系统中的网络流调度
专知会员服务
47+阅读 · 2021年12月7日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
VIP会员
最新内容
无人机自主控制与人工智能:系统性综述
专知会员服务
6+阅读 · 今天7:25
巡飞弹与反无人机系统——现代战场的两大支柱
专知会员服务
2+阅读 · 今天6:54
《打造“黄金舰队”》57页报告
专知会员服务
1+阅读 · 今天6:52
《北约数字教官网络发展路径》128页报告
专知会员服务
1+阅读 · 今天6:33
ECCV 2026 | MIMFlow:MIM与归一化流统一图像生成
专知会员服务
6+阅读 · 6月25日
网状网络及其在军事领域的运用
专知会员服务
7+阅读 · 6月25日
无美国参与的欧洲战争方式(万字长文)
专知会员服务
8+阅读 · 6月25日
《国防领域敏感性分析白皮书》
专知会员服务
9+阅读 · 6月25日
综述 | 从问答到任务完成:Agent系统与Harness设计
专知会员服务
10+阅读 · 6月24日
Agentic RL:框架、实践与长程智能体训练
专知会员服务
10+阅读 · 6月24日
相关VIP内容
重磅!《流程行业边缘计算解决方案白皮书》发布, 49页pdf
离散制造业边缘计算 解决方案白皮书,46页pdf
专知会员服务
32+阅读 · 2022年3月23日
工业人工智能驱动的流程工业智能制造
专知会员服务
108+阅读 · 2022年3月9日
可信工业数据空间系统架构1.0白皮书,56页pdf
专知会员服务
81+阅读 · 2022年2月3日
【博士论文】集群系统中的网络流调度
专知会员服务
47+阅读 · 2021年12月7日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员