A Granularity Characterization of Task Scheduling Effectiveness - 专知论文

会员服务 ·

0

调度 · 粒度 · 并行 · 扩展性 · 可扩展性 ·

A Granularity Characterization of Task Scheduling Effectiveness

翻译：任务调度效能粒度特性表征

Sana Taghipour Anvar,David Kaeli

Task-based runtime systems provide flexible load balancing and portability for parallel scientific applications, but their strong scaling is highly sensitive to task granularity. As parallelism increases, scheduling overhead may transition from negligible to dominant, leading to rapid drops in performance for some algorithms, while remaining negligible for others. Although such effects are widely observed empirically, there is a general lack of understanding how algorithmic structure impacts whether dynamic scheduling is always beneficial. In this work, we introduce a granularity characterization framework that directly links scheduling overhead growth to task-graph dependency topology. We show that dependency structure, rather than problem size alone, governs how overhead scales with parallelism. Based on this observation, we characterize execution behavior using a simple granularity measure that indicates when scheduling overhead can be amortized by parallel computation and when scheduling overhead dominates performance. Through experimental evaluation on representative parallel workloads with diverse dependency patterns, we demonstrate that the proposed characterization explains both gradual and abrupt strong-scaling breakdowns observed in practice. We further show that overhead models derived from dependency topology accurately predict strong-scaling limits and enable a practical runtime decision rule for selecting dynamic or static execution without requiring exhaustive strong-scaling studies or extensive offline tuning.

翻译：基于任务的运行时系统为并行科学计算应用提供了灵活的负载均衡与可移植性，但其强可扩展性对任务粒度高度敏感。随着并行度提升，调度开销可能从可忽略转变为主导因素，导致某些算法的性能急剧下降，而对其他算法则仍可忽略不计。尽管此类效应在实证中被广泛观察到，但学界普遍缺乏对算法结构如何影响动态调度是否始终有益的理解。本研究提出一种粒度特性表征框架，将调度开销增长直接关联至任务图依赖拓扑结构。我们证明依赖结构（而非单纯问题规模）主导着开销随并行度的扩展规律。基于此观察，我们采用一种简易的粒度度量来表征执行行为，该度量能够指示调度开销何时可被并行计算分摊，何时将主导整体性能。通过对具有多样化依赖模式的典型并行负载进行实验评估，我们证明所提出的表征方法能够解释实践中观察到的渐进式与突变式强可扩展性崩溃现象。进一步研究表明，基于依赖拓扑推导的开销模型可准确预测强可扩展性极限，并为选择动态或静态执行提供实用的运行时决策规则，无需进行详尽的强可扩展性研究或大量离线调优。

0

相关内容

联邦学习中基础模型参数高效微调综述

联邦学习中基础模型参数高效微调综述

专知会员服务

17+阅读 · 2025年5月5日

《雷达任务调度与策略梯度强化学习：为连续观察和行动空间创建环境和智能体》最新报告

《雷达任务调度与策略梯度强化学习：为连续观察和行动空间创建环境和智能体》最新报告

专知会员服务

26+阅读 · 2025年1月22日

【牛津大学博士论文】面向持续任务性能的表示学习，218页pdf

【牛津大学博士论文】面向持续任务性能的表示学习，218页pdf

专知会员服务

40+阅读 · 2023年4月1日

《联合火力自动化的效应任务优化方法》2022最新30页技术报告，加拿大国防研究与发展部

《联合火力自动化的效应任务优化方法》2022最新30页技术报告，加拿大国防研究与发展部

专知会员服务

56+阅读 · 2023年1月12日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知会员服务

146+阅读 · 2022年11月14日

最新！《信息技术服务数字化转型第 2 部分：成熟度模型》国家标准征求意见稿

最新！《信息技术服务数字化转型第 2 部分：成熟度模型》国家标准征求意见稿

专知会员服务

38+阅读 · 2022年5月13日

美国陆军研究实验室等最新论文《用于战场物联网的高效且有弹性的边缘智能》

美国陆军研究实验室等最新论文《用于战场物联网的高效且有弹性的边缘智能》

专知会员服务

93+阅读 · 2022年4月6日

【博士论文】辨识性特征学习及在细粒度分析中的应用

【博士论文】辨识性特征学习及在细粒度分析中的应用

专知会员服务

31+阅读 · 2020年12月10日

【康奈尔大学】度量数据粒度，Measuring Dataset Granularity

【康奈尔大学】度量数据粒度，Measuring Dataset Granularity

专知会员服务

13+阅读 · 2019年12月27日

【CCF优秀博士学位论文奖-2019提名】面向绿色跨域数据中心的能效管理研究，华中科技大学周知

【CCF优秀博士学位论文奖-2019提名】面向绿色跨域数据中心的能效管理研究，华中科技大学周知

专知会员服务

14+阅读 · 2019年11月8日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

流程/过程挖掘（Process Mining）最新综述

流程/过程挖掘（Process Mining）最新综述

PaperWeekly

23+阅读 · 2022年9月19日

美国国防部《图论在建模、仿真、分析OODA环路和信任中的应用：量化任务的成功率》30页报告

美国国防部《图论在建模、仿真、分析OODA环路和信任中的应用：量化任务的成功率》30页报告

专知

25+阅读 · 2022年7月5日

基于RASA的task-orient对话系统解析（一）

基于RASA的task-orient对话系统解析（一）

AINLP

16+阅读 · 2019年8月27日

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

10+阅读 · 2019年2月18日

综述：Image Caption 任务之语句多样性

综述：Image Caption 任务之语句多样性

PaperWeekly

22+阅读 · 2018年11月30日

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

专知

12+阅读 · 2018年5月18日

基于区域的目标检测——细粒度

基于区域的目标检测——细粒度

计算机视觉战队

14+阅读 · 2018年2月1日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

特征工程的特征理解（一）

特征工程的特征理解（一）

机器学习研究会

10+阅读 · 2017年10月23日

家庭智能用电任务调度优化及其对电网负荷影响分析模型

国家自然科学基金

1+阅读 · 2015年12月31日

面向估计性能优化的网络化控制系统传感器调度

国家自然科学基金

0+阅读 · 2015年12月31日

基于大数据的运载火箭总装系统智能优化调度理论与方法

国家自然科学基金

0+阅读 · 2015年12月31日

具有重构特征的系统可靠性建模方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的高时效并行计算机系统结构与技术

国家自然科学基金

0+阅读 · 2014年12月31日

基于示能性视角的信息系统有效使用研究：维度、影响因素和形成机制

国家自然科学基金

0+阅读 · 2014年12月31日

面向任务成功性的可修系统重要度分析及优化

国家自然科学基金

0+阅读 · 2014年12月31日

复杂项目组织能力与任务分配的适应性测度及优化

国家自然科学基金

7+阅读 · 2014年12月31日

面向大数据的粒计算理论与方法

国家自然科学基金

4+阅读 · 2014年12月31日

Concurrency Control as a Service

Arxiv

0+阅读 · 3月14日

CARAT: Client-Side Adaptive RPC and Cache Co-Tuning for Parallel File Systems

Arxiv

0+阅读 · 2月25日

DIAL: Decentralized I/O AutoTuning via Learned Client-side Local Metrics for Parallel File System

Arxiv

0+阅读 · 2月25日

Exploiting Dependency and Parallelism: Real-Time Scheduling and Analysis for GPU Tasks

Arxiv

0+阅读 · 2月24日

On the Granularity of Causal Effect Identifiability

Arxiv

0+阅读 · 2月23日

AdaptOrch: Task-Adaptive Multi-Agent Orchestration in the Era of LLM Performance Convergence

Arxiv

0+阅读 · 2月18日

Optimizing Task Scheduling in Fog Computing with Deadline Awareness

Arxiv

0+阅读 · 2月15日

TENORAN: Automating Fine-grained Energy Efficiency Profiling in Open RAN Systems

Arxiv

0+阅读 · 2月13日

Collaborative and Efficient Fine-tuning: Leveraging Task Similarity

Arxiv

0+阅读 · 2月6日

Refining the Complexity Landscape of Speed Scaling: Hardness and Algorithms

Arxiv

0+阅读 · 2月4日

VIP会员

文章信息

相关主题

最新内容

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

专知会员服务

2+阅读 · 今天0:51

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

专知会员服务

2+阅读 · 4月29日

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

专知会员服务

6+阅读 · 4月29日

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

专知会员服务

5+阅读 · 4月29日

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

专知会员服务

5+阅读 · 4月29日

《化繁为简：军事模拟器配置的对话式方法》报告

《化繁为简：军事模拟器配置的对话式方法》报告

专知会员服务

7+阅读 · 4月29日

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

专知会员服务

10+阅读 · 4月29日

《新兴技术武器化及其对全球风险的影响》

《新兴技术武器化及其对全球风险的影响》

专知会员服务

7+阅读 · 4月29日

《帕兰泰尔平台介绍：信息分析平台》

《帕兰泰尔平台介绍：信息分析平台》

专知会员服务

17+阅读 · 4月29日

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

专知会员服务

10+阅读 · 4月29日

【伯克利博士论文】深度解析 AI 智能体的失配问题

【伯克利博士论文】深度解析 AI 智能体的失配问题

专知会员服务

8+阅读 · 4月28日

智能体化世界建模：基础、能力、规律及展望

智能体化世界建模：基础、能力、规律及展望

专知会员服务

11+阅读 · 4月28日

MIT人机协同水下作业关键技术研究——集成适配至美国海军现役AUV

MIT人机协同水下作业关键技术研究——集成适配至美国海军现役AUV

专知会员服务

8+阅读 · 4月28日

美海警海上态势感知无人系统

美海警海上态势感知无人系统

专知会员服务

6+阅读 · 4月28日

安杜里尔Lattice平台的发展演变：美军多域自主作战的核心软件架构

安杜里尔Lattice平台的发展演变：美军多域自主作战的核心软件架构

专知会员服务

10+阅读 · 4月28日

相关VIP内容

联邦学习中基础模型参数高效微调综述

联邦学习中基础模型参数高效微调综述

专知会员服务

17+阅读 · 2025年5月5日

《雷达任务调度与策略梯度强化学习：为连续观察和行动空间创建环境和智能体》最新报告

《雷达任务调度与策略梯度强化学习：为连续观察和行动空间创建环境和智能体》最新报告

专知会员服务

26+阅读 · 2025年1月22日

【牛津大学博士论文】面向持续任务性能的表示学习，218页pdf

【牛津大学博士论文】面向持续任务性能的表示学习，218页pdf

专知会员服务

40+阅读 · 2023年4月1日

《联合火力自动化的效应任务优化方法》2022最新30页技术报告，加拿大国防研究与发展部

《联合火力自动化的效应任务优化方法》2022最新30页技术报告，加拿大国防研究与发展部

专知会员服务

56+阅读 · 2023年1月12日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知会员服务

146+阅读 · 2022年11月14日

最新！《信息技术服务数字化转型第 2 部分：成熟度模型》国家标准征求意见稿

最新！《信息技术服务数字化转型第 2 部分：成熟度模型》国家标准征求意见稿

专知会员服务

38+阅读 · 2022年5月13日

美国陆军研究实验室等最新论文《用于战场物联网的高效且有弹性的边缘智能》

美国陆军研究实验室等最新论文《用于战场物联网的高效且有弹性的边缘智能》

专知会员服务

93+阅读 · 2022年4月6日

【博士论文】辨识性特征学习及在细粒度分析中的应用

【博士论文】辨识性特征学习及在细粒度分析中的应用

专知会员服务

31+阅读 · 2020年12月10日

【康奈尔大学】度量数据粒度，Measuring Dataset Granularity

【康奈尔大学】度量数据粒度，Measuring Dataset Granularity

专知会员服务

13+阅读 · 2019年12月27日

【CCF优秀博士学位论文奖-2019提名】面向绿色跨域数据中心的能效管理研究，华中科技大学周知

【CCF优秀博士学位论文奖-2019提名】面向绿色跨域数据中心的能效管理研究，华中科技大学周知

专知会员服务

14+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

相关资讯

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

流程/过程挖掘（Process Mining）最新综述

流程/过程挖掘（Process Mining）最新综述

PaperWeekly

23+阅读 · 2022年9月19日

美国国防部《图论在建模、仿真、分析OODA环路和信任中的应用：量化任务的成功率》30页报告

美国国防部《图论在建模、仿真、分析OODA环路和信任中的应用：量化任务的成功率》30页报告

专知

25+阅读 · 2022年7月5日

基于RASA的task-orient对话系统解析（一）

基于RASA的task-orient对话系统解析（一）

AINLP

16+阅读 · 2019年8月27日

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

10+阅读 · 2019年2月18日

综述：Image Caption 任务之语句多样性

综述：Image Caption 任务之语句多样性

PaperWeekly

22+阅读 · 2018年11月30日

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

专知

12+阅读 · 2018年5月18日

基于区域的目标检测——细粒度

基于区域的目标检测——细粒度

计算机视觉战队

14+阅读 · 2018年2月1日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

特征工程的特征理解（一）

特征工程的特征理解（一）

机器学习研究会

10+阅读 · 2017年10月23日

相关论文

Concurrency Control as a Service

Arxiv

0+阅读 · 3月14日

CARAT: Client-Side Adaptive RPC and Cache Co-Tuning for Parallel File Systems

Arxiv

0+阅读 · 2月25日

DIAL: Decentralized I/O AutoTuning via Learned Client-side Local Metrics for Parallel File System

Arxiv

0+阅读 · 2月25日

Exploiting Dependency and Parallelism: Real-Time Scheduling and Analysis for GPU Tasks

Arxiv

0+阅读 · 2月24日

On the Granularity of Causal Effect Identifiability

Arxiv

0+阅读 · 2月23日

AdaptOrch: Task-Adaptive Multi-Agent Orchestration in the Era of LLM Performance Convergence

Arxiv

0+阅读 · 2月18日

Optimizing Task Scheduling in Fog Computing with Deadline Awareness

Arxiv

0+阅读 · 2月15日

TENORAN: Automating Fine-grained Energy Efficiency Profiling in Open RAN Systems

Arxiv

0+阅读 · 2月13日

Collaborative and Efficient Fine-tuning: Leveraging Task Similarity

Arxiv

0+阅读 · 2月6日

Refining the Complexity Landscape of Speed Scaling: Hardness and Algorithms

Arxiv

0+阅读 · 2月4日

相关基金

家庭智能用电任务调度优化及其对电网负荷影响分析模型

国家自然科学基金

1+阅读 · 2015年12月31日

面向估计性能优化的网络化控制系统传感器调度

国家自然科学基金

0+阅读 · 2015年12月31日

基于大数据的运载火箭总装系统智能优化调度理论与方法

国家自然科学基金

0+阅读 · 2015年12月31日

具有重构特征的系统可靠性建模方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的高时效并行计算机系统结构与技术

国家自然科学基金

0+阅读 · 2014年12月31日

基于示能性视角的信息系统有效使用研究：维度、影响因素和形成机制

国家自然科学基金

0+阅读 · 2014年12月31日

面向任务成功性的可修系统重要度分析及优化

国家自然科学基金

0+阅读 · 2014年12月31日

复杂项目组织能力与任务分配的适应性测度及优化

国家自然科学基金

7+阅读 · 2014年12月31日

面向大数据的粒计算理论与方法

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员