Elastic Scheduling of Intermittent Query Processing in a Cluster Environment - 专知论文

会员服务 ·

0

Processing（编程语言） · 回合 · Spark · 簇 · 流 ·

Elastic Scheduling of Intermittent Query Processing in a Cluster Environment

翻译：间歇性查询处理在集群环境中的弹性调度

Saranya Chandrasekaran,S. Sudarshan

Many applications process a stream of tuples over a window duration, and require the results within a specified deadline after the end of the window. For such scenarios, processing tuples intermittently (in batches) instead of eagerly processing tuples as they arrive significantly reduces the overall cost. Earlier work on intermittent query processing has addressed only fixed environments. In this paper, we propose scheduling schemes for batched processing of tuples, in an elastic parallel environment, scaling nodes up or down. Our scheduling schemes ensure to meet the deadlines, while incurring minimum cost. Our schemes also handle multiple concurrent queries, the arrival of new queries, and input rate variations. We have implemented our schemes on top of Apache Spark, in the AWS EMR environment, and evaluated performance with both TPC-H and Yahoo Streaming datasets. Our experimental results show that our scheduling algorithms significantly outperform alternatives, such as using a fixed set of nodes without elasticity, or using Spark streaming.

翻译：许多应用程序在窗口持续时间内处理元组流，并需要在窗口结束后指定的截止时间前获得结果。在此类场景中，以间歇性方式（批处理）处理元组，而非在元组到达时立即处理，可显著降低整体成本。早期关于间歇性查询处理的研究仅针对固定环境。本文提出了在弹性并行环境中对元组进行批处理的调度方案，支持节点的动态扩缩容。我们的调度方案在确保满足截止时间的同时，将成本降至最低。该方案还能处理多并发查询、新查询的到达以及输入速率的变化。我们已在AWS EMR环境下基于Apache Spark实现了所提出的方案，并使用TPC-H和Yahoo流数据集评估了性能。实验结果表明，我们的调度算法显著优于使用固定无弹性节点集或Spark流处理等替代方案。

0

相关内容

Processing（编程语言）

Processing（编程语言）

Processing 是一门开源编程语言和与之配套的集成开发环境（IDE）的名称。Processing 在电子艺术和视觉设计社区被用来教授编程基础，并运用于大量的新媒体和互动艺术作品中。

《采用连续分布函数进行导弹与弹药时间分布准确性研究》68页报告

《采用连续分布函数进行导弹与弹药时间分布准确性研究》68页报告

专知会员服务

17+阅读 · 3月9日

《大规模供应链中断实时管理中智能决策支持系统的弹性集成》最新295页

《大规模供应链中断实时管理中智能决策支持系统的弹性集成》最新295页

专知会员服务

18+阅读 · 2025年5月9日

《雷达任务调度与策略梯度强化学习：为连续观察和行动空间创建环境和智能体》最新报告

《雷达任务调度与策略梯度强化学习：为连续观察和行动空间创建环境和智能体》最新报告

专知会员服务

27+阅读 · 2025年1月22日

《时间序列的机器学习：学习任务的分类，统一框架的开发，以及算法基准测试比较》博士论文277页，伦敦大学学院

《时间序列的机器学习：学习任务的分类，统一框架的开发，以及算法基准测试比较》博士论文277页，伦敦大学学院

专知会员服务

86+阅读 · 2022年8月4日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知会员服务

25+阅读 · 2022年7月8日

【博士论文】集群系统中的网络流调度

【博士论文】集群系统中的网络流调度

专知会员服务

47+阅读 · 2021年12月7日

【ICML2021】为序列学习训练的时间关联型任务调度器

专知会员服务

17+阅读 · 2021年7月26日

自然语言处理中的注意力机制，Attention in Natural Language Processing

自然语言处理中的注意力机制，Attention in Natural Language Processing

专知会员服务

136+阅读 · 2020年5月30日

Time2Vec：学习时间的向量表示，Time2Vec: Learning a Vector Representation of Time

Time2Vec：学习时间的向量表示，Time2Vec: Learning a Vector Representation of Time

专知会员服务

36+阅读 · 2020年5月10日

【2020新书】MySQL 8查询性能调优，974页pdf，一种提高执行速度的系统方法

【2020新书】MySQL 8查询性能调优，974页pdf，一种提高执行速度的系统方法

专知会员服务

70+阅读 · 2020年3月25日

对话管理的综述论文:最近的进展和挑战，A Survey on Dialog Management

对话管理的综述论文:最近的进展和挑战，A Survey on Dialog Management

专知

12+阅读 · 2020年5月14日

【2020新书】MySQL 8查询性能调优，974页pdf，一种提高执行速度的系统方法

【2020新书】MySQL 8查询性能调优，974页pdf，一种提高执行速度的系统方法

专知

15+阅读 · 2020年3月25日

中文自然语言处理开放任务介绍、数据集、当前最佳结果分享

中文自然语言处理开放任务介绍、数据集、当前最佳结果分享

深度学习与NLP

14+阅读 · 2019年8月15日

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

10+阅读 · 2019年2月18日

NLPprogress.com-随时跟进自然语言处理研究最新进展，34个NLP任务的数据、模型、论文与代码

NLPprogress.com-随时跟进自然语言处理研究最新进展，34个NLP任务的数据、模型、论文与代码

专知

12+阅读 · 2018年7月21日

自然语言处理（NLP）数据集整理

自然语言处理（NLP）数据集整理

论智

20+阅读 · 2018年4月8日

自然语言处理中的自注意力机制（Self-Attention Mechanism）

自然语言处理中的自注意力机制（Self-Attention Mechanism）

PaperWeekly

22+阅读 · 2018年3月28日

基于区域的目标检测——细粒度

基于区域的目标检测——细粒度

计算机视觉战队

14+阅读 · 2018年2月1日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

考虑时段费用的生产外包集成排序和协调机制设计研究

国家自然科学基金

0+阅读 · 2015年12月31日

云计算平台中大规模交互式服务长尾延迟消减关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

具有多操作特性的间歇工业过程监测技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

线性互补约束二次规划问题的一个全局算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

数据中心延迟敏感型应用尾端响应时延服务质量保障方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

混合分布模型中序性质和维修策略的一些研究

国家自然科学基金

0+阅读 · 2015年12月31日

柔性工序选择的混合流水车间调度及其离散群智能算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于地貌分析的复杂零空闲流水车间超启发式调度方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

集群环境下内存空间数据库管理与查询技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

Elastic Queries Reinforcement Learning: Self-Aware Policy Execution for VLA Models

Arxiv

0+阅读 · 6月12日

Work-Efficient Query Evaluation in Constant Time with PRAMs

Arxiv

0+阅读 · 6月11日

A Unified Structured Query Understanding Framework for Industrial Semantic Search

Arxiv

0+阅读 · 6月7日

Earliest query answering over streamed trees

Arxiv

0+阅读 · 6月5日

Query-efficient model evaluation using cached responses

Arxiv

0+阅读 · 6月4日

Query-Adaptive Semantic Chunking for Retrieval-Augmented Generation: A Dynamic Strategy with Contextual Window Expansion

Arxiv

0+阅读 · 5月26日

Multivariate reconciliation for hierarchical time series

Arxiv

0+阅读 · 5月18日

Elastic Scheduling of Intermittent Query Processing in a Cluster Environment

Arxiv

0+阅读 · 5月17日

Maintaining Queries under Updates Using Heavy-Light Partitioning of the Input Relations

Arxiv

0+阅读 · 5月8日

ARC: Consistent, Low-Latency Delivery via Receiver-Side Scheduling

Arxiv

0+阅读 · 5月5日

VIP会员

文章信息

相关主题

Processing（编程语言）

最新内容

《无人机空中监控：通信实验洞察》

《无人机空中监控：通信实验洞察》

专知会员服务

0+阅读 · 刚刚

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

专知会员服务

0+阅读 · 7分钟前

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

11+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

5+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

9+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

10+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

5+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

9+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

7+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

7+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

7+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

5+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

13+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

9+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

12+阅读 · 7月31日

相关VIP内容

《采用连续分布函数进行导弹与弹药时间分布准确性研究》68页报告

《采用连续分布函数进行导弹与弹药时间分布准确性研究》68页报告

专知会员服务

17+阅读 · 3月9日

《大规模供应链中断实时管理中智能决策支持系统的弹性集成》最新295页

《大规模供应链中断实时管理中智能决策支持系统的弹性集成》最新295页

专知会员服务

18+阅读 · 2025年5月9日

《雷达任务调度与策略梯度强化学习：为连续观察和行动空间创建环境和智能体》最新报告

《雷达任务调度与策略梯度强化学习：为连续观察和行动空间创建环境和智能体》最新报告

专知会员服务

27+阅读 · 2025年1月22日

《时间序列的机器学习：学习任务的分类，统一框架的开发，以及算法基准测试比较》博士论文277页，伦敦大学学院

《时间序列的机器学习：学习任务的分类，统一框架的开发，以及算法基准测试比较》博士论文277页，伦敦大学学院

专知会员服务

86+阅读 · 2022年8月4日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知会员服务

25+阅读 · 2022年7月8日

【博士论文】集群系统中的网络流调度

【博士论文】集群系统中的网络流调度

专知会员服务

47+阅读 · 2021年12月7日

【ICML2021】为序列学习训练的时间关联型任务调度器

专知会员服务

17+阅读 · 2021年7月26日

自然语言处理中的注意力机制，Attention in Natural Language Processing

自然语言处理中的注意力机制，Attention in Natural Language Processing

专知会员服务

136+阅读 · 2020年5月30日

Time2Vec：学习时间的向量表示，Time2Vec: Learning a Vector Representation of Time

Time2Vec：学习时间的向量表示，Time2Vec: Learning a Vector Representation of Time

专知会员服务

36+阅读 · 2020年5月10日

【2020新书】MySQL 8查询性能调优，974页pdf，一种提高执行速度的系统方法

【2020新书】MySQL 8查询性能调优，974页pdf，一种提高执行速度的系统方法

专知会员服务

70+阅读 · 2020年3月25日

热门VIP内容

开通专知VIP会员享更多权益服务

从采集到决策：美军视角下的战术情报范式重构

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

相关资讯

对话管理的综述论文:最近的进展和挑战，A Survey on Dialog Management

对话管理的综述论文:最近的进展和挑战，A Survey on Dialog Management

专知

12+阅读 · 2020年5月14日

【2020新书】MySQL 8查询性能调优，974页pdf，一种提高执行速度的系统方法

【2020新书】MySQL 8查询性能调优，974页pdf，一种提高执行速度的系统方法

专知

15+阅读 · 2020年3月25日

中文自然语言处理开放任务介绍、数据集、当前最佳结果分享

中文自然语言处理开放任务介绍、数据集、当前最佳结果分享

深度学习与NLP

14+阅读 · 2019年8月15日

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

10+阅读 · 2019年2月18日

NLPprogress.com-随时跟进自然语言处理研究最新进展，34个NLP任务的数据、模型、论文与代码

NLPprogress.com-随时跟进自然语言处理研究最新进展，34个NLP任务的数据、模型、论文与代码

专知

12+阅读 · 2018年7月21日

自然语言处理（NLP）数据集整理

自然语言处理（NLP）数据集整理

论智

20+阅读 · 2018年4月8日

自然语言处理中的自注意力机制（Self-Attention Mechanism）

自然语言处理中的自注意力机制（Self-Attention Mechanism）

PaperWeekly

22+阅读 · 2018年3月28日

基于区域的目标检测——细粒度

基于区域的目标检测——细粒度

计算机视觉战队

14+阅读 · 2018年2月1日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

相关论文

Elastic Queries Reinforcement Learning: Self-Aware Policy Execution for VLA Models

Arxiv

0+阅读 · 6月12日

Work-Efficient Query Evaluation in Constant Time with PRAMs

Arxiv

0+阅读 · 6月11日

A Unified Structured Query Understanding Framework for Industrial Semantic Search

Arxiv

0+阅读 · 6月7日

Earliest query answering over streamed trees

Arxiv

0+阅读 · 6月5日

Query-efficient model evaluation using cached responses

Arxiv

0+阅读 · 6月4日

Query-Adaptive Semantic Chunking for Retrieval-Augmented Generation: A Dynamic Strategy with Contextual Window Expansion

Arxiv

0+阅读 · 5月26日

Multivariate reconciliation for hierarchical time series

Arxiv

0+阅读 · 5月18日

Elastic Scheduling of Intermittent Query Processing in a Cluster Environment

Arxiv

0+阅读 · 5月17日

Maintaining Queries under Updates Using Heavy-Light Partitioning of the Input Relations

Arxiv

0+阅读 · 5月8日

ARC: Consistent, Low-Latency Delivery via Receiver-Side Scheduling

Arxiv

0+阅读 · 5月5日

相关基金

考虑时段费用的生产外包集成排序和协调机制设计研究

国家自然科学基金

0+阅读 · 2015年12月31日

云计算平台中大规模交互式服务长尾延迟消减关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

具有多操作特性的间歇工业过程监测技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

线性互补约束二次规划问题的一个全局算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

数据中心延迟敏感型应用尾端响应时延服务质量保障方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

混合分布模型中序性质和维修策略的一些研究

国家自然科学基金

0+阅读 · 2015年12月31日

柔性工序选择的混合流水车间调度及其离散群智能算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于地貌分析的复杂零空闲流水车间超启发式调度方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

集群环境下内存空间数据库管理与查询技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员