Performance Optimization in Stream Processing Systems: Experiment-Driven Configuration Tuning for Kafka Streams - 专知论文

会员服务 ·

0

算法 · 流处理系统 · 系统 · Kafka · 系统性能 ·

Performance Optimization in Stream Processing Systems: Experiment-Driven Configuration Tuning for Kafka Streams

翻译：流处理系统性能优化：面向Kafka Streams的实验驱动配置调优

David Chen,Sören Henning,Kassiano Matteussi,Rick Rabiser

from arxiv, Accepted for the 9th Workshop on Hot Topics in Cloud Computing Performance (HotCloudPerf 2026) at ACM/SPEC ICPE 2026

Configuring stream processing systems for efficient performance, especially in cloud-native deployments, is a challenging and largely manual task. We present an experiment-driven approach for automated configuration optimization that combines three phases: Latin Hypercube Sampling for initial exploration, Simulated Annealing for guided stochastic search, and Hill Climbing for local refinement. The workflow is integrated with the cloud-native Theodolite benchmarking framework, enabling automated experiment orchestration on Kubernetes and early termination of underperforming configurations. In an experimental evaluation with Kafka Streams and a Kubernetes-based cloud testbed, our approach identifies configurations that improve throughput by up to 23% over the default. The results indicate that Latin Hypercube Sampling with early termination and Simulated Annealing are particularly effective in navigating the configuration space, whereas additional fine-tuning via Hill Climbing yields limited benefits.

翻译：为流处理系统配置高效性能（尤其在云原生部署场景中）是一项具有挑战性且高度依赖人工的任务。本文提出一种实验驱动的自动化配置优化方法，该方法融合三个阶段：采用拉丁超立方采样进行初始探索，利用模拟退火算法执行引导式随机搜索，并借助爬山算法完成局部优化。该工作流与云原生基准测试框架Theodolite集成，支持在Kubernetes上实现自动化实验编排及对低效配置的早期终止机制。基于Kafka Streams与Kubernetes云测试平台的实验评估表明，本方法所发现的配置方案相较于默认配置可提升高达23%的吞吐量。结果显示：结合早期终止机制的拉丁超立方采样与模拟退火算法在配置空间探索中效果显著，而通过爬山算法进行的额外微调则收益有限。

0

相关内容

在数学和计算机科学之中，算法（Algorithm）为一个计算的具体步骤，常用于计算、数据处理和自动推理。精确而言，算法是一个表示为有限长列表的有效方法。算法应包含清晰定义的指令用于计算函数。来自维基百科：算法

大语言模型驱动的最优化方法：基于生成式人工智能的建模、求解与验证

大语言模型驱动的最优化方法：基于生成式人工智能的建模、求解与验证

专知会员服务

39+阅读 · 1月25日

《高速强机动目标制导方法优化途径：不同优化途径能力分析》

《高速强机动目标制导方法优化途径：不同优化途径能力分析》

专知会员服务

18+阅读 · 2025年11月30日

【CMU博士论文】机器学习自动化算法设计实用方法，153页pdf

【CMU博士论文】机器学习自动化算法设计实用方法，153页pdf

专知会员服务

47+阅读 · 2023年11月18日

【2023新书】流程系统工程的高级优化，206页pdf

【2023新书】流程系统工程的高级优化，206页pdf

专知会员服务

65+阅读 · 2023年9月25日

用Transformer学习通用超参数优化器，DeepMind Yutian Chen博士讲授，附Slides与视频

用Transformer学习通用超参数优化器，DeepMind Yutian Chen博士讲授，附Slides与视频

专知会员服务

40+阅读 · 2023年3月12日

「分布式机器学习系统网络性能优化」研究进展

「分布式机器学习系统网络性能优化」研究进展

专知会员服务

28+阅读 · 2022年10月1日

Kyoto大学Toshiyuki：快速复杂控制系统的实时优化，133页ppt

Kyoto大学Toshiyuki：快速复杂控制系统的实时优化，133页ppt

专知会员服务

45+阅读 · 2021年12月7日

【博士论文】集群系统中的网络流调度

【博士论文】集群系统中的网络流调度

专知会员服务

47+阅读 · 2021年12月7日

【NeurIPS 2020】耶鲁大学等提出「AdaBelief」的新型优化器，速度快，训练稳，泛化强

专知会员服务

18+阅读 · 2020年10月19日

最新《流处理系统演化》综述论文，34页pdf

最新《流处理系统演化》综述论文，34页pdf

专知会员服务

21+阅读 · 2020年8月4日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

自动特征工程在推荐系统中的研究

自动特征工程在推荐系统中的研究

DataFunTalk

10+阅读 · 2019年12月20日

以BERT为例,如何优化机器学习模型性能?

以BERT为例,如何优化机器学习模型性能?

专知

10+阅读 · 2019年10月3日

推荐系统原理、工程、大厂(Youtube、BAT、TMB)架构干活分享

推荐系统原理、工程、大厂(Youtube、BAT、TMB)架构干活分享

深度学习与NLP

40+阅读 · 2019年9月13日

从动力学角度看优化算法：GAN的第三个阶段

从动力学角度看优化算法：GAN的第三个阶段

PaperWeekly

11+阅读 · 2019年5月13日

十种深度学习推荐系统代码实现，持续更新中！！！

十种深度学习推荐系统代码实现，持续更新中！！！

专知

113+阅读 · 2019年4月25日

机器学习中的最优化算法总结

机器学习中的最优化算法总结

人工智能前沿讲习班

22+阅读 · 2019年3月22日

详解 | 推荐系统的工程实现

详解 | 推荐系统的工程实现

AI100

42+阅读 · 2019年3月15日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

【计划排程】工业互联网正确打开方式系列（十三）：排程调度优化

【计划排程】工业互联网正确打开方式系列（十三）：排程调度优化

产业智能官

24+阅读 · 2018年9月12日

面向估计性能优化的网络化控制系统传感器调度

国家自然科学基金

0+阅读 · 2015年12月31日

自适应快速模拟细节丰富的流体技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于压电效应和液晶引流效应微流体组合驱动控制机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

混线生产系统典型干扰情境下基于仿真优化的批调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

大功率柔顺驱动器的设计方法及能量优化和交互安全机理研究

国家自然科学基金

1+阅读 · 2015年12月31日

全局性气动外形优化中的流场加速求解新方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向可重构多核处理器系统的分层次自适应优化机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂流体下微弯型科氏质量流量计驱动控制、信号处理和误差修正方法研究与实现

国家自然科学基金

0+阅读 · 2015年12月31日

配送中心物流作业调度问题的建模与优化

国家自然科学基金

2+阅读 · 2014年12月31日

云环境中支持混合并行模式的科学工作流的执行优化

国家自然科学基金

0+阅读 · 2014年12月31日

On the minimax optimality of Flow Matching through the connection to kernel density estimation

Arxiv

0+阅读 · 3月17日

Flow-Factory: A Unified Framework for Reinforcement Learning in Flow-Matching Models

Arxiv

0+阅读 · 3月2日

Active Flow Matching

Arxiv

0+阅读 · 3月1日

Data Driven Optimization of GPU efficiency for Distributed LLM Adapter Serving

Arxiv

0+阅读 · 2月27日

CARAT: Client-Side Adaptive RPC and Cache Co-Tuning for Parallel File Systems

Arxiv

0+阅读 · 2月25日

Downwash-aware Configuration Optimization for Modular Aerial Systems

Arxiv

0+阅读 · 2月20日

Visual Insights into Agentic Optimization of Pervasive Stream Processing Services

Arxiv

0+阅读 · 2月19日

On the Relation between Rectified Flows and Optimal Transport

Arxiv

0+阅读 · 2月15日

Better Source, Better Flow: Learning Condition-Dependent Source Distribution for Flow Matching

Arxiv

0+阅读 · 2月5日

SplineFlow: Flow Matching for Dynamical Systems with B-Spline Interpolants

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

流处理系统

最新内容

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

专知会员服务

7+阅读 · 7月18日

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

专知会员服务

5+阅读 · 7月18日

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

专知会员服务

6+阅读 · 7月18日

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

专知会员服务

4+阅读 · 7月18日

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

专知会员服务

8+阅读 · 7月17日

《边缘端实时无线感知赋能现场多机器人部署》200页

《边缘端实时无线感知赋能现场多机器人部署》200页

专知会员服务

7+阅读 · 7月17日

战力倍增器：自主武器系统与乌克兰及加沙冲突

战力倍增器：自主武器系统与乌克兰及加沙冲突

专知会员服务

4+阅读 · 7月17日

人工智能赋能战场情报：提速决策进程

人工智能赋能战场情报：提速决策进程

专知会员服务

2+阅读 · 7月17日

《拥抱新兴技术：面向未来军官的教育革新》

《拥抱新兴技术：面向未来军官的教育革新》

专知会员服务

5+阅读 · 7月17日

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

专知会员服务

3+阅读 · 7月17日

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

专知会员服务

4+阅读 · 7月17日

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

专知会员服务

12+阅读 · 7月16日

《无人地面战车（UGV）的崛起》报告

《无人地面战车（UGV）的崛起》报告

专知会员服务

7+阅读 · 7月16日

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

专知会员服务

6+阅读 · 7月16日

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

专知会员服务

14+阅读 · 7月16日

相关VIP内容

大语言模型驱动的最优化方法：基于生成式人工智能的建模、求解与验证

大语言模型驱动的最优化方法：基于生成式人工智能的建模、求解与验证

专知会员服务

39+阅读 · 1月25日

《高速强机动目标制导方法优化途径：不同优化途径能力分析》

《高速强机动目标制导方法优化途径：不同优化途径能力分析》

专知会员服务

18+阅读 · 2025年11月30日

【CMU博士论文】机器学习自动化算法设计实用方法，153页pdf

【CMU博士论文】机器学习自动化算法设计实用方法，153页pdf

专知会员服务

47+阅读 · 2023年11月18日

【2023新书】流程系统工程的高级优化，206页pdf

【2023新书】流程系统工程的高级优化，206页pdf

专知会员服务

65+阅读 · 2023年9月25日

用Transformer学习通用超参数优化器，DeepMind Yutian Chen博士讲授，附Slides与视频

用Transformer学习通用超参数优化器，DeepMind Yutian Chen博士讲授，附Slides与视频

专知会员服务

40+阅读 · 2023年3月12日

「分布式机器学习系统网络性能优化」研究进展

「分布式机器学习系统网络性能优化」研究进展

专知会员服务

28+阅读 · 2022年10月1日

Kyoto大学Toshiyuki：快速复杂控制系统的实时优化，133页ppt

Kyoto大学Toshiyuki：快速复杂控制系统的实时优化，133页ppt

专知会员服务

45+阅读 · 2021年12月7日

【博士论文】集群系统中的网络流调度

【博士论文】集群系统中的网络流调度

专知会员服务

47+阅读 · 2021年12月7日

【NeurIPS 2020】耶鲁大学等提出「AdaBelief」的新型优化器，速度快，训练稳，泛化强

专知会员服务

18+阅读 · 2020年10月19日

最新《流处理系统演化》综述论文，34页pdf

最新《流处理系统演化》综述论文，34页pdf

专知会员服务

21+阅读 · 2020年8月4日

热门VIP内容

开通专知VIP会员享更多权益服务

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

相关资讯

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

自动特征工程在推荐系统中的研究

自动特征工程在推荐系统中的研究

DataFunTalk

10+阅读 · 2019年12月20日

以BERT为例,如何优化机器学习模型性能?

以BERT为例,如何优化机器学习模型性能?

专知

10+阅读 · 2019年10月3日

推荐系统原理、工程、大厂(Youtube、BAT、TMB)架构干活分享

推荐系统原理、工程、大厂(Youtube、BAT、TMB)架构干活分享

深度学习与NLP

40+阅读 · 2019年9月13日

从动力学角度看优化算法：GAN的第三个阶段

从动力学角度看优化算法：GAN的第三个阶段

PaperWeekly

11+阅读 · 2019年5月13日

十种深度学习推荐系统代码实现，持续更新中！！！

十种深度学习推荐系统代码实现，持续更新中！！！

专知

113+阅读 · 2019年4月25日

机器学习中的最优化算法总结

机器学习中的最优化算法总结

人工智能前沿讲习班

22+阅读 · 2019年3月22日

详解 | 推荐系统的工程实现

详解 | 推荐系统的工程实现

AI100

42+阅读 · 2019年3月15日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

【计划排程】工业互联网正确打开方式系列（十三）：排程调度优化

【计划排程】工业互联网正确打开方式系列（十三）：排程调度优化

产业智能官

24+阅读 · 2018年9月12日

相关论文

On the minimax optimality of Flow Matching through the connection to kernel density estimation

Arxiv

0+阅读 · 3月17日

Flow-Factory: A Unified Framework for Reinforcement Learning in Flow-Matching Models

Arxiv

0+阅读 · 3月2日

Active Flow Matching

Arxiv

0+阅读 · 3月1日

Data Driven Optimization of GPU efficiency for Distributed LLM Adapter Serving

Arxiv

0+阅读 · 2月27日

CARAT: Client-Side Adaptive RPC and Cache Co-Tuning for Parallel File Systems

Arxiv

0+阅读 · 2月25日

Downwash-aware Configuration Optimization for Modular Aerial Systems

Arxiv

0+阅读 · 2月20日

Visual Insights into Agentic Optimization of Pervasive Stream Processing Services

Arxiv

0+阅读 · 2月19日

On the Relation between Rectified Flows and Optimal Transport

Arxiv

0+阅读 · 2月15日

Better Source, Better Flow: Learning Condition-Dependent Source Distribution for Flow Matching

Arxiv

0+阅读 · 2月5日

SplineFlow: Flow Matching for Dynamical Systems with B-Spline Interpolants

Arxiv

0+阅读 · 1月30日

相关基金

面向估计性能优化的网络化控制系统传感器调度

国家自然科学基金

0+阅读 · 2015年12月31日

自适应快速模拟细节丰富的流体技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于压电效应和液晶引流效应微流体组合驱动控制机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

混线生产系统典型干扰情境下基于仿真优化的批调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

大功率柔顺驱动器的设计方法及能量优化和交互安全机理研究

国家自然科学基金

1+阅读 · 2015年12月31日

全局性气动外形优化中的流场加速求解新方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向可重构多核处理器系统的分层次自适应优化机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂流体下微弯型科氏质量流量计驱动控制、信号处理和误差修正方法研究与实现

国家自然科学基金

0+阅读 · 2015年12月31日

配送中心物流作业调度问题的建模与优化

国家自然科学基金

2+阅读 · 2014年12月31日

云环境中支持混合并行模式的科学工作流的执行优化

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员