高阶动作正则化在深度强化学习中的应用：从连续控制到建筑能源管理 (Higher-Order Action Regularization in Deep Reinforcement Learning: From Continuous Control to Building Energy Management) - 专知论文

会员服务 ·

0

高阶 · 正则化 · 平滑 · 系统 · 平滑性 ·

Higher-Order Action Regularization in Deep Reinforcement Learning: From Continuous Control to Building Energy Management

翻译：高阶动作正则化在深度强化学习中的应用：从连续控制到建筑能源管理

Faizan Ahmed,Aniket Dixit,James Brusey

from arxiv, 6 pages, accepted at NeurIPS workshop 2025

Deep reinforcement learning agents often exhibit erratic, high-frequency control behaviors that hinder real-world deployment due to excessive energy consumption and mechanical wear. We systematically investigate action smoothness regularization through higher-order derivative penalties, progressing from theoretical understanding in continuous control benchmarks to practical validation in building energy management. Our comprehensive evaluation across four continuous control environments demonstrates that third-order derivative penalties (jerk minimization) consistently achieve superior smoothness while maintaining competitive performance. We extend these findings to HVAC control systems where smooth policies reduce equipment switching by 60%, translating to significant operational benefits. Our work establishes higher-order action regularization as an effective bridge between RL optimization and operational constraints in energy-critical applications.

翻译：深度强化学习智能体常表现出不稳定、高频的控制行为，这些行为因能耗过高和机械磨损而阻碍其在实际场景中的部署。我们通过高阶导数惩罚系统性地研究了动作平滑性正则化方法，从连续控制基准任务的理论理解推进到建筑能源管理中的实际验证。在四个连续控制环境中的综合评估表明，三阶导数惩罚（加加速度最小化）能持续实现更优的平滑性，同时保持具有竞争力的性能表现。我们将这些发现扩展到暖通空调控制系统，其中平滑策略将设备切换频率降低了60%，转化为显著的实际运营效益。本研究确立了高阶动作正则化作为强化学习优化与能源关键应用中运行约束之间的有效桥梁。

0

相关内容

深度强化学习与模仿学习导论

深度强化学习与模仿学习导论

专知会员服务

25+阅读 · 2025年12月10日

面向关系建模的合作多智能体深度强化学习综述

面向关系建模的合作多智能体深度强化学习综述

专知会员服务

39+阅读 · 2025年4月18日

基于因果建模的强化学习控制: 现状及展望

基于因果建模的强化学习控制: 现状及展望

专知会员服务

78+阅读 · 2023年3月3日

【干货书】基于模型的强化学习:使用python工具箱从数据到连续动作，275页pdf

【干货书】基于模型的强化学习:使用python工具箱从数据到连续动作，275页pdf

专知会员服务

65+阅读 · 2022年12月21日

《用于控制、探索和安全的样本高效深度强化学习》里尔大学207页博士论文

《用于控制、探索和安全的样本高效深度强化学习》里尔大学207页博士论文

专知会员服务

38+阅读 · 2022年7月21日

基于深度强化学习的机器人运动控制研究进展

专知会员服务

65+阅读 · 2021年4月22日

深度强化学习在智能制造中的应用展望综述

深度强化学习在智能制造中的应用展望综述

专知会员服务

98+阅读 · 2021年1月28日

【DeepMind-Nando de Freitas】强化学习教程，102页ppt，Reinforcement Learning

【DeepMind-Nando de Freitas】强化学习教程，102页ppt，Reinforcement Learning

专知会员服务

84+阅读 · 2019年11月15日

【南洋理工大学课程】deep_reinforcement_learning（深度强化学习），109页ppt

【南洋理工大学课程】deep_reinforcement_learning（深度强化学习），109页ppt

专知会员服务

105+阅读 · 2019年11月2日

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

专知会员服务

26+阅读 · 2019年10月3日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

强化学习《奖励函数设计: Reward Shaping》详细解读

强化学习《奖励函数设计: Reward Shaping》详细解读

深度强化学习实验室

18+阅读 · 2020年9月1日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知

43+阅读 · 2020年3月10日

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

机器之心

20+阅读 · 2019年5月3日

【强化学习】强化学习到深度强化学习、强化学习商业用例

【强化学习】强化学习到深度强化学习、强化学习商业用例

产业智能官

30+阅读 · 2019年2月9日

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

产业智能官

16+阅读 · 2018年12月27日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

专知

78+阅读 · 2018年8月7日

【强化学习】强化学习与控制理论的区别与联系；深度强化学习的课程笔记。

【强化学习】强化学习与控制理论的区别与联系；深度强化学习的课程笔记。

产业智能官

49+阅读 · 2018年7月4日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

42+阅读 · 2015年12月31日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

39+阅读 · 2015年12月31日

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于强化学习的分布参数系统数据驱动控制

国家自然科学基金

7+阅读 · 2015年12月31日

信息论学习中的正则化及相关高维数据分析方法的数学理论

国家自然科学基金

12+阅读 · 2014年12月31日

压电智能作动器的高保真完整非线性动力学建模和高精度多通道运动协同同步控制系统一体化优化设计

国家自然科学基金

0+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

11+阅读 · 2008年12月31日

Rationality Measurement and Theory for Reinforcement Learning Agents

Arxiv

0+阅读 · 2月4日

Reinforcement Learning for Control Systems with Time Delays: A Comprehensive Survey

Arxiv

0+阅读 · 1月30日

RN-D: Discretized Categorical Actors with Regularized Networks for On-Policy Reinforcement Learning

Arxiv

0+阅读 · 1月30日

Beyond Distributions: Geometric Action Control for Continuous Reinforcement Learning

Arxiv

0+阅读 · 1月29日

Adapting the Behavior of Reinforcement Learning Agents to Changing Action Spaces and Reward Functions

Arxiv

0+阅读 · 1月28日

Scaling Rough Terrain Locomotion with Automatic Curriculum Reinforcement Learning

Arxiv

0+阅读 · 1月24日

Plug-and-Play Benchmarking of Reinforcement Learning Algorithms for Large-Scale Flow Control

Arxiv

0+阅读 · 1月21日

Continual Knowledge Adaptation for Reinforcement Learning

Arxiv

0+阅读 · 1月20日

Policy-Based Deep Reinforcement Learning Hyperheuristics for Job-Shop Scheduling Problems

Arxiv

0+阅读 · 1月16日

Multiagent Reinforcement Learning with Neighbor Action Estimation

Arxiv

0+阅读 · 1月8日

VIP会员

文章信息

相关主题

相关VIP内容

深度强化学习与模仿学习导论

深度强化学习与模仿学习导论

专知会员服务

25+阅读 · 2025年12月10日

面向关系建模的合作多智能体深度强化学习综述

面向关系建模的合作多智能体深度强化学习综述

专知会员服务

39+阅读 · 2025年4月18日

基于因果建模的强化学习控制: 现状及展望

基于因果建模的强化学习控制: 现状及展望

专知会员服务

78+阅读 · 2023年3月3日

【干货书】基于模型的强化学习:使用python工具箱从数据到连续动作，275页pdf

【干货书】基于模型的强化学习:使用python工具箱从数据到连续动作，275页pdf

专知会员服务

65+阅读 · 2022年12月21日

《用于控制、探索和安全的样本高效深度强化学习》里尔大学207页博士论文

《用于控制、探索和安全的样本高效深度强化学习》里尔大学207页博士论文

专知会员服务

38+阅读 · 2022年7月21日

基于深度强化学习的机器人运动控制研究进展

专知会员服务

65+阅读 · 2021年4月22日

深度强化学习在智能制造中的应用展望综述

深度强化学习在智能制造中的应用展望综述

专知会员服务

98+阅读 · 2021年1月28日

【DeepMind-Nando de Freitas】强化学习教程，102页ppt，Reinforcement Learning

【DeepMind-Nando de Freitas】强化学习教程，102页ppt，Reinforcement Learning

专知会员服务

84+阅读 · 2019年11月15日

【南洋理工大学课程】deep_reinforcement_learning（深度强化学习），109页ppt

【南洋理工大学课程】deep_reinforcement_learning（深度强化学习），109页ppt

专知会员服务

105+阅读 · 2019年11月2日

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

专知会员服务

26+阅读 · 2019年10月3日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

强化学习《奖励函数设计: Reward Shaping》详细解读

强化学习《奖励函数设计: Reward Shaping》详细解读

深度强化学习实验室

18+阅读 · 2020年9月1日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知

43+阅读 · 2020年3月10日

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

机器之心

20+阅读 · 2019年5月3日

【强化学习】强化学习到深度强化学习、强化学习商业用例

【强化学习】强化学习到深度强化学习、强化学习商业用例

产业智能官

30+阅读 · 2019年2月9日

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

产业智能官

16+阅读 · 2018年12月27日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

专知

78+阅读 · 2018年8月7日

【强化学习】强化学习与控制理论的区别与联系；深度强化学习的课程笔记。

【强化学习】强化学习与控制理论的区别与联系；深度强化学习的课程笔记。

产业智能官

49+阅读 · 2018年7月4日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

相关论文

Rationality Measurement and Theory for Reinforcement Learning Agents

Arxiv

0+阅读 · 2月4日

Reinforcement Learning for Control Systems with Time Delays: A Comprehensive Survey

Arxiv

0+阅读 · 1月30日

RN-D: Discretized Categorical Actors with Regularized Networks for On-Policy Reinforcement Learning

Arxiv

0+阅读 · 1月30日

Beyond Distributions: Geometric Action Control for Continuous Reinforcement Learning

Arxiv

0+阅读 · 1月29日

Adapting the Behavior of Reinforcement Learning Agents to Changing Action Spaces and Reward Functions

Arxiv

0+阅读 · 1月28日

Scaling Rough Terrain Locomotion with Automatic Curriculum Reinforcement Learning

Arxiv

0+阅读 · 1月24日

Plug-and-Play Benchmarking of Reinforcement Learning Algorithms for Large-Scale Flow Control

Arxiv

0+阅读 · 1月21日

Continual Knowledge Adaptation for Reinforcement Learning

Arxiv

0+阅读 · 1月20日

Policy-Based Deep Reinforcement Learning Hyperheuristics for Job-Shop Scheduling Problems

Arxiv

0+阅读 · 1月16日

Multiagent Reinforcement Learning with Neighbor Action Estimation

Arxiv

0+阅读 · 1月8日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

42+阅读 · 2015年12月31日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

39+阅读 · 2015年12月31日

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于强化学习的分布参数系统数据驱动控制

国家自然科学基金

7+阅读 · 2015年12月31日

信息论学习中的正则化及相关高维数据分析方法的数学理论

国家自然科学基金

12+阅读 · 2014年12月31日

压电智能作动器的高保真完整非线性动力学建模和高精度多通道运动协同同步控制系统一体化优化设计

国家自然科学基金

0+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

11+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员