Analyzing and controlling system entropy is a powerful tool for regulating predictability of control systems. Applications benefiting from such approaches range from reinforcement learning and data security to human-robot collaboration. In continuous-state stochastic systems, accurate entropy analysis and control remains a challenge. In recent years, finite-state abstractions of continuous systems have enabled control synthesis with formal performance guarantees on objectives such as stage costs. However, these results do not extend to entropy-based performance measures. We solve this problem by first obtaining bounds on the entropy of system discretizations using traditional formal-abstractions results, and then obtaining an additional bound on the difference between the entropy of a continuous distribution and that of its discretization. The resulting theory enables formal entropy-aware controller synthesis that trades predictability against control performance while preserving formal guarantees for the original continuous system. More specifically, we focus on minimizing the linear combination of the KL divergence of the system trajectory distribution to uniform -- our system entropy metric -- and a generic cumulative cost. We note that the bound we derive on the difference between the KL divergence to uniform of a given continuous distribution and its discretization can also be relevant in more general information-theoretic contexts. A set of case studies illustrates the effectiveness of the method.


翻译:分析与控制系统熵是调节控制系统可预测性的有力工具。受益于此类方法的应用范围广泛,涵盖强化学习、数据安全及人机协作等领域。在连续状态随机系统中,精确的熵分析与控制仍具挑战性。近年来,基于连续系统有限状态抽象的控制综合方法已能对阶段成本等目标提供形式化性能保证,但这些成果尚未扩展至基于熵的性能度量。本研究通过以下途径解决该问题:首先利用传统形式化抽象结果获得系统离散化的熵界,进而推导连续分布熵与其离散化熵之间差异的附加边界。所得理论实现了形式化的熵感知控制器综合,可在保持原始连续系统形式化保证的前提下,权衡可预测性与控制性能。具体而言,我们专注于最小化系统轨迹分布与均匀分布之间的KL散度(作为系统熵度量)与通用累积成本的线性组合。需要指出的是,我们所推导的给定连续分布及其离散化对均匀分布KL散度差异的边界,在更广泛的信息论语境中亦具参考价值。系列案例研究验证了该方法的有效性。

0
下载
关闭预览

相关内容

无人机系统控制研究综述
专知会员服务
42+阅读 · 2024年11月26日
【2023新书】控制系统(建模、分析和设计),192页pdf
专知会员服务
84+阅读 · 2023年6月22日
Kyoto大学Toshiyuki:快速复杂控制系统的实时优化,133页ppt
机器学习各种熵:从入门到全面掌握
AI研习社
10+阅读 · 2018年3月22日
从香农熵到手推KL散度:一文带你纵览机器学习中的信息论
算法与数学之美
10+阅读 · 2018年1月14日
【直观详解】信息熵、交叉熵和相对熵
机器学习研究会
10+阅读 · 2017年11月7日
无人机飞行控制方法概述
无人机
12+阅读 · 2017年10月7日
从点到线:逻辑回归到条件随机场
夕小瑶的卖萌屋
15+阅读 · 2017年7月22日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2月7日
VIP会员
最新内容
《新兴技术武器化及其对全球风险的影响》
专知会员服务
7+阅读 · 4月29日
《帕兰泰尔平台介绍:信息分析平台》
专知会员服务
18+阅读 · 4月29日
智能体化世界建模:基础、能力、规律及展望
专知会员服务
11+阅读 · 4月28日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员