We study whether optimal state-feedback laws for a family of heterogeneous Multiple-Input, Multiple-Output (MIMO) Linear Time-Invariant (LTI) systems can be captured by a single learned controller. We train one transformer policy on LQR-generated trajectories from systems with different state and input dimensions, using a shared representation with standardization, padding, dimension encoding, and masked loss. The policy maps recent state history to control actions without requiring plant matrices at inference time. Across a broad set of systems, it achieves empirically small sub-optimality relative to Linear Quadratic Regulator (LQR), remains stabilizing under moderate parameter perturbations, and benefits from lightweight fine-tuning on unseen systems. These results support transformer policies as practical approximators of near-optimal feedback laws over structured linear-system families.


翻译:本文研究针对一类异构多输入多输出线性时不变系统的最优状态反馈律,能否通过单一学习型控制器实现。我们基于不同状态与输入维度系统的LQR生成轨迹,采用共享表示结合标准化、填充、维度编码与掩码损失的方法,训练了一个Transformer策略。该策略在无需推理时获取被控对象矩阵的情况下,能够将近期状态历史映射为控制动作。在广泛的系统测试中,该策略相对于线性二次调节器实现了经验性的微小次优性,在适度参数扰动下仍能保持稳定,并能通过对未见系统进行轻量级微调获得性能提升。这些结果表明Transformer策略可作为结构化线性系统族上近似最优反馈律的实用逼近器。

0
下载
关闭预览

相关内容

年度最佳? ETHZ最新《简化版Transformer》论文
专知会员服务
50+阅读 · 2023年11月29日
Transformer它就是个支持向量机
专知会员服务
38+阅读 · 2023年9月7日
代码注释最详细的Transformer
专知会员服务
113+阅读 · 2022年6月30日
【ICML2022】Transformer是元强化学习器
专知会员服务
56+阅读 · 2022年6月15日
深度学习的下一步:Transformer和注意力机制
云头条
56+阅读 · 2019年9月14日
从头开始了解Transformer
AI科技评论
25+阅读 · 2019年8月28日
百闻不如一码!手把手教你用Python搭一个Transformer
大数据文摘
18+阅读 · 2019年4月22日
多图带你读懂 Transformers 的工作原理
AI研习社
10+阅读 · 2019年3月18日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Arxiv
0+阅读 · 3月16日
VIP会员
最新内容
具身AI安全综述:风险、攻击与防御
专知会员服务
2+阅读 · 今天12:02
DeepSeek 版Claude Code,免费小白安装教程来了!
专知会员服务
13+阅读 · 5月5日
《美空军条令出版物 2-0:情报(2026版)》
专知会员服务
16+阅读 · 5月5日
帕兰提尔 Gotham:一个游戏规则改变器
专知会员服务
9+阅读 · 5月5日
相关VIP内容
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员