基于惩罚函数与块坐标优化的多智能体时序逻辑规划 (Multi-Agent Temporal Logic Planning via Penalty Functions and Block-Coordinate Optimization) - 专知论文

会员服务 ·

0

惩罚函数 · 时序逻辑 · 时序 · 多智能体 · 智能体 ·

Multi-Agent Temporal Logic Planning via Penalty Functions and Block-Coordinate Optimization

翻译：基于惩罚函数与块坐标优化的多智能体时序逻辑规划

Eleftherios E. Vlahakis,Arash Bahari Kordabad,Lars Lindemann,Pantelis Sopasakis,Sadegh Soudjani,Dimos V. Dimarogonas

from arxiv, Submitted to L-CSS

Multi-agent planning under Signal Temporal Logic (STL) is often hindered by collaborative tasks that lead to computational challenges due to the inherent high-dimensionality of the problem, preventing scalable synthesis with satisfaction guarantees. To address this, we formulate STL planning as an optimization program under arbitrary multi-agent constraints and introduce a penalty-based unconstrained relaxation that can be efficiently solved via a Block-Coordinate Gradient Descent (BCGD) method, where each block corresponds to a single agent's decision variables, thereby mitigating complexity. By utilizing a quadratic penalty function defined via smooth STL semantics, we show that BCGD iterations converge to a stationary point of the penalized problem under standard regularity assumptions. To enforce feasibility, the BCGD solver is embedded within a two-layer optimization scheme: inner BCGD updates are performed for a fixed penalty parameter, which is then increased in an outer loop to progressively improve multi-agent STL robustness. The proposed framework enables scalable computations and is validated through various complex multi-robot planning scenarios.

翻译：在信号时序逻辑（STL）下的多智能体规划常因协作任务导致计算挑战，问题固有的高维性阻碍了具有满足保证的可扩展综合。为解决此问题，我们将STL规划表述为任意多智能体约束下的优化程序，并引入一种基于惩罚的无约束松弛方法，该方法可通过块坐标梯度下降（BCGD）算法高效求解——其中每个块对应单个智能体的决策变量，从而降低复杂度。通过利用基于平滑STL语义定义的二次惩罚函数，我们证明在标准正则性假设下，BCGD迭代收敛于惩罚问题的稳定点。为确保可行性，BCGD求解器被嵌入双层优化框架：内层对固定惩罚参数执行BCGD更新，外层循环则逐步增大惩罚参数以持续提升多智能体STL鲁棒性。所提框架实现了可扩展计算，并通过多种复杂多机器人规划场景得到验证。

0

相关内容

惩罚函数

多智能体强化学习中的稳健且高效的通信

多智能体强化学习中的稳健且高效的通信

专知会员服务

25+阅读 · 2025年11月17日

《基于时序逻辑规范的移动机器人规划与控制研究进展》最新180页

《基于时序逻辑规范的移动机器人规划与控制研究进展》最新180页

专知会员服务

21+阅读 · 2025年5月30日

《多智能体系统的神经协调：多领域任务环境中基于深度学习的智能体最优选择框架》

《多智能体系统的神经协调：多领域任务环境中基于深度学习的智能体最优选择框架》

专知会员服务

25+阅读 · 2025年5月7日

《注意力驱动的多智能体强化学习：利用专业知识强化任务决策》

《注意力驱动的多智能体强化学习：利用专业知识强化任务决策》

专知会员服务

55+阅读 · 2024年8月3日

《多智能体强化学习策略优化算法设计》226页

《多智能体强化学习策略优化算法设计》226页

专知会员服务

63+阅读 · 2024年6月9日

《多智能体系统的迭代规划：在能源感知无人机-无人地面车辆合作任务地点分配中的应用》

《多智能体系统的迭代规划：在能源感知无人机-无人地面车辆合作任务地点分配中的应用》

专知会员服务

37+阅读 · 2024年3月24日

【NTU博士论文】复杂序列决策中的多智能体强化学习，176页pdf

【NTU博士论文】复杂序列决策中的多智能体强化学习，176页pdf

专知会员服务

72+阅读 · 2024年1月13日

《多智能体深度强化学习模型中动作序列的解释》AAMAS 2023

《多智能体深度强化学习模型中动作序列的解释》AAMAS 2023

专知会员服务

30+阅读 · 2023年6月18日

多智能体协同决策方法研究

多智能体协同决策方法研究

专知会员服务

133+阅读 · 2022年12月15日

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

专知会员服务

26+阅读 · 2019年10月3日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知

18+阅读 · 2022年9月28日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知

58+阅读 · 2022年4月30日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

【综述】多智能体强化学习算法理论研究

【综述】多智能体强化学习算法理论研究

深度强化学习实验室

15+阅读 · 2020年9月9日

多智能体强化学习（MARL）近年研究概览

多智能体强化学习（MARL）近年研究概览

PaperWeekly

38+阅读 · 2020年3月15日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

时序异常检测算法概览

时序异常检测算法概览

论智

29+阅读 · 2018年8月30日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

基于动态增益非线性干扰观测器的多智能体系统协调跟踪和干扰抑制

国家自然科学基金

1+阅读 · 2015年12月31日

事件触发机制下随机多智能体系统的有限时间一致性研究

国家自然科学基金

2+阅读 · 2015年12月31日

多智能体系统有限时间一致性的自适应控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

Safe Continuous-time Multi-Agent Reinforcement Learning via Epigraph Form

Arxiv

0+阅读 · 2月19日

ParaCook: On Time-Efficient Planning for Multi-Agent Systems

Arxiv

0+阅读 · 2月15日

LLM-Grounded Dynamic Task Planning with Hierarchical Temporal Logic for Human-Aware Multi-Robot Collaboration

Arxiv

0+阅读 · 2月10日

Spatiotemporal Attention-Augmented Inverse Reinforcement Learning for Multi-Agent Task Allocation

Arxiv

0+阅读 · 2月9日

TodoEvolve: Learning to Architect Agent Planning Systems

Arxiv

0+阅读 · 2月8日

Multi-Agent Pathfinding Under Team-Connected Communication Constraint via Adaptive Path Expansion and Dynamic Leading

Arxiv

0+阅读 · 2月3日

Visual Reasoning over Time Series via Multi-Agent System

Arxiv

0+阅读 · 2月3日

Multi-Agent Monte Carlo Tree Search for Makespan-Efficient Object Rearrangement in Cluttered Spaces

Arxiv

0+阅读 · 2月2日

Scaling Multiagent Systems with Process Rewards

Arxiv

0+阅读 · 1月30日

MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks

Arxiv

0+阅读 · 1月29日

VIP会员

文章信息

相关主题

相关VIP内容

多智能体强化学习中的稳健且高效的通信

多智能体强化学习中的稳健且高效的通信

专知会员服务

25+阅读 · 2025年11月17日

《基于时序逻辑规范的移动机器人规划与控制研究进展》最新180页

《基于时序逻辑规范的移动机器人规划与控制研究进展》最新180页

专知会员服务

21+阅读 · 2025年5月30日

《多智能体系统的神经协调：多领域任务环境中基于深度学习的智能体最优选择框架》

《多智能体系统的神经协调：多领域任务环境中基于深度学习的智能体最优选择框架》

专知会员服务

25+阅读 · 2025年5月7日

《注意力驱动的多智能体强化学习：利用专业知识强化任务决策》

《注意力驱动的多智能体强化学习：利用专业知识强化任务决策》

专知会员服务

55+阅读 · 2024年8月3日

《多智能体强化学习策略优化算法设计》226页

《多智能体强化学习策略优化算法设计》226页

专知会员服务

63+阅读 · 2024年6月9日

《多智能体系统的迭代规划：在能源感知无人机-无人地面车辆合作任务地点分配中的应用》

《多智能体系统的迭代规划：在能源感知无人机-无人地面车辆合作任务地点分配中的应用》

专知会员服务

37+阅读 · 2024年3月24日

【NTU博士论文】复杂序列决策中的多智能体强化学习，176页pdf

【NTU博士论文】复杂序列决策中的多智能体强化学习，176页pdf

专知会员服务

72+阅读 · 2024年1月13日

《多智能体深度强化学习模型中动作序列的解释》AAMAS 2023

《多智能体深度强化学习模型中动作序列的解释》AAMAS 2023

专知会员服务

30+阅读 · 2023年6月18日

多智能体协同决策方法研究

多智能体协同决策方法研究

专知会员服务

133+阅读 · 2022年12月15日

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

专知会员服务

26+阅读 · 2019年10月3日

热门VIP内容

开通专知VIP会员享更多权益服务

《可信人工智能赋能系统的支柱》

《从经典神经网络到不确定性下的拓扑神经网络：军事应用》2026最新40页报告

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

《人工智能：对战略与力量的影响》slides

相关资讯

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知

18+阅读 · 2022年9月28日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知

58+阅读 · 2022年4月30日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

【综述】多智能体强化学习算法理论研究

【综述】多智能体强化学习算法理论研究

深度强化学习实验室

15+阅读 · 2020年9月9日

多智能体强化学习（MARL）近年研究概览

多智能体强化学习（MARL）近年研究概览

PaperWeekly

38+阅读 · 2020年3月15日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

时序异常检测算法概览

时序异常检测算法概览

论智

29+阅读 · 2018年8月30日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

相关论文

Safe Continuous-time Multi-Agent Reinforcement Learning via Epigraph Form

Arxiv

0+阅读 · 2月19日

ParaCook: On Time-Efficient Planning for Multi-Agent Systems

Arxiv

0+阅读 · 2月15日

LLM-Grounded Dynamic Task Planning with Hierarchical Temporal Logic for Human-Aware Multi-Robot Collaboration

Arxiv

0+阅读 · 2月10日

Spatiotemporal Attention-Augmented Inverse Reinforcement Learning for Multi-Agent Task Allocation

Arxiv

0+阅读 · 2月9日

TodoEvolve: Learning to Architect Agent Planning Systems

Arxiv

0+阅读 · 2月8日

Multi-Agent Pathfinding Under Team-Connected Communication Constraint via Adaptive Path Expansion and Dynamic Leading

Arxiv

0+阅读 · 2月3日

Visual Reasoning over Time Series via Multi-Agent System

Arxiv

0+阅读 · 2月3日

Multi-Agent Monte Carlo Tree Search for Makespan-Efficient Object Rearrangement in Cluttered Spaces

Arxiv

0+阅读 · 2月2日

Scaling Multiagent Systems with Process Rewards

Arxiv

0+阅读 · 1月30日

MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks

Arxiv

0+阅读 · 1月29日

相关基金

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

基于动态增益非线性干扰观测器的多智能体系统协调跟踪和干扰抑制

国家自然科学基金

1+阅读 · 2015年12月31日

事件触发机制下随机多智能体系统的有限时间一致性研究

国家自然科学基金

2+阅读 · 2015年12月31日

多智能体系统有限时间一致性的自适应控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员