有限状态分散式策略控制与保证地面覆盖 (Finite-State Decentralized Policy-Based Control With Guaranteed Ground Coverage) - 专知论文

会员服务 ·

0

覆盖 · 智能体 · 结构 · 环境目标 · 表示 ·

Finite-State Decentralized Policy-Based Control With Guaranteed Ground Coverage

翻译：有限状态分散式策略控制与保证地面覆盖

Hossein Rastgoftar

We propose a finite-state, decentralized decision and control framework for multi-agent ground coverage. The approach decomposes the problem into two coupled components: (i) the structural design of a deep neural network (DNN) induced by the reference configuration of the agents, and (ii) policy-based decentralized coverage control. Agents are classified as anchors and followers, yielding a generic and scalable communication architecture in which each follower interacts with exactly three in-neighbors from the preceding layer, forming an enclosing triangular communication structure. The DNN training weights implicitly encode the spatial configuration of the agent team, thereby providing a geometric representation of the environmental target set. Within this architecture, we formulate a computationally efficient decentralized Markov decision process (MDP) whose components are time-invariant except for a time-varying cost function defined by the deviation from the centroid of the target set contained within each agent communication triangle. By introducing the concept of Anyway Output Controllability (AOC), we assume each agent is AOC and establish decentralized convergence to a desired configuration that optimally represents the environmental target.

翻译：我们提出了一种有限状态、分散式决策与控制框架，用于多智能体地面覆盖任务。该方法将问题分解为两个耦合部分：(i) 由智能体参考构型诱导的深度神经网络结构设计；(ii) 基于策略的分散式覆盖控制。智能体被划分为锚点智能体与跟随智能体，形成通用且可扩展的通信架构，其中每个跟随智能体仅与来自前一层的三个入邻居交互，构成封闭的三角形通信结构。深度神经网络的训练权重隐式编码了智能体团队的空间构型，从而提供了环境目标集的几何表示。在此架构中，我们构建了计算高效的分散式马尔可夫决策过程，其各组成部分除时变成本函数外均为时不变，该成本函数由每个智能体通信三角形内包含的目标集质心偏差定义。通过引入"任意输出可控性"概念，我们假设每个智能体均满足AOC条件，并证明了系统能够分散收敛到最优表示环境目标的期望构型。

0

相关内容

《多智能体系统中的边界定义可容许性：贝尔曼共约、全局安全与分布式最优性》

《多智能体系统中的边界定义可容许性：贝尔曼共约、全局安全与分布式最优性》

专知会员服务

12+阅读 · 2月14日

《卫星编队最优制导与导航的分层控制架构》45页

《卫星编队最优制导与导航的分层控制架构》45页

专知会员服务

14+阅读 · 2月12日

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

专知会员服务

22+阅读 · 2025年11月17日

《基于人工智能的动态任务分配策略在多智能体系统中的有效控制》

《基于人工智能的动态任务分配策略在多智能体系统中的有效控制》

专知会员服务

54+阅读 · 2025年6月10日

中文版 | 集中式与分布式多智能体AI协调策略

中文版 | 集中式与分布式多智能体AI协调策略

专知会员服务

19+阅读 · 2025年5月8日

《战略智能体与有限反馈下的序贯决策》211页

《战略智能体与有限反馈下的序贯决策》211页

专知会员服务

36+阅读 · 2025年5月7日

《人类-航空/航天机器人协作网络中的动态覆盖控制和估计》177页

《人类-航空/航天机器人协作网络中的动态覆盖控制和估计》177页

专知会员服务

35+阅读 · 2024年11月24日

《针对高性能协作跟踪和编队目标的分布式迭代学习控制》169页论文

《针对高性能协作跟踪和编队目标的分布式迭代学习控制》169页论文

专知会员服务

28+阅读 · 2024年3月23日

博士论文：领导者-追随者多智能体系统的瞬态控制与时空逻辑任务的应用

博士论文：领导者-追随者多智能体系统的瞬态控制与时空逻辑任务的应用

专知会员服务

46+阅读 · 2023年10月26日

博士论文《应用于时空逻辑任务的领导者-追随者多智能体系统的瞬态控制》

博士论文《应用于时空逻辑任务的领导者-追随者多智能体系统的瞬态控制》

专知会员服务

42+阅读 · 2023年4月15日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

38+阅读 · 2023年4月13日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

47+阅读 · 2022年11月16日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

32+阅读 · 2022年10月17日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

数据受限条件下的多模态处理技术综述

数据受限条件下的多模态处理技术综述

专知

22+阅读 · 2022年7月16日

美国「联合全域指挥与控制 (JADC2)」战略发展最新总结报告，12页pdf

美国「联合全域指挥与控制 (JADC2)」战略发展最新总结报告，12页pdf

专知

182+阅读 · 2022年3月23日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

多模态多任务学习新论文

多模态多任务学习新论文

专知

46+阅读 · 2019年2月9日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

网络化非线性系统的协调控制及其在分布式可重构航天器中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

受扰多智能体系统的分布式主动抗干扰协调控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

基于调度采样的网络化系统分布式控制策略研究

国家自然科学基金

0+阅读 · 2015年12月31日

多智能体系统有限时间一致性的自适应控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

Multi-Agent Pathfinding Under Team-Connected Communication Constraint via Adaptive Path Expansion and Dynamic Leading

Arxiv

0+阅读 · 2月3日

Flexible Multitask Learning with Factorized Diffusion Policy

Arxiv

0+阅读 · 2月1日

Dichotomous Diffusion Policy Optimization

Arxiv

0+阅读 · 2月1日

Meanshift Shape Formation Control Using Discrete Mass Distribution

Arxiv

0+阅读 · 2月1日

AI-Augmented Density-Driven Optimal Control (D2OC) for Decentralized Environmental Mapping

Arxiv

0+阅读 · 1月28日

EquiContact: A Hierarchical SE(3) Vision-to-Force Equivariant Policy for Spatially Generalizable Contact-rich Tasks

Arxiv

0+阅读 · 1月26日

Safe Heterogeneous Multi-Agent RL with Communication Regularization for Coordinated Target Acquisition

Arxiv

0+阅读 · 1月13日

A Novel Convex Layers Strategy for Circular Formation in Multi-Agent Systems

Arxiv

0+阅读 · 1月8日

FICO: Finite-Horizon Closed-Loop Factorization for Unified Multi-Agent Path Finding

Arxiv

0+阅读 · 1月6日

Optimal Transport-Based Decentralized Multi-Agent Distribution Matching

Arxiv

0+阅读 · 1月2日

VIP会员

文章信息

相关主题

相关VIP内容

《多智能体系统中的边界定义可容许性：贝尔曼共约、全局安全与分布式最优性》

《多智能体系统中的边界定义可容许性：贝尔曼共约、全局安全与分布式最优性》

专知会员服务

12+阅读 · 2月14日

《卫星编队最优制导与导航的分层控制架构》45页

《卫星编队最优制导与导航的分层控制架构》45页

专知会员服务

14+阅读 · 2月12日

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

专知会员服务

22+阅读 · 2025年11月17日

《基于人工智能的动态任务分配策略在多智能体系统中的有效控制》

《基于人工智能的动态任务分配策略在多智能体系统中的有效控制》

专知会员服务

54+阅读 · 2025年6月10日

中文版 | 集中式与分布式多智能体AI协调策略

中文版 | 集中式与分布式多智能体AI协调策略

专知会员服务

19+阅读 · 2025年5月8日

《战略智能体与有限反馈下的序贯决策》211页

《战略智能体与有限反馈下的序贯决策》211页

专知会员服务

36+阅读 · 2025年5月7日

《人类-航空/航天机器人协作网络中的动态覆盖控制和估计》177页

《人类-航空/航天机器人协作网络中的动态覆盖控制和估计》177页

专知会员服务

35+阅读 · 2024年11月24日

《针对高性能协作跟踪和编队目标的分布式迭代学习控制》169页论文

《针对高性能协作跟踪和编队目标的分布式迭代学习控制》169页论文

专知会员服务

28+阅读 · 2024年3月23日

博士论文：领导者-追随者多智能体系统的瞬态控制与时空逻辑任务的应用

博士论文：领导者-追随者多智能体系统的瞬态控制与时空逻辑任务的应用

专知会员服务

46+阅读 · 2023年10月26日

博士论文《应用于时空逻辑任务的领导者-追随者多智能体系统的瞬态控制》

博士论文《应用于时空逻辑任务的领导者-追随者多智能体系统的瞬态控制》

专知会员服务

42+阅读 · 2023年4月15日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】基于自适应表征的高效视觉建模

《多域作战中融合网络、电子战与动能机动》

AI智能体时代大模型安全风险与攻防新挑战

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

相关资讯

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

38+阅读 · 2023年4月13日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

47+阅读 · 2022年11月16日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

32+阅读 · 2022年10月17日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

数据受限条件下的多模态处理技术综述

数据受限条件下的多模态处理技术综述

专知

22+阅读 · 2022年7月16日

美国「联合全域指挥与控制 (JADC2)」战略发展最新总结报告，12页pdf

美国「联合全域指挥与控制 (JADC2)」战略发展最新总结报告，12页pdf

专知

182+阅读 · 2022年3月23日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

多模态多任务学习新论文

多模态多任务学习新论文

专知

46+阅读 · 2019年2月9日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

相关论文

Multi-Agent Pathfinding Under Team-Connected Communication Constraint via Adaptive Path Expansion and Dynamic Leading

Arxiv

0+阅读 · 2月3日

Flexible Multitask Learning with Factorized Diffusion Policy

Arxiv

0+阅读 · 2月1日

Dichotomous Diffusion Policy Optimization

Arxiv

0+阅读 · 2月1日

Meanshift Shape Formation Control Using Discrete Mass Distribution

Arxiv

0+阅读 · 2月1日

AI-Augmented Density-Driven Optimal Control (D2OC) for Decentralized Environmental Mapping

Arxiv

0+阅读 · 1月28日

EquiContact: A Hierarchical SE(3) Vision-to-Force Equivariant Policy for Spatially Generalizable Contact-rich Tasks

Arxiv

0+阅读 · 1月26日

Safe Heterogeneous Multi-Agent RL with Communication Regularization for Coordinated Target Acquisition

Arxiv

0+阅读 · 1月13日

A Novel Convex Layers Strategy for Circular Formation in Multi-Agent Systems

Arxiv

0+阅读 · 1月8日

FICO: Finite-Horizon Closed-Loop Factorization for Unified Multi-Agent Path Finding

Arxiv

0+阅读 · 1月6日

Optimal Transport-Based Decentralized Multi-Agent Distribution Matching

Arxiv

0+阅读 · 1月2日

相关基金

网络化非线性系统的协调控制及其在分布式可重构航天器中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

受扰多智能体系统的分布式主动抗干扰协调控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

基于调度采样的网络化系统分布式控制策略研究

国家自然科学基金

0+阅读 · 2015年12月31日

多智能体系统有限时间一致性的自适应控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员