《面向大语言模型引导规划、Bandit算法驱动探索与多智能体导航的分层决策问题研究》180页 - 专知VIP

会员服务 ·

9

军事防务 · 大语言模型 · 多智能体 · 博士论文 ·

《面向大语言模型引导规划、Bandit算法驱动探索与多智能体导航的分层决策问题研究》180页

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

自主多智能体系统必须在动态和未知环境中高效规划、探索与导航，尤其在搜索救援和环境监测等任务中。这些场景通常具有部分可观测性、通信受限和动态目标等特点，需要智能体之间进行灵活的协调。设计能够随团队规模和任务复杂性扩展的自主性，需要能够进行高层推理、信息驱动探索和稳健去中心化执行的模块化决策系统。本论文提出了一个分层决策框架，旨在从三个互补的自主层级应对这些挑战：高层规划、自适应探索和去中心化可扩展导航。在最高层级，LLaMAR（基于语言模型的多智能体机器人长时程规划器）利用大语言模型（LLMs）将长时程任务分解为结构化的子任务，使智能体能够动态调整策略。然而，这些计划的有效执行需要环境知识。我们中层的探索策略，BaTMaN（基于赌博机的追踪监测与导航），系统性地优先考虑能最大化信息增益的路径点，同时平衡能源效率和传感器可靠性等现实约束。最后，InforMARL（信息驱动的多智能体强化学习导航）通过基于图的局部信息聚合，提供了可扩展的去中心化导航，提高了采样效率，并展示了对未见过的团队规模的迁移能力。

本文分别开发了这些模块，以解决自主架构的不同层级问题。LLaMAR 充当高层规划器，将自然语言目标转化为结构化的子任务序列，并通过“规划-执行-校正-验证”循环纳入实时修正。BaTMaN 作为中层探索引擎，引导配备传感器的智能体基于不确定性优先探索信息丰富的区域。InforMARL 在底层执行层运行，使去中心化的智能体能够利用基于图的局部信息聚合和反应式控制策略在动态环境中导航。每个模块均可独立部署，并分别针对战略推理、数据高效监测和可扩展导航等不同挑战进行了优化。当三者结合时，这三个模块为在不确定性环境下运行的多智能体系统形成了一个连贯的自主架构。

成为VIP会员查看完整内容

17

相关内容

军事防务

军事防务数据板块介绍：系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块，其核心在于整合全球新兴国防技术（军事人工智能、无人系统等）、热点案例（俄乌战争、美以伊战争）等方面的最新时讯、研究报告/论文、条令法规、案例分析，为战略研判、情报分析、决策支持等提供知识支撑。

《人工智能中的多智能体自主决策》380页博士论文

《人工智能中的多智能体自主决策》380页博士论文

专知会员服务

37+阅读 · 5月14日

《多智能体系统中人与自主系统协作的工程化共享领导力》276页

《多智能体系统中人与自主系统协作的工程化共享领导力》276页

专知会员服务

25+阅读 · 3月23日

《多智能体大语言模型系统的可靠决策研究》

《多智能体大语言模型系统的可靠决策研究》

专知会员服务

41+阅读 · 2月2日

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

专知会员服务

28+阅读 · 2025年11月17日

《基于人工智能的动态任务分配策略在多智能体系统中的有效控制》

《基于人工智能的动态任务分配策略在多智能体系统中的有效控制》

专知会员服务

56+阅读 · 2025年6月10日

《多域人机交互研究》95页

《多域人机交互研究》95页

专知会员服务

38+阅读 · 2025年6月2日

《不确定通信条件下的分布式多智能体决策》122页

《不确定通信条件下的分布式多智能体决策》122页

专知会员服务

58+阅读 · 2025年2月26日

《面向多计算系统的人工智能自主决策》330页

《面向多计算系统的人工智能自主决策》330页

专知会员服务

67+阅读 · 2024年11月21日

《基于策略的多智能体多团队系统框架》319页

《基于策略的多智能体多团队系统框架》319页

专知会员服务

73+阅读 · 2024年5月1日

多智能体自主系统《群体自主系统的实时路径规划》248页

多智能体自主系统《群体自主系统的实时路径规划》248页

专知会员服务

92+阅读 · 2024年3月19日

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

39+阅读 · 2023年4月11日

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

专知

23+阅读 · 2023年4月8日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

专知

68+阅读 · 2022年11月2日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

33+阅读 · 2022年10月17日

《基于军事能力规划的计算机辅助兵棋推演》18页论文，北约总部盟军最高指挥官转型

《基于军事能力规划的计算机辅助兵棋推演》18页论文，北约总部盟军最高指挥官转型

专知

36+阅读 · 2022年10月16日

推荐！《基于人工智能（AI）的空中和导弹防御（AMD）：以结果为导向的辅助决策》美国海军研究生院系统工程顶点报告145页

推荐！《基于人工智能（AI）的空中和导弹防御（AMD）：以结果为导向的辅助决策》美国海军研究生院系统工程顶点报告145页

专知

119+阅读 · 2022年9月1日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

专访俞栋：多模态是迈向通用人工智能的重要方向

专访俞栋：多模态是迈向通用人工智能的重要方向

AI科技评论

27+阅读 · 2019年9月9日

自动驾驶技术解读——自动驾驶汽车决策控制系统

自动驾驶技术解读——自动驾驶汽车决策控制系统

智能交通技术

30+阅读 · 2019年7月7日

多层动态网络的建模、群体动力学分析与控制

国家自然科学基金

3+阅读 · 2015年12月31日

高动态环境下的多普勒测速脉冲星导航方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

受扰多智能体系统的分布式主动抗干扰协调控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

复杂非完整多自主体网络协同算法设计与性能极限分析

国家自然科学基金

1+阅读 · 2015年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

Do LLM-derived graph priors improve multi-agent coordination?

Arxiv

0+阅读 · 4月19日

Reasoning Provenance for Autonomous AI Agents: Structured Behavioral Analytics Beyond State Checkpoints and Execution Traces

Arxiv

1+阅读 · 4月10日

Exploring Plan Space through Conversation: An Agentic Framework for LLM-Mediated Explanations in Planning

Arxiv

0+阅读 · 4月9日

Integrating Deep RL and Bayesian Inference for ObjectNav in Mobile Robotics

Arxiv

0+阅读 · 3月26日

GoAgent: Group-of-Agents Communication Topology Generation for LLM-based Multi-Agent Systems

Arxiv

0+阅读 · 3月20日

OmniVLN: Omnidirectional 3D Perception and Token-Efficient LLM Reasoning for Visual-Language Navigation across Air and Ground Platforms

OmniVLN: Omnidirectional 3D Perception and Token-Efficient LLM Reasoning for Visual-Language Navigation across Air and Ground Platforms

Arxiv

0+阅读 · 3月18日

Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

Arxiv

0+阅读 · 3月10日

Large Language Models Empowered Agent-based Modeling and Simulation: A Survey and Perspectives

Arxiv

27+阅读 · 2023年12月19日

Hierarchical Multi-Agent Reinforcement Learning for Air Combat Maneuvering

Arxiv

49+阅读 · 2023年9月20日

The Rise and Potential of Large Language Model Based Agents: A Survey

Arxiv

50+阅读 · 2023年9月14日

VIP会员

相关主题

大语言模型

最新内容

《面向指挥控制训练与实时北约兼容数据分发的战术模拟器》

《面向指挥控制训练与实时北约兼容数据分发的战术模拟器》

专知会员服务

1+阅读 · 今天5:21

《决策模型比较研究》

《决策模型比较研究》

专知会员服务

5+阅读 · 今天5:16

全球军事与武器工业中的人工智能：应用、方法与影响（万字长文）

全球军事与武器工业中的人工智能：应用、方法与影响（万字长文）

专知会员服务

2+阅读 · 今天4:37

《美军水下战与海床战概述及本地实施》

《美军水下战与海床战概述及本地实施》

专知会员服务

2+阅读 · 今天4:30

面向未来冲突推进陆军情报体制改革

面向未来冲突推进陆军情报体制改革

专知会员服务

2+阅读 · 今天4:12

人工智能赋能无人机：俄乌冲突案例及其深远影响（万字长文）

人工智能赋能无人机：俄乌冲突案例及其深远影响（万字长文）

专知会员服务

3+阅读 · 今天2:54

《反无人机蜂群：有人-无人协同防御场景下的编队重构分析》

《反无人机蜂群：有人-无人协同防御场景下的编队重构分析》

专知会员服务

7+阅读 · 7月24日

《史诗怒火/咆哮雄狮行动：针对伊朗空中战役的战略分析》68页智库报告

《史诗怒火/咆哮雄狮行动：针对伊朗空中战役的战略分析》68页智库报告

专知会员服务

6+阅读 · 7月24日

“愈演愈烈的欺骗与干扰博弈”：无人机与人工智能背景下俄乌强化以无人机为核心的电子战

“愈演愈烈的欺骗与干扰博弈”：无人机与人工智能背景下俄乌强化以无人机为核心的电子战

专知会员服务

4+阅读 · 7月24日

乌克兰纵深打击如何重塑俄罗斯的战略选择

乌克兰纵深打击如何重塑俄罗斯的战略选择

专知会员服务

2+阅读 · 7月24日

《分布式太空任务对比分析与综合建模及仿真环境》120页

《分布式太空任务对比分析与综合建模及仿真环境》120页

专知会员服务

2+阅读 · 7月24日

俄乌战争中关于中程打击无人机部署的经验启示

俄乌战争中关于中程打击无人机部署的经验启示

专知会员服务

3+阅读 · 7月24日

《远程自主系统可扩展态势感知的解决方案》32页2026最新报告

《远程自主系统可扩展态势感知的解决方案》32页2026最新报告

专知会员服务

5+阅读 · 7月23日

《基于强化学习的自动化红队测试》

《基于强化学习的自动化红队测试》

专知会员服务

5+阅读 · 7月23日

《下一代无人机-卫星通信：人工智能创新与未来展望》32页长综述

《下一代无人机-卫星通信：人工智能创新与未来展望》32页长综述

专知会员服务

8+阅读 · 7月23日

相关VIP内容

《人工智能中的多智能体自主决策》380页博士论文

《人工智能中的多智能体自主决策》380页博士论文

专知会员服务

37+阅读 · 5月14日

《多智能体系统中人与自主系统协作的工程化共享领导力》276页

《多智能体系统中人与自主系统协作的工程化共享领导力》276页

专知会员服务

25+阅读 · 3月23日

《多智能体大语言模型系统的可靠决策研究》

《多智能体大语言模型系统的可靠决策研究》

专知会员服务

41+阅读 · 2月2日

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

专知会员服务

28+阅读 · 2025年11月17日

《基于人工智能的动态任务分配策略在多智能体系统中的有效控制》

《基于人工智能的动态任务分配策略在多智能体系统中的有效控制》

专知会员服务

56+阅读 · 2025年6月10日

《多域人机交互研究》95页

《多域人机交互研究》95页

专知会员服务

38+阅读 · 2025年6月2日

《不确定通信条件下的分布式多智能体决策》122页

《不确定通信条件下的分布式多智能体决策》122页

专知会员服务

58+阅读 · 2025年2月26日

《面向多计算系统的人工智能自主决策》330页

《面向多计算系统的人工智能自主决策》330页

专知会员服务

67+阅读 · 2024年11月21日

《基于策略的多智能体多团队系统框架》319页

《基于策略的多智能体多团队系统框架》319页

专知会员服务

73+阅读 · 2024年5月1日

多智能体自主系统《群体自主系统的实时路径规划》248页

多智能体自主系统《群体自主系统的实时路径规划》248页

专知会员服务

92+阅读 · 2024年3月19日

热门VIP内容

开通专知VIP会员享更多权益服务

《决策模型比较研究》

《美军水下战与海床战概述及本地实施》

《面向指挥控制训练与实时北约兼容数据分发的战术模拟器》

全球军事与武器工业中的人工智能：应用、方法与影响（万字长文）

相关资讯

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

39+阅读 · 2023年4月11日

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

专知

23+阅读 · 2023年4月8日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

专知

68+阅读 · 2022年11月2日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

33+阅读 · 2022年10月17日

《基于军事能力规划的计算机辅助兵棋推演》18页论文，北约总部盟军最高指挥官转型

《基于军事能力规划的计算机辅助兵棋推演》18页论文，北约总部盟军最高指挥官转型

专知

36+阅读 · 2022年10月16日

推荐！《基于人工智能（AI）的空中和导弹防御（AMD）：以结果为导向的辅助决策》美国海军研究生院系统工程顶点报告145页

推荐！《基于人工智能（AI）的空中和导弹防御（AMD）：以结果为导向的辅助决策》美国海军研究生院系统工程顶点报告145页

专知

119+阅读 · 2022年9月1日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

专访俞栋：多模态是迈向通用人工智能的重要方向

专访俞栋：多模态是迈向通用人工智能的重要方向

AI科技评论

27+阅读 · 2019年9月9日

自动驾驶技术解读——自动驾驶汽车决策控制系统

自动驾驶技术解读——自动驾驶汽车决策控制系统

智能交通技术

30+阅读 · 2019年7月7日

相关基金

多层动态网络的建模、群体动力学分析与控制

国家自然科学基金

3+阅读 · 2015年12月31日

高动态环境下的多普勒测速脉冲星导航方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

受扰多智能体系统的分布式主动抗干扰协调控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

复杂非完整多自主体网络协同算法设计与性能极限分析

国家自然科学基金

1+阅读 · 2015年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

相关论文

Do LLM-derived graph priors improve multi-agent coordination?

Arxiv

0+阅读 · 4月19日

Reasoning Provenance for Autonomous AI Agents: Structured Behavioral Analytics Beyond State Checkpoints and Execution Traces

Arxiv

1+阅读 · 4月10日

Exploring Plan Space through Conversation: An Agentic Framework for LLM-Mediated Explanations in Planning

Arxiv

0+阅读 · 4月9日

Integrating Deep RL and Bayesian Inference for ObjectNav in Mobile Robotics

Arxiv

0+阅读 · 3月26日

GoAgent: Group-of-Agents Communication Topology Generation for LLM-based Multi-Agent Systems

Arxiv

0+阅读 · 3月20日

OmniVLN: Omnidirectional 3D Perception and Token-Efficient LLM Reasoning for Visual-Language Navigation across Air and Ground Platforms

OmniVLN: Omnidirectional 3D Perception and Token-Efficient LLM Reasoning for Visual-Language Navigation across Air and Ground Platforms

Arxiv

0+阅读 · 3月18日

Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

Arxiv

0+阅读 · 3月10日

Large Language Models Empowered Agent-based Modeling and Simulation: A Survey and Perspectives

Arxiv

27+阅读 · 2023年12月19日

Hierarchical Multi-Agent Reinforcement Learning for Air Combat Maneuvering

Arxiv

49+阅读 · 2023年9月20日

The Rise and Potential of Large Language Model Based Agents: A Survey

Arxiv

50+阅读 · 2023年9月14日

微信扫码咨询专知VIP会员