Real-world robots often operate in settings where objective priorities depend on the underlying context of operation. When the underlying context is unknown apriori, multiple robots may have to coordinate to gather informative observations to infer the context, since acting based on an incorrect context can lead to misaligned and unsafe behavior. Once the underlying true context is inferred, the robots optimize their task-specific objectives in the preference order induced by the context. We formalize this problem as a Multi-Robot Context-Uncertain Stochastic Shortest Path (MR-CUSSP), which captures context-relevant information at landmark states through joint observations. Our two-stage solution approach is composed of: (1) CIMOP (Coordinated Inference for Multi-Objective Planning) to compute plans that guide robots toward informative landmarks to efficiently infer the true context, and (2) LCBS (Lexicographic Conflict-Based Search) for collision-free multi-robot path planning with lexicographic objective preferences, induced by the context. We evaluate the algorithms using three simulated domains and demonstrate its practical applicability using five mobile robots in the salp domain setup.


翻译:现实世界中的机器人往往在目标优先级取决于运行场景的上下文中工作。当底层上下文事先未知时,多个机器人需要协调以收集信息性观测来推断上下文,因为基于错误上下文行动可能导致行为失准和不安全。一旦推断出真实的底层上下文,机器人会根据上下文引发的偏好顺序优化其任务特定目标。我们将此问题形式化为“多机器人上下文不确定随机最短路径”(MR-CUSSP),通过联合观测捕捉地标状态中的上下文相关信息。我们的两阶段求解方法包括:(1)CIMOP(面向多目标规划的协调推理),用于计算引导机器人前往信息性地标的计划,以高效推断真实上下文;(2)LCBS(词典序冲突搜索),用于在上下文引发的词典序目标偏好下进行无碰撞的多机器人路径规划。我们使用三个模拟域评估了算法,并通过琼脂海域设置中的五个移动机器人展示了其实用适用性。

0
下载
关闭预览

相关内容

《不确定环境下的多智能体规划》141页
专知会员服务
65+阅读 · 2025年8月2日
《基于图计算的多机器人协同研究》最新139页
专知会员服务
38+阅读 · 2025年5月28日
《基于图计算的多机器人协调与协作​​》139页
专知会员服务
42+阅读 · 2025年4月19日
【斯坦福博士论文】协作多机器人学习算法
专知会员服务
17+阅读 · 2025年1月6日
不对称多代理博弈中的博弈理论解读
AI前线
14+阅读 · 2018年3月8日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
国家自然科学基金
15+阅读 · 2016年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
52+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
50+阅读 · 2009年12月31日
VIP会员
最新内容
综述 | 从问答到任务完成:Agent系统与Harness设计
专知会员服务
1+阅读 · 今天16:54
Agentic RL:框架、实践与长程智能体训练
专知会员服务
1+阅读 · 今天16:52
重新思考无人机时代的生存能力
专知会员服务
5+阅读 · 今天7:44
装甲突击旅:现代战争思考、战斗与组织
专知会员服务
4+阅读 · 今天7:28
在人工智能加速决策环境中拓展OODA循环
专知会员服务
4+阅读 · 今天7:18
军事欺骗:供作战战术指挥官使用的工具
专知会员服务
4+阅读 · 今天7:03
综述 | 世界动作模型:少做梦,多行动
专知会员服务
6+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
10+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
5+阅读 · 6月23日
相关VIP内容
《不确定环境下的多智能体规划》141页
专知会员服务
65+阅读 · 2025年8月2日
《基于图计算的多机器人协同研究》最新139页
专知会员服务
38+阅读 · 2025年5月28日
《基于图计算的多机器人协调与协作​​》139页
专知会员服务
42+阅读 · 2025年4月19日
【斯坦福博士论文】协作多机器人学习算法
专知会员服务
17+阅读 · 2025年1月6日
相关基金
国家自然科学基金
15+阅读 · 2016年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
52+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
50+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员