未来的机器人将需要先进的轨迹预测与生成技术,以在复杂环境中导航并与其他智能体安全交互。轨迹预测旨在预估智能体的未来行为,而轨迹生成则是为智能体创建可行的路径。这些能力对于自动驾驶、多机器人协调和社交导航等应用至关重要,能使机器人做出明智决策并实时适应。例如,在自动驾驶领域,轨迹预测使得自动驾驶汽车能够预测附近车辆、行人和骑行者的路径,从而预判潜在危险。轨迹生成则能够规划出安全高效的行驶路线。类似地,在仓库环境中,机器人可以通过预测其他机器人和人类工作人员的轨迹来协调其移动,从而在避免碰撞的同时优化任务完成。即便在购物中心和机场等社交环境中,服务或安防机器人也可利用这些方法在拥挤空间中顺畅导航,最大限度地减少干扰并保持适当的社交距离。通过提升轨迹预测与生成能力,机器人系统能够做出更优决策,从而拓展机器人与人类互动的方式并改善日常生活。

传统上,轨迹预测与规划通常采用不同的技术视角和方法。经典的轨迹预测依赖于诸如卡尔曼滤波器或粒子滤波器等方法,这些方法假设目标的运动模型已知。这些基于模型的技术受限于其对目标运动模型精确知识的依赖。至于运动或轨迹规划,这类问题通常结合使用基于搜索的方法或最优控制方法。基于搜索的方法,如快速探索随机树和A*搜索,需要环境的精确状态空间表示,并且在高维空间中可能遇到收敛性或运行时间问题。最优控制方法,如模型预测路径积分控制,能在高维连续状态和动作空间中良好工作,但依赖于拥有精确的环境动力学模型。即使使用学习到的动力学模型,标准的轨迹优化技术也倾向于利用学习模型中的不准确性,导致生成的轨迹在现实世界中无法执行。轨迹预测和轨迹规划都面临着需要鲁棒运动模型的问题。

本文通过深度生成模型的视角来探讨轨迹预测和运动规划,这代表了对经典方法的转变。通过利用生成式机器学习的进展,这些模型为在动态和部分可观测环境中通过数据隐式学习运动模型提供了鲁棒的解决方案。提出的解决方案旨在使机器人在导航复杂的现实世界场景时更加灵活和可泛化。

介绍并评估了将深度生成模型应用于各种机器人学任务的新方法,同时从经典方法中汲取灵感或在其基础上构建更鲁棒的解决方案。首先,开发了用于对手建模、多智能体跟踪和轨迹预测的生成模型。然后,将其中一个模型扩展用于多智能体强化学习框架。接着,提出了一种新的约束轨迹优化方法,并在一个实体乒乓球机器人上展示了其应用。最后,探索了使用预训练的大语言模型来增强调度和运动规划任务的可用性并减少工作负荷。

主旨: 本文解决了将生成模型应用于轨迹预测和规划中的关键挑战。具体而言:

• 带有额外约束满足的生成式扩散模型提高了预测精度。 • 利用生成模型进行多智能体强化学习提升了智能体的性能。 • 预训练的生成式大语言模型在调度和运动规划任务中降低了用户的工作负荷并提高了可用性。

通过开发新颖的深度生成框架,提出了一系列贡献来支持论文主旨。在第五章中,通过开发单目标对抗跟踪模型奠定了基础。这项工作引入了两个开源的、部分可观测的对抗环境,用于对手建模和对抗跟踪,同时提出了一种基于高斯混合的对抗跟踪系统,该系统采用了一种新颖的正则化项来保持不同的假设。这代表了在稀疏、部分可观测领域中生成单对抗目标位置概率分布的首个成功方法。

第六章在此基础之上,引入了首个基于生成式扩散的多智能体跟踪算法。该模型采用基于约束的采样和交叉注意力机制进行轨迹预测,能够将不确定的检测结果归因于特定的对手,并创建连贯的轨迹假设。

在第七章中,进一步扩展了扩散模型的工作,开发了一个用于轨迹预测和生成的流匹配框架。该方法在保持高性能的同时实现了快速采样,提升了在长时程运动规划方面的能力。

第八章探索了将生成式扩散模型应用于在仿真和真实机器人上学习多样化的敏捷任务。提出了一种运动学约束的梯度引导方法,以更好地约束轨迹,从而完成诸如在乒乓球或空气曲棍球中回击球等任务。

第九章解决了多智能体强化学习在大型、稀疏的部分可观测领域中的挑战。引入了一种多智能体强化学习算法,该算法成功处理了因与非平稳对手训练而产生的分布偏移问题,从而得到了一个能够协调多个智能体来跟踪对抗目标的模型。

最后,在第十章中,利用预训练的生成式语言模型来增强调度和运动规划任务的可用性并减少工作负荷。一项用户研究表明,相较于传统的输入方式,该方法有显著改进,展示了自然语言接口在机器人学应用中的潜力。

通过开发新颖的深度生成框架,增强了在对抗跟踪、多智能体协调、轨迹预测和人机交互方面的能力。这些贡献不仅提高了在具有挑战性的环境中的性能,而且架起了经典机器人学与现代机器学习之间的桥梁。在真实的乒乓球机器人、多个地面机器人集群以及用户研究上验证了更具适应性和用户友好性的机器人系统的潜力。这项工作为未来的研究奠定了基础,推动该领域朝着能够驾驭复杂现实场景并与人类无缝交互的更复杂的自主系统迈进。

成为VIP会员查看完整内容
11

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
《不确定通信条件下的分布式多智能体决策》122页
专知会员服务
56+阅读 · 2025年2月26日
《基于特质的多机器人协调建模》191页
专知会员服务
40+阅读 · 2024年6月10日
《生成式人工智能模型:机遇与风险》
专知会员服务
77+阅读 · 2024年4月22日
《多机器人自主系统中的智能体任务分配》279页
专知会员服务
97+阅读 · 2024年3月19日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Arxiv
0+阅读 · 2025年12月24日
VIP会员
相关VIP内容
《不确定通信条件下的分布式多智能体决策》122页
专知会员服务
56+阅读 · 2025年2月26日
《基于特质的多机器人协调建模》191页
专知会员服务
40+阅读 · 2024年6月10日
《生成式人工智能模型:机遇与风险》
专知会员服务
77+阅读 · 2024年4月22日
《多机器人自主系统中的智能体任务分配》279页
专知会员服务
97+阅读 · 2024年3月19日
相关基金
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
微信扫码咨询专知VIP会员