Multimodal Fused Learning for Solving the Generalized Traveling Salesman Problem in Robotic Task Planning - 专知论文

会员服务 ·

0

多模 · 模态 · 模态融合 · 融合 · 多模态融合 ·

Multimodal Fused Learning for Solving the Generalized Traveling Salesman Problem in Robotic Task Planning

翻译：多模态融合学习解决机器人任务规划中的广义旅行商问题

Jiaqi Chen,Mingfeng Fan,Xuefeng Zhang,Jingsong Liang,Yuhong Cao,Guohua Wu,Guillaume Adrien Sartoretti

from arxiv, 14 pages, 6 figures, under review

Effective and efficient task planning is essential for mobile robots, especially in applications like warehouse retrieval and environmental monitoring. These tasks often involve selecting one location from each of several target clusters, forming a Generalized Traveling Salesman Problem (GTSP) that remains challenging to solve both accurately and efficiently. To address this, we propose a Multimodal Fused Learning (MMFL) framework that leverages both graph and image-based representations to capture complementary aspects of the problem, and learns a policy capable of generating high-quality task planning schemes in real time. Specifically, we first introduce a coordinate-based image builder that transforms GTSP instances into spatially informative representations. We then design an adaptive resolution scaling strategy to enhance adaptability across different problem scales, and develop a multimodal fusion module with dedicated bottlenecks that enables effective integration of geometric and spatial features. Extensive experiments show that our MMFL approach significantly outperforms state-of-the-art methods across various GTSP instances while maintaining the computational efficiency required for real-time robotic applications. Physical robot tests further validate its practical effectiveness in real-world scenarios.

翻译：高效且有效的任务规划对于移动机器人至关重要，特别是在仓库拣选和环境监测等应用场景中。这些任务通常需要从多个目标簇中各选择一个位置，构成广义旅行商问题（Generalized Traveling Salesman Problem, GTSP），该问题在准确性和效率上的求解仍具有挑战性。为此，我们提出一种多模态融合学习（Multimodal Fused Learning, MMFL）框架，利用基于图与基于图像的表示来捕捉问题的互补方面，并学习能够实时生成高质量任务规划方案的策略。具体而言，我们首先引入一种基于坐标的图像构建器，将GTSP实例转化为具有空间信息表征的表示。随后，我们设计了一种自适应分辨率缩放策略以增强对不同问题规模的适应性，并开发了一个包含专用瓶颈的多模态融合模块，实现了几何特征与空间特征的有效整合。大量实验表明，我们的MMFL方法在各种GTSP实例上显著优于现有最优方法，同时保持了实时机器人应用所需的计算效率。物理机器人测试进一步验证了其在真实场景中的实际有效性。

0

相关内容

【AAAI2025】通过多模态思维链得分协作增强多机器人语义导航

【AAAI2025】通过多模态思维链得分协作增强多机器人语义导航

专知会员服务

18+阅读 · 2024年12月28日

《多无人机任务规划支持多准则决策方法的修订》

《多无人机任务规划支持多准则决策方法的修订》

专知会员服务

48+阅读 · 2024年7月30日

《基于特质的多机器人协调建模》191页

《基于特质的多机器人协调建模》191页

专知会员服务

44+阅读 · 2024年6月10日

《利用多目标遗传算法解决复杂的多无人机任务规划问题》

《利用多目标遗传算法解决复杂的多无人机任务规划问题》

专知会员服务

65+阅读 · 2024年3月22日

《协作机器人的学习行为树》最新146页博士论文

《协作机器人的学习行为树》最新146页博士论文

专知会员服务

50+阅读 · 2024年2月7日

西工大等最新《大型语言模型机器人技术》综述，详述多模态 GPT-4V 机器人技术

西工大等最新《大型语言模型机器人技术》综述，详述多模态 GPT-4V 机器人技术

专知会员服务

79+阅读 · 2024年1月10日

【多机器人任务分配】《通过学习的子团队性能对异构多机器人路由问题进行分层规划》美国陆军、MIT等2022最新论文

【多机器人任务分配】《通过学习的子团队性能对异构多机器人路由问题进行分层规划》美国陆军、MIT等2022最新论文

专知会员服务

80+阅读 · 2022年11月2日

【AI+军事】洛马AI中心paper速读：基于深度学习的多目标跟踪、轨迹预测，Multi-Object Tracking with Deep Learning Ensemble for Unmanned Aerial System Applications

【AI+军事】洛马AI中心paper速读：基于深度学习的多目标跟踪、轨迹预测，Multi-Object Tracking with Deep Learning Ensemble for Unmanned Aerial System Applications

专知会员服务

66+阅读 · 2022年3月22日

【军用机器人+博弈论】paper速读：美国陆军研究实验室提出“基于博弈论的多机器人协作行动模型”

【军用机器人+博弈论】paper速读：美国陆军研究实验室提出“基于博弈论的多机器人协作行动模型”

专知会员服务

68+阅读 · 2022年3月21日

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

123+阅读 · 2020年5月18日

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

专知

10+阅读 · 2023年4月12日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

33+阅读 · 2022年10月17日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

55+阅读 · 2022年10月6日

推荐！【中文版】《利用人工智能辅助指挥官进行复杂决策》美国海陆空军10位技术专家联合撰写

推荐！【中文版】《利用人工智能辅助指挥官进行复杂决策》美国海陆空军10位技术专家联合撰写

专知

84+阅读 · 2022年8月29日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

【综述】深度学习在视频多目标跟踪上的应用

【综述】深度学习在视频多目标跟踪上的应用

专知

14+阅读 · 2019年8月8日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

多模态多任务学习新论文

多模态多任务学习新论文

专知

46+阅读 · 2019年2月9日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

三维空间基于角度测量的多机器人系统协同定位与编队控制

国家自然科学基金

11+阅读 · 2015年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

52+阅读 · 2015年12月31日

空地机器人网络的同时视觉目标定位与分布式运动规划

国家自然科学基金

4+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

广域动态的野外环境中移动机器人六维全局定位方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

未知环境中移动机器人探索式路径规划方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

Multi-Cycle Spatio-Temporal Adaptation in Human-Robot Teaming

Arxiv

0+阅读 · 4月21日

Sampling-Based Multi-Modal Multi-Robot Multi-Goal Path Planning

Arxiv

0+阅读 · 4月17日

Multi-Camera View Scaling for Data-Efficient Robot Imitation Learning

Arxiv

0+阅读 · 4月1日

Towards Generalizable Robotic Data Flywheel: High-Dimensional Factorization and Composition

Arxiv

0+阅读 · 3月26日

Knowledge-Guided Manipulation Using Multi-Task Reinforcement Learning

Arxiv

0+阅读 · 3月25日

Learning Multi-Agent Local Collision-Avoidance for Collaborative Carrying tasks with Coupled Quadrupedal Robots

Arxiv

0+阅读 · 3月24日

Closed-Loop Verbal Reinforcement Learning for Task-Level Robotic Planning

Arxiv

0+阅读 · 3月23日

Evolutionary Biparty Multiobjective UAV Path Planning: Problems and Empirical Comparisons

Arxiv

0+阅读 · 3月23日

Multi-Robot Coordination for Planning under Context Uncertainty

Arxiv

0+阅读 · 3月19日

Hierarchical Multi-Agent Reinforcement Learning for Air Combat Maneuvering

Arxiv

49+阅读 · 2023年9月20日

VIP会员

文章信息

相关主题

多模态融合

最新内容

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

7+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

20+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

13+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

12+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

8+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

13+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

10+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

24+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

12+阅读 · 6月17日

相关VIP内容

【AAAI2025】通过多模态思维链得分协作增强多机器人语义导航

【AAAI2025】通过多模态思维链得分协作增强多机器人语义导航

专知会员服务

18+阅读 · 2024年12月28日

《多无人机任务规划支持多准则决策方法的修订》

《多无人机任务规划支持多准则决策方法的修订》

专知会员服务

48+阅读 · 2024年7月30日

《基于特质的多机器人协调建模》191页

《基于特质的多机器人协调建模》191页

专知会员服务

44+阅读 · 2024年6月10日

《利用多目标遗传算法解决复杂的多无人机任务规划问题》

《利用多目标遗传算法解决复杂的多无人机任务规划问题》

专知会员服务

65+阅读 · 2024年3月22日

《协作机器人的学习行为树》最新146页博士论文

《协作机器人的学习行为树》最新146页博士论文

专知会员服务

50+阅读 · 2024年2月7日

西工大等最新《大型语言模型机器人技术》综述，详述多模态 GPT-4V 机器人技术

西工大等最新《大型语言模型机器人技术》综述，详述多模态 GPT-4V 机器人技术

专知会员服务

79+阅读 · 2024年1月10日

【多机器人任务分配】《通过学习的子团队性能对异构多机器人路由问题进行分层规划》美国陆军、MIT等2022最新论文

【多机器人任务分配】《通过学习的子团队性能对异构多机器人路由问题进行分层规划》美国陆军、MIT等2022最新论文

专知会员服务

80+阅读 · 2022年11月2日

【AI+军事】洛马AI中心paper速读：基于深度学习的多目标跟踪、轨迹预测，Multi-Object Tracking with Deep Learning Ensemble for Unmanned Aerial System Applications

【AI+军事】洛马AI中心paper速读：基于深度学习的多目标跟踪、轨迹预测，Multi-Object Tracking with Deep Learning Ensemble for Unmanned Aerial System Applications

专知会员服务

66+阅读 · 2022年3月22日

【军用机器人+博弈论】paper速读：美国陆军研究实验室提出“基于博弈论的多机器人协作行动模型”

【军用机器人+博弈论】paper速读：美国陆军研究实验室提出“基于博弈论的多机器人协作行动模型”

专知会员服务

68+阅读 · 2022年3月21日

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

123+阅读 · 2020年5月18日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

美国从乌克兰无人机战争中学习经验

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

相关资讯

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

专知

10+阅读 · 2023年4月12日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

33+阅读 · 2022年10月17日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

55+阅读 · 2022年10月6日

推荐！【中文版】《利用人工智能辅助指挥官进行复杂决策》美国海陆空军10位技术专家联合撰写

推荐！【中文版】《利用人工智能辅助指挥官进行复杂决策》美国海陆空军10位技术专家联合撰写

专知

84+阅读 · 2022年8月29日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

【综述】深度学习在视频多目标跟踪上的应用

【综述】深度学习在视频多目标跟踪上的应用

专知

14+阅读 · 2019年8月8日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

多模态多任务学习新论文

多模态多任务学习新论文

专知

46+阅读 · 2019年2月9日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

相关论文

Multi-Cycle Spatio-Temporal Adaptation in Human-Robot Teaming

Arxiv

0+阅读 · 4月21日

Sampling-Based Multi-Modal Multi-Robot Multi-Goal Path Planning

Arxiv

0+阅读 · 4月17日

Multi-Camera View Scaling for Data-Efficient Robot Imitation Learning

Arxiv

0+阅读 · 4月1日

Towards Generalizable Robotic Data Flywheel: High-Dimensional Factorization and Composition

Arxiv

0+阅读 · 3月26日

Knowledge-Guided Manipulation Using Multi-Task Reinforcement Learning

Arxiv

0+阅读 · 3月25日

Learning Multi-Agent Local Collision-Avoidance for Collaborative Carrying tasks with Coupled Quadrupedal Robots

Arxiv

0+阅读 · 3月24日

Closed-Loop Verbal Reinforcement Learning for Task-Level Robotic Planning

Arxiv

0+阅读 · 3月23日

Evolutionary Biparty Multiobjective UAV Path Planning: Problems and Empirical Comparisons

Arxiv

0+阅读 · 3月23日

Multi-Robot Coordination for Planning under Context Uncertainty

Arxiv

0+阅读 · 3月19日

Hierarchical Multi-Agent Reinforcement Learning for Air Combat Maneuvering

Arxiv

49+阅读 · 2023年9月20日

相关基金

三维空间基于角度测量的多机器人系统协同定位与编队控制

国家自然科学基金

11+阅读 · 2015年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

52+阅读 · 2015年12月31日

空地机器人网络的同时视觉目标定位与分布式运动规划

国家自然科学基金

4+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

广域动态的野外环境中移动机器人六维全局定位方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

未知环境中移动机器人探索式路径规划方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员