The current transformation towards smart manufacturing has led to a growing demand for human-robot collaboration (HRC) in the manufacturing process. Perceiving and understanding the human co-worker's behaviour introduces challenges for collaborative robots to efficiently and effectively perform tasks in unstructured and dynamic environments. Integrating recent data-driven machine vision capabilities into HRC systems is a logical next step in addressing these challenges. However, in these cases, off-the-shelf components struggle due to generalisation limitations. Real-world evaluation is required in order to fully appreciate the maturity and robustness of these approaches. Furthermore, understanding the pure-vision aspects is a crucial first step before combining multiple modalities in order to understand the limitations. In this paper, we propose GoferBot, a novel vision-based semantic HRC system for a real-world assembly task. It is composed of a visual servoing module that reaches and grasps assembly parts in an unstructured multi-instance and dynamic environment, an action recognition module that performs human action prediction for implicit communication, and a visual handover module that uses the perceptual understanding of human behaviour to produce an intuitive and efficient collaborative assembly experience. GoferBot is a novel assembly system that seamlessly integrates all sub-modules by utilising implicit semantic information purely from visual perception.


翻译:当前向智能制造的转型导致制造过程中对人机协作(HRC)的需求日益增长。感知和理解人类同事的行为给协作机器人带来了挑战,使其难以在非结构化和动态环境中高效、有效地执行任务。将基于数据驱动的最新机器视觉能力集成到HRC系统中,是应对这些挑战的合乎逻辑的下一步。然而,在这些情况下,现成组件由于泛化能力有限而表现不佳。为了充分评估这些方法的成熟度和鲁棒性,需要进行真实环境下的评估。此外,在多模态融合之前,理解纯视觉方面是明确其局限性的关键第一步。在本文中,我们提出了GoferBot,一种用于真实世界装配任务的基于视觉的新型语义HRC系统。该系统包含一个视觉伺服模块,可在非结构化多实例动态环境中到达并抓取装配零件;一个动作识别模块,可对人类动作进行预测以实现隐式通信;以及一个视觉交递模块,通过感知理解人类行为,提供直观高效的协作装配体验。GoferBot是一种新型装配系统,它通过仅从视觉感知中利用隐式语义信息,将所有子模块无缝集成。

0
下载
关闭预览

相关内容

《行为与认知机器人学》,241页pdf
专知会员服务
55+阅读 · 2021年4月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
【泡泡一分钟】DS-SLAM: 动态环境下的语义视觉SLAM
泡泡机器人SLAM
23+阅读 · 2019年1月18日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
【泡泡一分钟】学习紧密的几何特征(ICCV2017-17)
泡泡机器人SLAM
20+阅读 · 2018年5月8日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2023年5月31日
Arxiv
12+阅读 · 2021年9月13日
VIP会员
最新内容
2025年全球二十起重大无人机作战事件
专知会员服务
4+阅读 · 6月27日
现代战争的隐蔽系统:伊朗战争十大启示
专知会员服务
5+阅读 · 6月27日
ICML 2026 | 自回归Boltzmann生成器重塑分子采样
专知会员服务
6+阅读 · 6月26日
GNN跨域综述:从消息传递到图基础模型
专知会员服务
9+阅读 · 6月26日
无人机自主控制与人工智能:系统性综述
专知会员服务
16+阅读 · 6月26日
巡飞弹与反无人机系统——现代战场的两大支柱
《打造“黄金舰队”》57页报告
专知会员服务
5+阅读 · 6月26日
《北约数字教官网络发展路径》128页报告
专知会员服务
4+阅读 · 6月26日
ECCV 2026 | MIMFlow:MIM与归一化流统一图像生成
专知会员服务
9+阅读 · 6月25日
网状网络及其在军事领域的运用
专知会员服务
9+阅读 · 6月25日
无美国参与的欧洲战争方式(万字长文)
专知会员服务
9+阅读 · 6月25日
相关VIP内容
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员