The increasing demand for accelerated scientific discovery, driven by global challenges, highlights the need for advanced AI-driven robotics. Deploying robotic chemists in human-centric labs is key for the next horizon of autonomous discovery, as complex tasks still demand the dexterity of human scientists. Robotic manipulation in this context is uniquely challenged by handling diverse chemicals (granular, powdery, or viscous liquids), under varying lab conditions. For example, humans use spatulas for scraping materials from vial walls. Automating this process is challenging because it goes beyond simple robotic insertion tasks and traditional lab automation, requiring the execution of fine-granular movements within a constrained environment (the sample vial). Our work proposes an adaptive control framework to address this, relying on a low-level Cartesian impedance controller for stable and compliant physical interaction and a high-level reinforcement learning agent that learns to dynamically adjust interaction forces at the end-effector. The agent is guided by perception feedback, which provides the material's location. We first created a task-representative simulation environment with a Franka Research 3 robot, a scraping tool, and a sample vial containing heterogeneous materials. To facilitate the learning of an adaptive policy and model diverse characteristics, the sample is modelled as a collection of spheres, where each sphere is assigned a unique dislodgement force threshold, which is procedurally generated using Perlin noise. We train an agent to autonomously learn and adapt the optimal contact wrench for a sample scraping task in simulation and then successfully transfer this policy to a real robotic setup. Our method was evaluated across five different material setups, outperforming a fixed-wrench baseline by an average of 10.9%.


翻译:全球性挑战推动了对加速科学发现的日益增长的需求,这突显了先进人工智能驱动机器人技术的必要性。在以人为本的实验室中部署机器人化学家是实现自主发现下一个关键领域,因为复杂任务仍然需要人类科学家的灵巧性。在此背景下的机器人操作面临独特挑战,即需要在变化的实验室条件下处理多样化的化学品(颗粒状、粉末状或粘性液体)。例如,人类使用刮铲从样品瓶壁上刮取材料。自动化这一过程具有挑战性,因为它超越了简单的机器人插入任务和传统的实验室自动化,需要在受限环境(样品瓶)内执行精细粒度的运动。我们的工作提出了一个自适应控制框架来解决这一问题,该框架依赖于一个用于稳定且柔顺物理交互的低层笛卡尔阻抗控制器,以及一个学习动态调整末端执行器交互力的高层强化学习智能体。该智能体由感知反馈引导,感知反馈提供材料的位置信息。我们首先使用Franka Research 3机器人、一个刮取工具和一个包含异质材料的样品瓶,创建了一个具有任务代表性的仿真环境。为了促进自适应策略的学习并模拟多样化的材料特性,样品被建模为一个球体集合,其中每个球体被分配一个独特的脱离力阈值,该阈值是使用Perlin噪声程序化生成的。我们训练了一个智能体在仿真中自主学习和适应样本刮取任务的最佳接触力旋量,然后成功地将该策略迁移到真实的机器人设置中。我们的方法在五种不同的材料设置中进行了评估,平均性能优于固定力旋量基线10.9%。

0
下载
关闭预览

相关内容

《人机协作决策优化》142页博士论文
专知会员服务
179+阅读 · 2023年7月16日
【斯坦福博士论文】智能机器人行为自适应学习,141页pdf
专知会员服务
43+阅读 · 2021年9月7日
【综述】自动机器学习AutoML最新65页综述,带你了解最新进展
中国人工智能学会
48+阅读 · 2019年5月3日
深度学习技术发展趋势浅析
人工智能学家
28+阅读 · 2019年4月11日
干货|浅谈强化学习的方法及学习路线
机器学习算法与Python学习
16+阅读 · 2018年3月28日
技术 | 强化学习入门以及代码实现
AI100
51+阅读 · 2017年8月26日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
VIP会员
最新内容
人工智能赋能无人机:俄乌战争(万字长文)
专知会员服务
5+阅读 · 今天6:56
国外海军作战管理系统与作战训练系统
专知会员服务
2+阅读 · 今天4:16
美军条令《海军陆战队规划流程(2026版)》
专知会员服务
10+阅读 · 今天3:36
《压缩式分布式交互仿真标准》120页
专知会员服务
4+阅读 · 今天3:21
《电子战数据交换模型研究报告》
专知会员服务
6+阅读 · 今天3:13
《基于Transformer的异常舰船导航识别与跟踪》80页
《低数据领域军事目标检测模型研究》
专知会员服务
6+阅读 · 今天2:37
【CMU博士论文】物理世界的视觉感知与深度理解
专知会员服务
10+阅读 · 4月22日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员