Understanding and modeling animal behavior is essential for studying collective motion, decision-making, and bio-inspired robotics. Yet, evaluating the accuracy of behavioral models still often relies on offline comparisons to static trajectory statistics. Here we introduce a reinforcement-learning-based framework that uses a biomimetic robotic fish (RoboFish) to evaluate computational models of live fish behavior through closed-loop interaction. We trained policies in simulation using four distinct fish models-a simple constant-follow baseline, two rule-based models, and a biologically grounded convolutional neural network model-and transferred these policies to the real RoboFish setup, where they interacted with live fish. Policies were trained to guide a simulated fish to goal locations, enabling us to quantify how the response of real fish differs from the simulated fish's response. We evaluate the fish models by quantifying the sim-to-real gaps, defined as the Wasserstein distance between simulated and real distributions of behavioral metrics such as goal-reaching performance, inter-individual distances, wall interactions, and alignment. The neural network-based fish model exhibited the smallest gap across goal-reaching performance and most other metrics, indicating higher behavioral fidelity than conventional rule-based models under this benchmark. More importantly, this separation shows that the proposed evaluation can quantitatively distinguish candidate models under matched closed-loop conditions. Our work demonstrates how learning-based robotic experiments can uncover deficiencies in behavioral models and provides a general framework for evaluating animal behavior models through embodied interaction.


翻译:理解动物行为对于研究集体运动、决策制定以及仿生机器人学至关重要。然而,评估行为模型的准确性通常仍依赖于将离线结果与静态轨迹统计数据进行对比。在此,我们引入一个基于强化学习的框架,该框架利用仿生机器鱼(RoboFish)通过闭环互动来评估活体鱼类的计算行为模型。我们使用四种不同的鱼类模型(一个简单的恒定跟随基线模型、两个基于规则的模型以及一个基于生物学的卷积神经网络模型)在仿真环境中训练策略,并将这些策略迁移到真实的RoboFish装置上,使其与活体鱼互动。策略被训练来引导一条模拟鱼到达目标位置,从而使我们能够量化真实鱼与模拟鱼反应之间的差异。我们通过量化模拟到现实的差距(定义为行为指标(如目标达成表现、个体间距离、墙壁交互及对齐程度)的模拟分布与真实分布之间的Wasserstein距离)来评估这些鱼类模型。基于神经网络的鱼类模型在目标达成表现及大多数其他指标上展现出最小的差距,表明在该基准测试下,其行为保真度高于传统的基于规则的模型。更重要的是,这种差异表明,所提出的评估方法能够在匹配的闭环条件下定量区分候选模型。我们的工作展示了基于学习的机器人实验如何揭示行为模型的缺陷,并提供了一个通过具身互动评估动物行为模型的通用框架。

0
下载
关闭预览

相关内容

基于机器学习的空战行为建模综述
专知会员服务
100+阅读 · 2024年4月27日
《结合机器人行为以实现安全、智能的执行》
专知会员服务
17+阅读 · 2023年7月4日
机器人运动轨迹的模仿学习综述
专知会员服务
45+阅读 · 2021年6月8日
《行为与认知机器人学》,241页pdf
专知会员服务
55+阅读 · 2021年4月11日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
17+阅读 · 2019年1月24日
强化学习初探 - 从多臂老虎机问题说起
专知
10+阅读 · 2018年4月3日
推荐|机器学习中的模型评价、模型选择和算法选择!
全球人工智能
10+阅读 · 2018年2月5日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
国家自然科学基金
50+阅读 · 2009年12月31日
VIP会员
最新内容
ICML 2026 | CFPO:用反事实策略优化提升多模态推理
专知会员服务
1+阅读 · 今天14:45
综述 | 世界动作模型:少做梦,多行动
专知会员服务
1+阅读 · 今天14:43
美以伊冲突:无人机与人工智能的运用
专知会员服务
3+阅读 · 今天14:31
《特种部队在透明战场中的生存力》最新报告
专知会员服务
2+阅读 · 今天14:11
《人工智能生成的零日漏洞:对未来作战的影响》
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
国家自然科学基金
50+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员