小脑启发的残差控制用于故障恢复：从推理时适应到结构巩固 (Cerebellar-Inspired Residual Control for Fault Recovery: From Inference-Time Adaptation to Structural Consolidation) - 专知论文

会员服务 ·

0

故障恢复 · 脑启发 · 结构 · 扰动 · 可塑性 ·

Cerebellar-Inspired Residual Control for Fault Recovery: From Inference-Time Adaptation to Structural Consolidation

翻译：小脑启发的残差控制用于故障恢复：从推理时适应到结构巩固

Nethmi Jayasinghe,Diana Gontero,Spencer T. Brown,Vinod K. Sangwan,Mark C. Hersam,Amit Ranjan Trivedi

Robotic policies deployed in real-world environments often encounter post-training faults, where retraining, exploration, or system identification are impractical. We introduce an inference-time, cerebellar-inspired residual control framework that augments a frozen reinforcement learning policy with online corrective actions, enabling fault recovery without modifying base policy parameters. The framework instantiates core cerebellar principles, including high-dimensional pattern separation via fixed feature expansion, parallel microzone-style residual pathways, and local error-driven plasticity with excitatory and inhibitory eligibility traces operating at distinct time scales. These mechanisms enable fast, localized correction under post-training disturbances while avoiding destabilizing global policy updates. A conservative, performance-driven meta-adaptation regulates residual authority and plasticity, preserving nominal behavior and suppressing unnecessary intervention. Experiments on MuJoCo benchmarks under actuator, dynamic, and environmental perturbations show improvements of up to $+66\%$ on \texttt{HalfCheetah-v5} and $+53\%$ on \texttt{Humanoid-v5} under moderate faults, with graceful degradation under severe shifts and complementary robustness from consolidating persistent residual corrections into policy parameters.

翻译：部署在真实环境中的机器人策略常会遇到训练后故障，此时重新训练、探索或系统辨识均不切实际。我们提出一种推理时的小脑启发残差控制框架，通过在线校正动作增强冻结的强化学习策略，无需修改基础策略参数即可实现故障恢复。该框架实例化了小脑的核心原理，包括通过固定特征扩展实现的高维模式分离、并行微区式残差通路，以及具有不同时间尺度兴奋性与抑制性资格迹的局部误差驱动可塑性。这些机制能够在训练后扰动下实现快速局部校正，同时避免破坏全局策略稳定性的更新。一种保守的、性能驱动的元适应机制调节残差权限与可塑性，保持标称行为并抑制不必要的干预。在MuJoCo基准测试中，针对执行器、动力学及环境扰动的实验表明：在中等故障下，\texttt{HalfCheetah-v5}性能提升高达$+66\%$，\texttt{Humanoid-v5}提升$+53\%$；在严重偏移下呈现优雅的性能衰减；通过将持久残差校正巩固至策略参数可获得互补的鲁棒性。

0

相关内容

故障恢复

【博士论文】受脑启发的规划：提升强化学习泛化能力

【博士论文】受脑启发的规划：提升强化学习泛化能力

专知会员服务

14+阅读 · 2025年11月13日

对抗性实验：利用敏感性分析、邻域搜索启发式算法和概率性想定生成来暴露人工智能弱点 | 2025最新83页

对抗性实验：利用敏感性分析、邻域搜索启发式算法和概率性想定生成来暴露人工智能弱点 | 2025最新83页

专知会员服务

25+阅读 · 2025年10月21日

脑启发的人工智能：全面综述

脑启发的人工智能：全面综述

专知会员服务

54+阅读 · 2024年8月30日

【图灵奖Yann LeCun】面向目标的AI：朝着能够学习、记忆、推理和计划的AI系统发展

【图灵奖Yann LeCun】面向目标的AI：朝着能够学习、记忆、推理和计划的AI系统发展

专知会员服务

38+阅读 · 2024年3月30日

【MIla】一种意识启发规划的基于模型强化学习，A Consciousness-Inspired Planning Agent for Model-Based Reinforcement Learning

【MIla】一种意识启发规划的基于模型强化学习，A Consciousness-Inspired Planning Agent for Model-Based Reinforcement Learning

专知会员服务

24+阅读 · 2022年3月19日

【NeurIPS2020】控制原语的持续学习:通过重置发现技能

专知会员服务

10+阅读 · 2020年11月12日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

132+阅读 · 2020年5月14日

【牛津大学】深度残差强化学习，Deep Residual Reinforcement Learning

【牛津大学】深度残差强化学习，Deep Residual Reinforcement Learning

专知会员服务

85+阅读 · 2020年2月18日

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

专知会员服务

70+阅读 · 2020年1月17日

【Freddy Lecue博士】Thales嵌入式可解释AI：关键系统中AI的采用（Thales Embedded Explainable AI: Towards the Adoption of AI in Critical Systems.），AI Accelerator Summit 2019

【Freddy Lecue博士】Thales嵌入式可解释AI：关键系统中AI的采用（Thales Embedded Explainable AI: Towards the Adoption of AI in Critical Systems.），AI Accelerator Summit 2019

专知会员服务

21+阅读 · 2019年11月11日

探索(Exploration)还是利用(Exploitation)？强化学习如何tradeoff？

探索(Exploration)还是利用(Exploitation)？强化学习如何tradeoff？

深度强化学习实验室

13+阅读 · 2020年8月23日

专家报告 | 类脑智能与类脑计算

专家报告 | 类脑智能与类脑计算

中国图象图形学报

19+阅读 · 2019年10月9日

【泡泡图灵智库】RelocNet：一种通过连续度量学习实现相机重定位的神经网络框架

【泡泡图灵智库】RelocNet：一种通过连续度量学习实现相机重定位的神经网络框架

泡泡机器人SLAM

14+阅读 · 2019年9月5日

【泡泡图灵智库】利用非线性因子恢复进行视觉惯性建图（CVPR）

【泡泡图灵智库】利用非线性因子恢复进行视觉惯性建图（CVPR）

泡泡机器人SLAM

18+阅读 · 2019年6月29日

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

GAN生成式对抗网络

14+阅读 · 2019年5月20日

【泡泡图灵智库】基于几何约束的单目视觉里程计尺度恢复（ICRA）

【泡泡图灵智库】基于几何约束的单目视觉里程计尺度恢复（ICRA）

泡泡机器人SLAM

18+阅读 · 2019年4月30日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

类脑计算的前沿论文，看我们推荐的这7篇

类脑计算的前沿论文，看我们推荐的这7篇

人工智能前沿讲习班

21+阅读 · 2019年1月7日

【泡泡图灵智库】Complex-YOLO：一个用于实时点云3D目标检测的欧拉区域提议网络（arXiv）

【泡泡图灵智库】Complex-YOLO：一个用于实时点云3D目标检测的欧拉区域提议网络（arXiv）

泡泡机器人SLAM

20+阅读 · 2018年12月27日

【机器学习】【案例分析】基于机器学习的磁盘故障预测

【机器学习】【案例分析】基于机器学习的磁盘故障预测

产业智能官

12+阅读 · 2017年8月13日

融合人脑意图与力觉反馈的外骨骼机器人步态控制CPG模型及调节方法

国家自然科学基金

0+阅读 · 2015年12月31日

SUMO促进创伤性颅脑损伤神经修复的研究

国家自然科学基金

0+阅读 · 2015年12月31日

传感器故障下的数据驱动容错控制技术及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

经鼻给予神经生长因子通过NF-κB/BACE1信号通路治疗脑外伤相关的认知功能障碍

国家自然科学基金

0+阅读 · 2015年12月31日

基于概率图谱引导的群组自适应时序脑MR图像脑提取方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

神经反馈康复训练的反馈策略和控制方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

定位系统细胞启发的机器人情景认知地图构建与行为规划研究

国家自然科学基金

3+阅读 · 2015年12月31日

阈下情绪启动影响正常人及分裂型特质个体情绪判断的神经机制

国家自然科学基金

0+阅读 · 2015年12月31日

机器灵巧手基于触滑觉信息协同的自适应力控制方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

皮层下脑梗死后全脑语言功能网络重塑的调控机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

CDRL: A Reinforcement Learning Framework Inspired by Cerebellar Circuits and Dendritic Computational Strategies

Arxiv

0+阅读 · 2月17日

Towards Bridging the Gap between Large-Scale Pretraining and Efficient Finetuning for Humanoid Control

Arxiv

0+阅读 · 2月13日

Robot-DIFT: Distilling Diffusion Features for Geometrically Consistent Visuomotor Control

Arxiv

0+阅读 · 2月12日

A Human-in-the-Loop Confidence-Aware Failure Recovery Framework for Modular Robot Policies

Arxiv

0+阅读 · 2月10日

Post-Collision Trajectory Restoration for a Single-track Ackermann Vehicle using Heuristic Steering and Tractive Force Functions

Arxiv

0+阅读 · 2月9日

RAPID: Reconfigurable, Adaptive Platform for Iterative Design

Arxiv

0+阅读 · 2月6日

Moving On, Even When You're Broken: Fail-Active Trajectory Generation via Diffusion Policies Conditioned on Embodiment and Task

Arxiv

0+阅读 · 2月2日

Online Fine-Tuning of Pretrained Controllers for Autonomous Driving via Real-Time Recurrent RL

Arxiv

0+阅读 · 2月2日

RAPT: Model-Predictive Out-of-Distribution Detection and Failure Diagnosis for Sim-to-Real Humanoid Robots

Arxiv

0+阅读 · 2月2日

CLARE: Continual Learning for Vision-Language-Action Models via Autonomous Adapter Routing and Expansion

Arxiv

0+阅读 · 1月14日

VIP会员

文章信息

相关主题

相关VIP内容

【博士论文】受脑启发的规划：提升强化学习泛化能力

【博士论文】受脑启发的规划：提升强化学习泛化能力

专知会员服务

14+阅读 · 2025年11月13日

对抗性实验：利用敏感性分析、邻域搜索启发式算法和概率性想定生成来暴露人工智能弱点 | 2025最新83页

对抗性实验：利用敏感性分析、邻域搜索启发式算法和概率性想定生成来暴露人工智能弱点 | 2025最新83页

专知会员服务

25+阅读 · 2025年10月21日

脑启发的人工智能：全面综述

脑启发的人工智能：全面综述

专知会员服务

54+阅读 · 2024年8月30日

【图灵奖Yann LeCun】面向目标的AI：朝着能够学习、记忆、推理和计划的AI系统发展

【图灵奖Yann LeCun】面向目标的AI：朝着能够学习、记忆、推理和计划的AI系统发展

专知会员服务

38+阅读 · 2024年3月30日

【MIla】一种意识启发规划的基于模型强化学习，A Consciousness-Inspired Planning Agent for Model-Based Reinforcement Learning

【MIla】一种意识启发规划的基于模型强化学习，A Consciousness-Inspired Planning Agent for Model-Based Reinforcement Learning

专知会员服务

24+阅读 · 2022年3月19日

【NeurIPS2020】控制原语的持续学习:通过重置发现技能

专知会员服务

10+阅读 · 2020年11月12日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

132+阅读 · 2020年5月14日

【牛津大学】深度残差强化学习，Deep Residual Reinforcement Learning

【牛津大学】深度残差强化学习，Deep Residual Reinforcement Learning

专知会员服务

85+阅读 · 2020年2月18日

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

专知会员服务

70+阅读 · 2020年1月17日

【Freddy Lecue博士】Thales嵌入式可解释AI：关键系统中AI的采用（Thales Embedded Explainable AI: Towards the Adoption of AI in Critical Systems.），AI Accelerator Summit 2019

【Freddy Lecue博士】Thales嵌入式可解释AI：关键系统中AI的采用（Thales Embedded Explainable AI: Towards the Adoption of AI in Critical Systems.），AI Accelerator Summit 2019

专知会员服务

21+阅读 · 2019年11月11日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人机与战争：被忽视的环境影响及无人机保护潜力》

俄罗斯规划未来无人机驱动军队

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

《人工智能、武器与影响力：前沿模型在模拟核危机中展现复杂推理》2026最新46页报告

相关资讯

探索(Exploration)还是利用(Exploitation)？强化学习如何tradeoff？

探索(Exploration)还是利用(Exploitation)？强化学习如何tradeoff？

深度强化学习实验室

13+阅读 · 2020年8月23日

专家报告 | 类脑智能与类脑计算

专家报告 | 类脑智能与类脑计算

中国图象图形学报

19+阅读 · 2019年10月9日

【泡泡图灵智库】RelocNet：一种通过连续度量学习实现相机重定位的神经网络框架

【泡泡图灵智库】RelocNet：一种通过连续度量学习实现相机重定位的神经网络框架

泡泡机器人SLAM

14+阅读 · 2019年9月5日

【泡泡图灵智库】利用非线性因子恢复进行视觉惯性建图（CVPR）

【泡泡图灵智库】利用非线性因子恢复进行视觉惯性建图（CVPR）

泡泡机器人SLAM

18+阅读 · 2019年6月29日

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

GAN生成式对抗网络

14+阅读 · 2019年5月20日

【泡泡图灵智库】基于几何约束的单目视觉里程计尺度恢复（ICRA）

【泡泡图灵智库】基于几何约束的单目视觉里程计尺度恢复（ICRA）

泡泡机器人SLAM

18+阅读 · 2019年4月30日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

类脑计算的前沿论文，看我们推荐的这7篇

类脑计算的前沿论文，看我们推荐的这7篇

人工智能前沿讲习班

21+阅读 · 2019年1月7日

【泡泡图灵智库】Complex-YOLO：一个用于实时点云3D目标检测的欧拉区域提议网络（arXiv）

【泡泡图灵智库】Complex-YOLO：一个用于实时点云3D目标检测的欧拉区域提议网络（arXiv）

泡泡机器人SLAM

20+阅读 · 2018年12月27日

【机器学习】【案例分析】基于机器学习的磁盘故障预测

【机器学习】【案例分析】基于机器学习的磁盘故障预测

产业智能官

12+阅读 · 2017年8月13日

相关论文

CDRL: A Reinforcement Learning Framework Inspired by Cerebellar Circuits and Dendritic Computational Strategies

Arxiv

0+阅读 · 2月17日

Towards Bridging the Gap between Large-Scale Pretraining and Efficient Finetuning for Humanoid Control

Arxiv

0+阅读 · 2月13日

Robot-DIFT: Distilling Diffusion Features for Geometrically Consistent Visuomotor Control

Arxiv

0+阅读 · 2月12日

A Human-in-the-Loop Confidence-Aware Failure Recovery Framework for Modular Robot Policies

Arxiv

0+阅读 · 2月10日

Post-Collision Trajectory Restoration for a Single-track Ackermann Vehicle using Heuristic Steering and Tractive Force Functions

Arxiv

0+阅读 · 2月9日

RAPID: Reconfigurable, Adaptive Platform for Iterative Design

Arxiv

0+阅读 · 2月6日

Moving On, Even When You're Broken: Fail-Active Trajectory Generation via Diffusion Policies Conditioned on Embodiment and Task

Arxiv

0+阅读 · 2月2日

Online Fine-Tuning of Pretrained Controllers for Autonomous Driving via Real-Time Recurrent RL

Arxiv

0+阅读 · 2月2日

RAPT: Model-Predictive Out-of-Distribution Detection and Failure Diagnosis for Sim-to-Real Humanoid Robots

Arxiv

0+阅读 · 2月2日

CLARE: Continual Learning for Vision-Language-Action Models via Autonomous Adapter Routing and Expansion

Arxiv

0+阅读 · 1月14日

相关基金

融合人脑意图与力觉反馈的外骨骼机器人步态控制CPG模型及调节方法

国家自然科学基金

0+阅读 · 2015年12月31日

SUMO促进创伤性颅脑损伤神经修复的研究

国家自然科学基金

0+阅读 · 2015年12月31日

传感器故障下的数据驱动容错控制技术及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

经鼻给予神经生长因子通过NF-κB/BACE1信号通路治疗脑外伤相关的认知功能障碍

国家自然科学基金

0+阅读 · 2015年12月31日

基于概率图谱引导的群组自适应时序脑MR图像脑提取方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

神经反馈康复训练的反馈策略和控制方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

定位系统细胞启发的机器人情景认知地图构建与行为规划研究

国家自然科学基金

3+阅读 · 2015年12月31日

阈下情绪启动影响正常人及分裂型特质个体情绪判断的神经机制

国家自然科学基金

0+阅读 · 2015年12月31日

机器灵巧手基于触滑觉信息协同的自适应力控制方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

皮层下脑梗死后全脑语言功能网络重塑的调控机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员