简单导航，深度对齐：2025年鼠与AI竞赛获胜方案 (Navigating Simply, Aligning Deeply: Winning Solutions for Mouse vs. AI 2025) - 专知论文

会员服务 ·

0

鲁棒 · 对齐 · AI · 生物 · 系统 ·

Navigating Simply, Aligning Deeply: Winning Solutions for Mouse vs. AI 2025

翻译：简单导航，深度对齐：2025年鼠与AI竞赛获胜方案

Phu-Hoa Pham,Chi-Nguyen Tran,Dao Sy Duy Minh,Nguyen Lam Phu Quy,Huynh Trung Kiet

from arxiv, 15 pages, 8 tables. Technical Report for winning solutions (Track 1 & Track 2) at the NeurIPS 2025 Mouse vs. AI Challenge

Visual robustness and neural alignment remain critical challenges in developing artificial agents that can match biological vision systems. We present the winning approaches from Team HCMUS_TheFangs for both tracks of the NeurIPS 2025 Mouse vs. AI: Robust Visual Foraging Competition. For Track 1 (Visual Robustness), we demonstrate that architectural simplicity combined with targeted components yields superior generalization, achieving 95.4% final score with a lightweight two-layer CNN enhanced by Gated Linear Units and observation normalization. For Track 2 (Neural Alignment), we develop a deep ResNet-like architecture with 16 convolutional layers and GLU-based gating that achieves top-1 neural prediction performance with 17.8 million parameters. Our systematic analysis of ten model checkpoints trained between 60K to 1.14M steps reveals that training duration exhibits a non-monotonic relationship with performance, with optimal results achieved around 200K steps. Through comprehensive ablation studies and failure case analysis, we provide insights into why simpler architectures excel at visual robustness while deeper models with increased capacity achieve better neural alignment. Our results challenge conventional assumptions about model complexity in visuomotor learning and offer practical guidance for developing robust, biologically-inspired visual agents.

翻译：视觉鲁棒性与神经对齐仍然是开发能与生物视觉系统相匹敌的人工智能体所面临的关键挑战。本文介绍了HCMUS_TheFangs团队在NeurIPS 2025"鼠与AI：鲁棒视觉觅食竞赛"两个赛道中的获胜方案。在赛道1（视觉鲁棒性）中，我们证明了结构简洁性与针对性组件相结合能够产生卓越的泛化能力，通过采用由门控线性单元和观测归一化增强的轻量级两层CNN，最终得分达到95.4%。在赛道2（神经对齐）中，我们开发了一个深度类ResNet架构，包含16个卷积层和基于GLU的门控机制，以1780万参数实现了顶级的神经预测性能。我们对在6万至114万训练步数区间内训练的十个模型检查点进行了系统分析，发现训练时长与性能呈非单调关系，最佳结果出现在约20万步附近。通过全面的消融研究和失败案例分析，我们深入阐释了为何更简洁的架构在视觉鲁棒性方面表现优异，而具有更强容量的更深层模型则能实现更好的神经对齐。我们的研究结果挑战了关于视觉运动学习中模型复杂度的传统假设，并为开发鲁棒的、受生物启发的视觉智能体提供了实用指导。

0

相关内容

【NeurIPS2025教程】人类–AI 对齐：基础、方法、实践与挑战

【NeurIPS2025教程】人类–AI 对齐：基础、方法、实践与挑战

专知会员服务

25+阅读 · 2025年12月7日

对抗性实验：利用敏感性分析、邻域搜索启发式算法和概率性想定生成来暴露人工智能弱点 | 2025最新83页

对抗性实验：利用敏感性分析、邻域搜索启发式算法和概率性想定生成来暴露人工智能弱点 | 2025最新83页

专知会员服务

25+阅读 · 2025年10月21日

《基于人工智能与机器学习增强信息环境下作战决策能力》2025年最新95页

《基于人工智能与机器学习增强信息环境下作战决策能力》2025年最新95页

专知会员服务

36+阅读 · 2025年9月15日

如何对齐？北大最新271页ICML2025教程《语言模型的对齐方法：一种机器学习视角》

如何对齐？北大最新271页ICML2025教程《语言模型的对齐方法：一种机器学习视角》

专知会员服务

47+阅读 · 2025年7月16日

覆盖800+文献、多位知名学者挂帅，北大联合剑桥、CMU等多所高校发布《AI 对齐 (Alignment)》全面性综述

覆盖800+文献、多位知名学者挂帅，北大联合剑桥、CMU等多所高校发布《AI 对齐 (Alignment)》全面性综述

专知会员服务

54+阅读 · 2023年11月1日

中文版《获得认知优势：人工智能（AI）作为决策支持系统（DSS）》美国海军陆战队指挥与参谋学院报告

中文版《获得认知优势：人工智能（AI）作为决策支持系统（DSS）》美国海军陆战队指挥与参谋学院报告

专知会员服务

247+阅读 · 2023年7月27日

「人机对抗中的博弈学习方法」最新2022综述

「人机对抗中的博弈学习方法」最新2022综述

专知会员服务

117+阅读 · 2022年9月11日

《人机对抗中的博弈学习方法》21页PDF，中科院自动化所最新发表

《人机对抗中的博弈学习方法》21页PDF，中科院自动化所最新发表

专知会员服务

117+阅读 · 2022年3月29日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知会员服务

80+阅读 · 2020年3月13日

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

专知会员服务

38+阅读 · 2020年1月13日

推荐！《用于兵棋推演和建模的人工智能》兰德、耶鲁大学2022最新16页论文

推荐！《用于兵棋推演和建模的人工智能》兰德、耶鲁大学2022最新16页论文

专知

52+阅读 · 2022年11月14日

2020语言与智能技术竞赛-事件抽取方案整理(第一波

2020语言与智能技术竞赛-事件抽取方案整理(第一波

深度学习自然语言处理

20+阅读 · 2020年7月12日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

类脑计算的前沿论文，看我们推荐的这7篇

类脑计算的前沿论文，看我们推荐的这7篇

人工智能前沿讲习班

21+阅读 · 2019年1月7日

AI Challenger 2018 文本挖掘类竞赛相关代码及解决方案汇总

AI Challenger 2018 文本挖掘类竞赛相关代码及解决方案汇总

AINLP

22+阅读 · 2018年12月3日

干货|85页最新《人机对话系统》神经方法综述论文，微软与谷歌研究员联合出品：

干货|85页最新《人机对话系统》神经方法综述论文，微软与谷歌研究员联合出品：

专知

35+阅读 · 2018年10月7日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

Deepmind 新成果，让机器挑战更复杂阅读理解问题

Deepmind 新成果，让机器挑战更复杂阅读理解问题

AI掘金志

11+阅读 · 2018年1月3日

Uber AI实验室：遗传算法PK随机梯度下降，欢迎来到深度神经进化时代！

Uber AI实验室：遗传算法PK随机梯度下降，欢迎来到深度神经进化时代！

论智

10+阅读 · 2017年12月19日

文本分类实战: 机器学习vs深度学习算法对比（附代码）

文本分类实战: 机器学习vs深度学习算法对比（附代码）

机器学习研究会

35+阅读 · 2017年10月25日

面向计算机视觉问题的图匹配算法研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

仿动物大脑网格细胞神经定位机制的同步定位与地图构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于概率图谱引导的群组自适应时序脑MR图像脑提取方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂场景下目标跟踪的表观建模研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于势场法的多智能体系统鲁棒自适应刚性编队控制

国家自然科学基金

3+阅读 · 2015年12月31日

局部可视环境中基于视觉和触觉感知的灵巧手精细操作的方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度信息和显著计算的手势交互技术研究及应用

国家自然科学基金

1+阅读 · 2014年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

复杂场景中基于分数阶微积分的局部形状匹配方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

Adopting a human developmental visual diet yields robust, shape-based AI vision

Arxiv

0+阅读 · 2月13日

Interactive Virtual Games: Winners for Deep Cognitive Assessment

Arxiv

0+阅读 · 2月11日

Task-Conditioned Probing Reveals Brain-Alignment Patterns in Instruction-Tuned Multimodal LLMs

Arxiv

0+阅读 · 2月7日

Emergent Alignment via Competition

Arxiv

0+阅读 · 2月2日

MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks

Arxiv

0+阅读 · 1月29日

Grasp-and-Lift: Executable 3D Hand-Object Interaction Reconstruction via Physics-in-the-Loop Optimization

Arxiv

0+阅读 · 1月26日

The Percept-V Challenge: Can Multimodal LLMs Crack Simple Perception Problems?

Arxiv

0+阅读 · 1月22日

Interleaved Latent Visual Reasoning with Selective Perceptual Modeling

Arxiv

0+阅读 · 1月21日

Institutional AI: Governing LLM Collusion in Multi-Agent Cournot Markets via Public Governance Graphs

Arxiv

0+阅读 · 1月20日

Institutional AI: Governing LLM Collusion in Multi-Agent Cournot Markets via Public Governance Graphs

Arxiv

0+阅读 · 1月16日

VIP会员

文章信息

相关主题

相关VIP内容

【NeurIPS2025教程】人类–AI 对齐：基础、方法、实践与挑战

【NeurIPS2025教程】人类–AI 对齐：基础、方法、实践与挑战

专知会员服务

25+阅读 · 2025年12月7日

对抗性实验：利用敏感性分析、邻域搜索启发式算法和概率性想定生成来暴露人工智能弱点 | 2025最新83页

对抗性实验：利用敏感性分析、邻域搜索启发式算法和概率性想定生成来暴露人工智能弱点 | 2025最新83页

专知会员服务

25+阅读 · 2025年10月21日

《基于人工智能与机器学习增强信息环境下作战决策能力》2025年最新95页

《基于人工智能与机器学习增强信息环境下作战决策能力》2025年最新95页

专知会员服务

36+阅读 · 2025年9月15日

如何对齐？北大最新271页ICML2025教程《语言模型的对齐方法：一种机器学习视角》

如何对齐？北大最新271页ICML2025教程《语言模型的对齐方法：一种机器学习视角》

专知会员服务

47+阅读 · 2025年7月16日

覆盖800+文献、多位知名学者挂帅，北大联合剑桥、CMU等多所高校发布《AI 对齐 (Alignment)》全面性综述

覆盖800+文献、多位知名学者挂帅，北大联合剑桥、CMU等多所高校发布《AI 对齐 (Alignment)》全面性综述

专知会员服务

54+阅读 · 2023年11月1日

中文版《获得认知优势：人工智能（AI）作为决策支持系统（DSS）》美国海军陆战队指挥与参谋学院报告

中文版《获得认知优势：人工智能（AI）作为决策支持系统（DSS）》美国海军陆战队指挥与参谋学院报告

专知会员服务

247+阅读 · 2023年7月27日

「人机对抗中的博弈学习方法」最新2022综述

「人机对抗中的博弈学习方法」最新2022综述

专知会员服务

117+阅读 · 2022年9月11日

《人机对抗中的博弈学习方法》21页PDF，中科院自动化所最新发表

《人机对抗中的博弈学习方法》21页PDF，中科院自动化所最新发表

专知会员服务

117+阅读 · 2022年3月29日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知会员服务

80+阅读 · 2020年3月13日

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

专知会员服务

38+阅读 · 2020年1月13日

热门VIP内容

开通专知VIP会员享更多权益服务

论学习、公平性与复杂度

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

2025中国人工智能学会系列白皮书⸺棋盘上的人工智能|附下载

通用智能体评估的逻辑架构

相关资讯

推荐！《用于兵棋推演和建模的人工智能》兰德、耶鲁大学2022最新16页论文

推荐！《用于兵棋推演和建模的人工智能》兰德、耶鲁大学2022最新16页论文

专知

52+阅读 · 2022年11月14日

2020语言与智能技术竞赛-事件抽取方案整理(第一波

2020语言与智能技术竞赛-事件抽取方案整理(第一波

深度学习自然语言处理

20+阅读 · 2020年7月12日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

类脑计算的前沿论文，看我们推荐的这7篇

类脑计算的前沿论文，看我们推荐的这7篇

人工智能前沿讲习班

21+阅读 · 2019年1月7日

AI Challenger 2018 文本挖掘类竞赛相关代码及解决方案汇总

AI Challenger 2018 文本挖掘类竞赛相关代码及解决方案汇总

AINLP

22+阅读 · 2018年12月3日

干货|85页最新《人机对话系统》神经方法综述论文，微软与谷歌研究员联合出品：

干货|85页最新《人机对话系统》神经方法综述论文，微软与谷歌研究员联合出品：

专知

35+阅读 · 2018年10月7日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

Deepmind 新成果，让机器挑战更复杂阅读理解问题

Deepmind 新成果，让机器挑战更复杂阅读理解问题

AI掘金志

11+阅读 · 2018年1月3日

Uber AI实验室：遗传算法PK随机梯度下降，欢迎来到深度神经进化时代！

Uber AI实验室：遗传算法PK随机梯度下降，欢迎来到深度神经进化时代！

论智

10+阅读 · 2017年12月19日

文本分类实战: 机器学习vs深度学习算法对比（附代码）

文本分类实战: 机器学习vs深度学习算法对比（附代码）

机器学习研究会

35+阅读 · 2017年10月25日

相关论文

Adopting a human developmental visual diet yields robust, shape-based AI vision

Arxiv

0+阅读 · 2月13日

Interactive Virtual Games: Winners for Deep Cognitive Assessment

Arxiv

0+阅读 · 2月11日

Task-Conditioned Probing Reveals Brain-Alignment Patterns in Instruction-Tuned Multimodal LLMs

Arxiv

0+阅读 · 2月7日

Emergent Alignment via Competition

Arxiv

0+阅读 · 2月2日

MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks

Arxiv

0+阅读 · 1月29日

Grasp-and-Lift: Executable 3D Hand-Object Interaction Reconstruction via Physics-in-the-Loop Optimization

Arxiv

0+阅读 · 1月26日

The Percept-V Challenge: Can Multimodal LLMs Crack Simple Perception Problems?

Arxiv

0+阅读 · 1月22日

Interleaved Latent Visual Reasoning with Selective Perceptual Modeling

Arxiv

0+阅读 · 1月21日

Institutional AI: Governing LLM Collusion in Multi-Agent Cournot Markets via Public Governance Graphs

Arxiv

0+阅读 · 1月20日

Institutional AI: Governing LLM Collusion in Multi-Agent Cournot Markets via Public Governance Graphs

Arxiv

0+阅读 · 1月16日

相关基金

面向计算机视觉问题的图匹配算法研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

仿动物大脑网格细胞神经定位机制的同步定位与地图构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于概率图谱引导的群组自适应时序脑MR图像脑提取方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂场景下目标跟踪的表观建模研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于势场法的多智能体系统鲁棒自适应刚性编队控制

国家自然科学基金

3+阅读 · 2015年12月31日

局部可视环境中基于视觉和触觉感知的灵巧手精细操作的方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度信息和显著计算的手势交互技术研究及应用

国家自然科学基金

1+阅读 · 2014年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

复杂场景中基于分数阶微积分的局部形状匹配方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员