Better, But Not Sufficient: Testing Video ANNs Against Macaque IT Dynamics - 专知论文

会员服务 ·

0

视频 · 人工神经网络 · 神经网络 · 前馈 · 动态特性 ·

Better, But Not Sufficient: Testing Video ANNs Against Macaque IT Dynamics

翻译：更好但尚不充分：测试视频人工神经网络对猕猴颞下区动态的预测能力

Matteo Dunnhofer,Christian Micheloni,Kohitij Kar

from arxiv, Extended Abstract at the 2nd Human-inspired Computer Vision workshop at ICCV 2025

Feedforward artificial neural networks (ANNs) trained on static images remain the dominant models of the the primate ventral visual stream, yet they are intrinsically limited to static computations. The primate world is dynamic, and the macaque ventral visual pathways, specifically the inferior temporal (IT) cortex not only supports object recognition but also encodes object motion velocity during naturalistic video viewing. Does IT's temporal responses reflect nothing more than time-unfolded feedforward transformations, framewise features with shallow temporal pooling, or do they embody richer dynamic computations? We tested this by comparing macaque IT responses during naturalistic videos against static, recurrent, and video-based ANN models. Video models provided modest improvements in neural predictivity, particularly at later response stages, raising the question of what kind of dynamics they capture. To probe this, we applied a stress test: decoders trained on naturalistic videos were evaluated on "appearance-free" variants that preserve motion but remove shape and texture. IT population activity generalized across this manipulation, but all ANN classes failed. Thus, current video models better capture appearance-bound dynamics rather than the appearance-invariant temporal computations expressed in IT, underscoring the need for new objectives that encode biological temporal statistics and invariances.

翻译：在静态图像上训练的前馈人工神经网络（ANNs）仍然是灵长类腹侧视觉通路的主导模型，但其本质上仅限于静态计算。灵长类的世界是动态的，猕猴的腹侧视觉通路——特别是颞下区（IT）皮层——不仅支持物体识别，还在自然视频观看过程中编码物体运动速度。IT的时间响应究竟仅反映了时间展开的前馈变换、逐帧特征与浅层时间池化的结果，还是体现了更丰富的动态计算？我们通过比较猕猴在观看自然视频时的IT响应与静态、循环及基于视频的ANN模型来检验这一问题。视频模型在神经预测性方面提供了适度改进，尤其是在后期响应阶段，这引发了关于它们捕获何种动态特性的疑问。为探究此问题，我们实施了压力测试：在自然视频上训练的解码器被用于评估“外观消除”变体视频（保留运动但移除形状与纹理）。IT群体活动在此操作中表现出良好的泛化能力，但所有ANN类别均告失败。因此，当前视频模型更擅长捕捉与外观绑定的动态特性，而非IT所表达的外观不变性时间计算，这凸显了需要新目标函数来编码生物时间统计特性与不变性的迫切需求。

0

相关内容

视频

【CVPR2025】STAA-SNN：用于脉冲神经网络的时空注意力聚合器

【CVPR2025】STAA-SNN：用于脉冲神经网络的时空注意力聚合器

专知会员服务

10+阅读 · 2025年3月5日

基于脉冲神经网络的机器人智能控制研究进展

基于脉冲神经网络的机器人智能控制研究进展

专知会员服务

25+阅读 · 2024年9月15日

【CVPR2023】面向不同视频的可扩展神经表示，

【CVPR2023】面向不同视频的可扩展神经表示，

专知会员服务

20+阅读 · 2023年3月28日

《用神经网络构建预测区间：对自举和保形推理方法的经验评估》美国空军大学195页学位论文

《用神经网络构建预测区间：对自举和保形推理方法的经验评估》美国空军大学195页学位论文

专知会员服务

27+阅读 · 2022年7月20日

【含源代码】《用机器学习提高超视距空战中的态势感知能力》最新论文，巴西空军高级研究学院、卡内基梅隆大学机器人研究所

【含源代码】《用机器学习提高超视距空战中的态势感知能力》最新论文，巴西空军高级研究学院、卡内基梅隆大学机器人研究所

专知会员服务

118+阅读 · 2022年6月20日

【Science Advances】MIT最新论文《特化类脑功能在深度神经网络中自发应用》，人脸识别的优化解决方案

【Science Advances】MIT最新论文《特化类脑功能在深度神经网络中自发应用》，人脸识别的优化解决方案

专知会员服务

16+阅读 · 2022年4月10日

【CVPR 2022】从大量非正式视频中构建可动画的3D神经模型，BANMo: Building Animatable 3D Neural Models from Many Casual Videos

【CVPR 2022】从大量非正式视频中构建可动画的3D神经模型，BANMo: Building Animatable 3D Neural Models from Many Casual Videos

专知会员服务

25+阅读 · 2022年3月3日

NeurIPS 2021 | AP-10K：学界最大动物姿态估计数据集问世，更多数量、更多种类、更多任务

NeurIPS 2021 | AP-10K：学界最大动物姿态估计数据集问世，更多数量、更多种类、更多任务

专知会员服务

14+阅读 · 2021年11月4日

脉冲神经网络研究现状及展望

专知会员服务

63+阅读 · 2021年9月20日

【视频预测深度学习综述论文】A Review on Deep Learning Techniques for Video Prediction

【视频预测深度学习综述论文】A Review on Deep Learning Techniques for Video Prediction

专知会员服务

52+阅读 · 2020年4月15日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

Nature子刊批判人工神经网络：先天结构比后天训练更重要，应该借鉴动物大脑

Nature子刊批判人工神经网络：先天结构比后天训练更重要，应该借鉴动物大脑

量子位

10+阅读 · 2019年8月24日

【学界】基于GNN，强于GNN：胶囊图神经网络的PyTorch实现 | ICLR 2019

【学界】基于GNN，强于GNN：胶囊图神经网络的PyTorch实现 | ICLR 2019

GAN生成式对抗网络

31+阅读 · 2019年3月26日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

刷新三项COCO纪录！姿态估计模型HRNet开源了，中科大微软出品 | CVPR

刷新三项COCO纪录！姿态估计模型HRNet开源了，中科大微软出品 | CVPR

量子位

11+阅读 · 2019年2月28日

图神经网络将成AI下一拐点！MIT斯坦福一文综述GNN到底有多强

图神经网络将成AI下一拐点！MIT斯坦福一文综述GNN到底有多强

新智元

26+阅读 · 2019年2月27日

脉冲神经网络与小样本学习【附PPT】

脉冲神经网络与小样本学习【附PPT】

人工智能前沿讲习班

48+阅读 · 2019年2月1日

【AAAI专题】论文分享：以生物可塑性为核心的类脑脉冲神经网络

【AAAI专题】论文分享：以生物可塑性为核心的类脑脉冲神经网络

中国科学院自动化研究所

15+阅读 · 2018年1月23日

前沿 | 简述脉冲神经网络SNN：下一代神经网络

前沿 | 简述脉冲神经网络SNN：下一代神经网络

机器之心

39+阅读 · 2018年1月13日

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

机器人圈

35+阅读 · 2017年7月18日

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于深度学习的金丝猴面部特性的检测与识别算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于9.4T磁共振成像技术的婴幼猕猴脑运动中枢与运动行为发育关联性研究

国家自然科学基金

0+阅读 · 2015年12月31日

脉冲神经网络敏感性及其应用研究

国家自然科学基金

10+阅读 · 2015年12月31日

人类视空间分类的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

警觉信息素唤醒作用及其神经环路

国家自然科学基金

1+阅读 · 2015年12月31日

视知觉学习中的脑功能网络变化及其与学习效果的关系

国家自然科学基金

0+阅读 · 2015年12月31日

光遗传学技术应用于研究上丘相关皮层下神经环路对本能防御行为的调控

国家自然科学基金

0+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

双层网络下的振子集体行为研究：以生物钟神经元网络为例

国家自然科学基金

0+阅读 · 2015年12月31日

BrainVista: Modeling Naturalistic Brain Dynamics as Multimodal Next-Token Prediction

Arxiv

0+阅读 · 2月4日

SpikingGamma: Surrogate-Gradient Free and Temporally Precise Online Training of Spiking Neural Networks with Smoothed Delays

Arxiv

0+阅读 · 2月2日

Fire on Motion: Optimizing Video Pass-bands for Efficient Spiking Action Recognition

Arxiv

0+阅读 · 1月30日

General Self-Prediction Enhancement for Spiking Neurons

Arxiv

0+阅读 · 1月29日

STEMS: Spatial-Temporal Mapping For Spiking Neural Networks

Arxiv

0+阅读 · 1月28日

Fractional-order Spiking Neural Network

Arxiv

0+阅读 · 1月25日

BioNIC: Biologically Inspired Neural Network for Image Classification Using Connectomics Principles

Arxiv

0+阅读 · 1月20日

Simple Models, Rich Representations: Visual Decoding from Primate Intracortical Neural Signals

Arxiv

0+阅读 · 1月16日

Cell Behavior Video Classification Challenge, a benchmark for computer vision methods in time-lapse microscopy

Arxiv

0+阅读 · 1月15日

Enhancing Expressivity of Quantum Neural Networks Based on the SWAP test

Arxiv

0+阅读 · 1月8日

VIP会员

文章信息

相关主题

人工神经网络

最新内容

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

7+阅读 · 4月20日

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

4+阅读 · 4月20日

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

3+阅读 · 4月20日

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

2+阅读 · 4月20日

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

专知会员服务

3+阅读 · 4月20日

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

专知会员服务

2+阅读 · 4月20日

高效视频扩散模型：进展与挑战

高效视频扩散模型：进展与挑战

专知会员服务

2+阅读 · 4月20日

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

7+阅读 · 4月20日

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

5+阅读 · 4月20日

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

9+阅读 · 4月20日

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

5+阅读 · 4月20日

《提升生成模型的安全性与保障》博士论文

《提升生成模型的安全性与保障》博士论文

专知会员服务

5+阅读 · 4月20日

美国当前高超音速导弹发展概述

美国当前高超音速导弹发展概述

专知会员服务

4+阅读 · 4月19日

《高超音速武器：一项再度兴起的技术》120页slides

《高超音速武器：一项再度兴起的技术》120页slides

专知会员服务

14+阅读 · 4月19日

无人机蜂群建模与仿真方法

无人机蜂群建模与仿真方法

专知会员服务

14+阅读 · 4月19日

相关VIP内容

【CVPR2025】STAA-SNN：用于脉冲神经网络的时空注意力聚合器

【CVPR2025】STAA-SNN：用于脉冲神经网络的时空注意力聚合器

专知会员服务

10+阅读 · 2025年3月5日

基于脉冲神经网络的机器人智能控制研究进展

基于脉冲神经网络的机器人智能控制研究进展

专知会员服务

25+阅读 · 2024年9月15日

【CVPR2023】面向不同视频的可扩展神经表示，

【CVPR2023】面向不同视频的可扩展神经表示，

专知会员服务

20+阅读 · 2023年3月28日

《用神经网络构建预测区间：对自举和保形推理方法的经验评估》美国空军大学195页学位论文

《用神经网络构建预测区间：对自举和保形推理方法的经验评估》美国空军大学195页学位论文

专知会员服务

27+阅读 · 2022年7月20日

【含源代码】《用机器学习提高超视距空战中的态势感知能力》最新论文，巴西空军高级研究学院、卡内基梅隆大学机器人研究所

【含源代码】《用机器学习提高超视距空战中的态势感知能力》最新论文，巴西空军高级研究学院、卡内基梅隆大学机器人研究所

专知会员服务

118+阅读 · 2022年6月20日

【Science Advances】MIT最新论文《特化类脑功能在深度神经网络中自发应用》，人脸识别的优化解决方案

【Science Advances】MIT最新论文《特化类脑功能在深度神经网络中自发应用》，人脸识别的优化解决方案

专知会员服务

16+阅读 · 2022年4月10日

【CVPR 2022】从大量非正式视频中构建可动画的3D神经模型，BANMo: Building Animatable 3D Neural Models from Many Casual Videos

【CVPR 2022】从大量非正式视频中构建可动画的3D神经模型，BANMo: Building Animatable 3D Neural Models from Many Casual Videos

专知会员服务

25+阅读 · 2022年3月3日

NeurIPS 2021 | AP-10K：学界最大动物姿态估计数据集问世，更多数量、更多种类、更多任务

NeurIPS 2021 | AP-10K：学界最大动物姿态估计数据集问世，更多数量、更多种类、更多任务

专知会员服务

14+阅读 · 2021年11月4日

脉冲神经网络研究现状及展望

专知会员服务

63+阅读 · 2021年9月20日

【视频预测深度学习综述论文】A Review on Deep Learning Techniques for Video Prediction

【视频预测深度学习综述论文】A Review on Deep Learning Techniques for Video Prediction

专知会员服务

52+阅读 · 2020年4月15日

热门VIP内容

开通专知VIP会员享更多权益服务

《系统簇式多域作战规划范畴论框架》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

相关资讯

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

Nature子刊批判人工神经网络：先天结构比后天训练更重要，应该借鉴动物大脑

Nature子刊批判人工神经网络：先天结构比后天训练更重要，应该借鉴动物大脑

量子位

10+阅读 · 2019年8月24日

【学界】基于GNN，强于GNN：胶囊图神经网络的PyTorch实现 | ICLR 2019

【学界】基于GNN，强于GNN：胶囊图神经网络的PyTorch实现 | ICLR 2019

GAN生成式对抗网络

31+阅读 · 2019年3月26日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

刷新三项COCO纪录！姿态估计模型HRNet开源了，中科大微软出品 | CVPR

刷新三项COCO纪录！姿态估计模型HRNet开源了，中科大微软出品 | CVPR

量子位

11+阅读 · 2019年2月28日

图神经网络将成AI下一拐点！MIT斯坦福一文综述GNN到底有多强

图神经网络将成AI下一拐点！MIT斯坦福一文综述GNN到底有多强

新智元

26+阅读 · 2019年2月27日

脉冲神经网络与小样本学习【附PPT】

脉冲神经网络与小样本学习【附PPT】

人工智能前沿讲习班

48+阅读 · 2019年2月1日

【AAAI专题】论文分享：以生物可塑性为核心的类脑脉冲神经网络

【AAAI专题】论文分享：以生物可塑性为核心的类脑脉冲神经网络

中国科学院自动化研究所

15+阅读 · 2018年1月23日

前沿 | 简述脉冲神经网络SNN：下一代神经网络

前沿 | 简述脉冲神经网络SNN：下一代神经网络

机器之心

39+阅读 · 2018年1月13日

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

机器人圈

35+阅读 · 2017年7月18日

相关论文

BrainVista: Modeling Naturalistic Brain Dynamics as Multimodal Next-Token Prediction

Arxiv

0+阅读 · 2月4日

SpikingGamma: Surrogate-Gradient Free and Temporally Precise Online Training of Spiking Neural Networks with Smoothed Delays

Arxiv

0+阅读 · 2月2日

Fire on Motion: Optimizing Video Pass-bands for Efficient Spiking Action Recognition

Arxiv

0+阅读 · 1月30日

General Self-Prediction Enhancement for Spiking Neurons

Arxiv

0+阅读 · 1月29日

STEMS: Spatial-Temporal Mapping For Spiking Neural Networks

Arxiv

0+阅读 · 1月28日

Fractional-order Spiking Neural Network

Arxiv

0+阅读 · 1月25日

BioNIC: Biologically Inspired Neural Network for Image Classification Using Connectomics Principles

Arxiv

0+阅读 · 1月20日

Simple Models, Rich Representations: Visual Decoding from Primate Intracortical Neural Signals

Arxiv

0+阅读 · 1月16日

Cell Behavior Video Classification Challenge, a benchmark for computer vision methods in time-lapse microscopy

Arxiv

0+阅读 · 1月15日

Enhancing Expressivity of Quantum Neural Networks Based on the SWAP test

Arxiv

0+阅读 · 1月8日

相关基金

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于深度学习的金丝猴面部特性的检测与识别算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于9.4T磁共振成像技术的婴幼猕猴脑运动中枢与运动行为发育关联性研究

国家自然科学基金

0+阅读 · 2015年12月31日

脉冲神经网络敏感性及其应用研究

国家自然科学基金

10+阅读 · 2015年12月31日

人类视空间分类的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

警觉信息素唤醒作用及其神经环路

国家自然科学基金

1+阅读 · 2015年12月31日

视知觉学习中的脑功能网络变化及其与学习效果的关系

国家自然科学基金

0+阅读 · 2015年12月31日

光遗传学技术应用于研究上丘相关皮层下神经环路对本能防御行为的调控

国家自然科学基金

0+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

双层网络下的振子集体行为研究：以生物钟神经元网络为例

国家自然科学基金

0+阅读 · 2015年12月31日

微信扫码咨询专知VIP会员