The development of foundation models for functional magnetic resonance imaging (fMRI) time series holds significant promise for predicting phenotypes related to disease and cognition. Current models, however, are often trained using a mask-and-reconstruct objective on small brain regions. This focus on low-level information leads to representations that are sensitive to noise and temporal fluctuations, necessitating extensive fine-tuning for downstream tasks. We introduce Brain-Semantoks, a self-supervised framework designed specifically to learn abstract representations of brain dynamics. Its architecture is built on two core innovations: a semantic tokenizer that aggregates noisy regional signals into robust tokens representing functional networks, and a self-distillation objective that enforces representational stability across time. We show that this objective is stabilized through a novel training curriculum, ensuring the model robustly learns meaningful features from low signal-to-noise time series. We demonstrate that learned representations enable strong performance on a variety of downstream tasks even when only using a linear probe. Furthermore, we provide comprehensive scaling analyses indicating more unlabeled data reliably results in out-of-distribution performance gains without domain adaptation.


翻译:功能磁共振成像(fMRI)时间序列基础模型的开发,对于预测与疾病和认知相关的表型具有重要前景。然而,当前模型通常是在小脑区域上使用掩码-重建目标进行训练的。这种对低层次信息的关注导致所得表征对噪声和时间波动敏感,在下游任务中需要进行大量微调。我们提出了Brain-Semantoks,这是一个专门为学习脑动态的抽象表征而设计的自监督框架。其架构基于两项核心创新:一个语义标记器,它将嘈杂的区域信号聚合成代表功能网络的鲁棒标记;以及一个自蒸馏目标,它强制表征在时间维度上保持稳定性。我们证明,通过一种新颖的训练课程设计,该目标得以稳定,确保模型能够从低信噪比的时间序列中稳健地学习有意义的特征。我们证明了学习到的表征即使仅使用线性探针,也能在各种下游任务上实现强大的性能。此外,我们提供了全面的缩放分析,表明更多的无标签数据能够可靠地带来分布外性能的提升,而无需进行领域适应。

0
下载
关闭预览

相关内容

【NeurIPS 2020】视觉注意力神经编码
专知会员服务
42+阅读 · 2020年10月4日
用Attention玩转CV,一文总览自注意力语义分割进展
学会原创 | 自然语言的语义表示学习方法与应用
中国人工智能学会
11+阅读 · 2019年3月7日
使用RNN-Transducer进行语音识别建模【附PPT与视频资料】
人工智能前沿讲习班
74+阅读 · 2019年1月29日
从Seq2seq到Attention模型到Self Attention(一)
量化投资与机器学习
76+阅读 · 2018年10月8日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
VIP会员
最新内容
大规模作战行动中的战术作战评估(研究论文)
专知会员服务
0+阅读 · 25分钟前
未来的海战无人自主系统
专知会员服务
0+阅读 · 41分钟前
美军多域作战现状分析:战略、概念还是幻想?
专知会员服务
0+阅读 · 54分钟前
无人机与反无人机系统(书籍)
专知会员服务
13+阅读 · 今天6:45
美陆军2026条令:安全与机动支援
专知会员服务
3+阅读 · 今天5:49
技术、多域威慑与海上战争(报告)
专知会员服务
8+阅读 · 4月13日
“在云端防御”:提升北约数据韧性(报告)
专知会员服务
5+阅读 · 4月13日
相关VIP内容
【NeurIPS 2020】视觉注意力神经编码
专知会员服务
42+阅读 · 2020年10月4日
相关基金
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员