Single-cell electrophysiological recordings provide a powerful window into neuronal functional diversity and offer an interpretable route for linking intrinsic physiology to transcriptomic identity. Here, we replicate and extend the electrophysiology-to-transcriptomics framework introduced by Gouwens et al. (2020) using publicly available Allen Institute Patch-seq datasets from both mouse and human cortex. We focus on GABAergic inhibitory interneurons to target a subclass structure (Lamp5, Pvalb, Sst, Vip) that is comparable and conserved across species. After quality control, we analyzed 3,699 mouse visual cortex neurons and 506 human neocortical neurons from neurosurgical resections. Using standardized electrophysiological features and sparse PCA, we reproduced the major class-level separations reported in the original mouse study. For supervised prediction, a class-balanced random forest provided a strong feature-engineered baseline in mouse data and a reduced but still informative baseline in human data. We then developed an attention-based BiLSTM that operates directly on the structured IPFX feature-family representation, avoiding sPCA and providing feature-family-level interpretability via learned attention weights. Finally, we evaluated a cross-species transfer setting in which the sequence model is pretrained on mouse data and fine-tuned on human data for an aligned 4-class task, improving human macro-F1 relative to a human-only training baseline. Together, these results confirm reproducibility of the Gouwens pipeline in mouse data, demonstrate that sequence models can match feature-engineered baselines, and show that mouse-to-human transfer learning can provide measurable gains for human subclass prediction.


翻译:单细胞电生理记录为神经元功能多样性提供了有力的观测窗口,并为连接内在生理特性与转录组身份提供了一条可解释的路径。本研究利用艾伦研究所公开的小鼠与人类皮层Patch-seq数据集,复现并拓展了Gouwens等人(2020)提出的电生理-转录组学框架。我们聚焦于GABA能抑制性中间神经元,以研究跨物种间具有可比性且保守的亚类结构(Lamp5、Pvalb、Sst、Vip)。经过质量控制,我们分析了来自小鼠视觉皮层的3,699个神经元以及神经外科切除获取的506个人类新皮层神经元。通过标准化电生理特征与稀疏PCA,我们复现了原始小鼠研究中报告的主要类别层级分离结果。在监督预测方面,类别平衡随机森林在小鼠数据中提供了强力的特征工程基线,在人类数据中虽有所降低但仍保持信息量。随后,我们开发了一种基于注意力机制的双向LSTM模型,该模型直接对结构化IPFX特征族表示进行操作,避免了稀疏PCA处理,并通过学习得到的注意力权重提供特征族层级的可解释性。最后,我们评估了跨物种迁移学习场景:序列模型在小鼠数据上进行预训练,随后在人类数据上针对对齐的四分类任务进行微调,相较于仅使用人类数据训练的基线,该策略提升了人类数据的宏观F1分数。综上所述,这些结果证实了Gouwens流程在小鼠数据中的可复现性,证明了序列模型能够匹配特征工程基线的性能,并表明从小鼠到人类的迁移学习能够为人类神经元亚类预测带来可量化的性能提升。

0
下载
关闭预览

相关内容

【剑桥博士论文】多智能体学习中的神经多样性
专知会员服务
21+阅读 · 2025年8月22日
利用表示学习推动多机构电子健康记录数据研究
专知会员服务
16+阅读 · 2025年2月17日
利用神经网络进行序列到序列转换的学习
AI研习社
12+阅读 · 2019年4月26日
基于Keras进行迁移学习
论智
12+阅读 · 2018年5月6日
迁移学习在深度学习中的应用
专知
24+阅读 · 2017年12月24日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
BES:让语言模型通过双向进化搜索自我改进
专知会员服务
3+阅读 · 5月30日
以色列-美国-伊朗战争中的无人机:关键要点
专知会员服务
4+阅读 · 5月30日
《Palantir任务保障性软件安全标准(MA-S2)》
专知会员服务
10+阅读 · 5月30日
基于声学的无人机检测技术综述
专知会员服务
7+阅读 · 5月30日
《当代混合战争分析框架:俄乌战争经验教训》
战略前沿人工智能的再思考(中文)
专知会员服务
8+阅读 · 5月29日
《量化地基防空系统间接效应的博弈论方法》
专知会员服务
6+阅读 · 5月29日
相关VIP内容
【剑桥博士论文】多智能体学习中的神经多样性
专知会员服务
21+阅读 · 2025年8月22日
利用表示学习推动多机构电子健康记录数据研究
专知会员服务
16+阅读 · 2025年2月17日
相关基金
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员