The evolution of biological morphology is critical for understanding the diversity of the natural world, yet traditional analyses often involve subjective biases in the selection and coding of morphological traits. This study employs deep learning techniques, utilising a ResNet34 model capable of recognising over 10,000 bird species, to explore avian morphological evolution. We extract weights from the model's final fully connected (fc) layer and investigate the semantic alignment between the high-dimensional embedding space learned by the model and biological phenotypes. The results demonstrate that the high-dimensional embedding space encodes phenotypic convergence. Subsequently, we assess the morphological disparity among various taxa and evaluate the association between morphological disparity and species richness, demonstrating that species richness is the primary driver of morphospace expansion. Moreover, the disparity-through-time analysis reveals a visual "early burst" after the K-Pg extinction. While mainly aimed at evolutionary analysis, this study also provides insights into the interpretability of Deep Neural Networks. We demonstrate that hierarchical semantic structures (biological taxonomy) emerged in the high-dimensional embedding space despite being trained on flat labels. Furthermore, through adversarial examples, we provide evidence that our model in this task can overcome texture bias and learn holistic shape representations (body plans), challenging the prevailing view that CNNs rely primarily on local textures.


翻译:生物形态的演化对于理解自然界的多样性至关重要,然而传统分析在形态性状的选择和编码上常存在主观偏差。本研究采用深度学习技术,利用一个能够识别超过10,000种鸟类的ResNet34模型,来探索鸟类的形态演化。我们从模型的最终全连接(fc)层提取权重,并探究模型学习到的高维嵌入空间与生物表型之间的语义对齐关系。结果表明,该高维嵌入空间编码了表型的趋同演化。随后,我们评估了不同分类群之间的形态差异,并检验了形态差异与物种丰富度之间的关联,证明物种丰富度是形态空间扩张的主要驱动力。此外,基于时间序列的差异分析揭示了在K-Pg大灭绝事件之后出现了一次视觉上的“早期爆发”。虽然本研究主要旨在进行演化分析,但它也为深度神经网络的解释性提供了见解。我们证明,尽管模型是在扁平标签上训练的,但层次化的语义结构(生物分类学)在高维嵌入空间中自发涌现。进一步地,通过对抗样本,我们提供了证据表明,本任务中的模型能够克服纹理偏差并学习整体形状表征(身体构型),这对当前普遍认为卷积神经网络主要依赖局部纹理的观点提出了挑战。

0
下载
关闭预览

相关内容

使用深度学习进行生物网络分析
专知会员服务
20+阅读 · 2022年6月30日
基于深度学习的计算机视觉研究新进展
专知会员服务
152+阅读 · 2022年4月21日
专知会员服务
39+阅读 · 2021年3月3日
生物数据挖掘中的深度学习,诺丁汉特伦特大学
专知会员服务
68+阅读 · 2020年3月5日
多模态深度学习综述,18页pdf
专知
51+阅读 · 2020年3月29日
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
基于深度学习的NLP 32页最新进展综述,190篇参考文献
人工智能学家
28+阅读 · 2018年12月4日
展望:模型驱动的深度学习
人工智能学家
12+阅读 · 2018年1月23日
深度学习在计算机视觉领域的前沿进展
我爱机器学习
11+阅读 · 2017年1月7日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
25+阅读 · 2018年1月24日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员