We demonstrate that the assembly pathway method underlying ``Assembly Theory" (AT) is a suboptimal restricted version of Huffman's encoding (Shannon-Fano type) for `counting copies,' the stated objective of the authors of AT, introduced in computer science in the 1960s and widely used by popular statistical and computable compression algorithms that have been applied to all sort of biosignatures before. We show how simple modular instructions can mislead AT, leading to failure to accomplish what the authors originally intended (counting the `number of copies') or to capture subtleties, beyond very trivial statistical properties of biological systems. We present cases whose low complexity can arbitrarily diverge from the random-like appearance to which the AT would assign arbitrarily high statistical significance, and show that it fails in simple cases (synthetic or natural) which the assembly theory was supposed to shed some light on. Our theoretical and empirical results imply that the assembly index, whose computable nature is not an advantage, does not offer any substantial improvement over existing concepts and methods, computable or (semi) uncomputable. No strong compression or algorithmic complexity results were required to prove that AT and MA are ill-defined and under-perform as compared to simple coding schemes. We show that despite the claims of experimental data, the assembly measure is driven mostly or only by InChI codes which had already been reported before to discriminate organic from inorganic compounds by other indexes.


翻译:我们证明,“组装理论”(AT)所依据的组装路径方法,是计算机科学于20世纪60年代提出、并已广泛应用于各类生物标志物统计与可计算压缩算法的霍夫曼编码(香农-法诺型)在“副本计数”这一AT作者所述目标上的次优受限版本。我们展示简单的模块化指令如何误导AT,导致其既无法实现作者最初设定的目标(计算“副本数量”),也无法捕捉超越生物学系统极简单统计特性的微妙之处。我们呈现了低复杂性可任意偏离随机外观的案例,而AT会为此类随机外观赋予任意高的统计显著性,并证明其在原本应予以阐明的人造或自然简单案例中失效。理论与实证结果表明,尽管组装指数具有可计算性这一非优势特性,但相对于现有概念与方法(无论可计算或半不可计算),该指数并未提供实质性改进。无需借助强压缩或算法复杂性结果,即可证明AT与MA定义不当且性能劣于简单编码方案。我们揭示,尽管有实验数据声称,组装测度主要甚或仅受InChI码驱动——而此前已有其他指数通过此类编码区分有机与无机化合物。

0
下载
关闭预览

相关内容

【经典书】主动学习理论,226页pdf,Theory of Active Learning
专知会员服务
129+阅读 · 2021年7月14日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
GNN 新基准!Long Range Graph Benchmark
图与推荐
0+阅读 · 2022年10月18日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
Unsupervised Learning via Meta-Learning
CreateAMind
44+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
vae 相关论文 表示学习 1
CreateAMind
12+阅读 · 2018年9月6日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
19+阅读 · 2022年7月29日
Arxiv
57+阅读 · 2022年1月5日
A Comprehensive Survey on Transfer Learning
Arxiv
121+阅读 · 2019年11月7日
VIP会员
最新内容
综述 | OPSD:大语言模型的在线策略自蒸馏
专知会员服务
3+阅读 · 6月1日
帕兰蒂尔Maven:军事人工智能的新纪元
专知会员服务
7+阅读 · 6月1日
超越网格:作战环境对炮兵的影响
专知会员服务
3+阅读 · 5月31日
BES:让语言模型通过双向进化搜索自我改进
专知会员服务
6+阅读 · 5月30日
以色列-美国-伊朗战争中的无人机:关键要点
专知会员服务
7+阅读 · 5月30日
相关VIP内容
【经典书】主动学习理论,226页pdf,Theory of Active Learning
专知会员服务
129+阅读 · 2021年7月14日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
相关资讯
GNN 新基准!Long Range Graph Benchmark
图与推荐
0+阅读 · 2022年10月18日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
Unsupervised Learning via Meta-Learning
CreateAMind
44+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
vae 相关论文 表示学习 1
CreateAMind
12+阅读 · 2018年9月6日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员