We study language models as evolving model organisms and ask when autoregressive next-token learning selects for world-tracking representations. For any encoding of latent world states, the Bayes-optimal next-token cross-entropy decomposes into the irreducible conditional entropy plus a Jensen--Shannon excess term. That excess vanishes if and only if the encoding preserves the training ecology's equivalence classes. This yields a precise notion of ecological veridicality for language models and identifies the minimum-complexity zero-excess solution as the quotient partition by training equivalence. We then determine when this fixed-encoding analysis applies to transformer families: frozen dense and frozen Mixture-of-Experts transformers satisfy it, in-context learning does not enlarge the model's separation set, and per-task adaptation breaks the premise. The framework predicts two characteristic failure modes: simplicity pressure preferentially removes low-gain distinctions, and training-optimal models can still incur positive excess on deployment ecologies that refine the training ecology. A conditional dynamic extension shows how inter-model selection and post-training can recover such gap distinctions under explicit heredity, variation, and selection assumptions. Exact finite-ecology checks and controlled microgpt experiments validate the static decomposition, split-merge threshold, off-ecology failure pattern, and two-ecology rescue mechanism in a regime where the relevant quantities are directly observable. The goal is not to model frontier systems at scale, but to use small language models as laboratory organisms for theory about representational selection.


翻译:我们将语言模型视为演化中的模式生物,探究自回归下一词元学习何时选择世界追踪表征。对于任意潜在世界状态的编码,贝叶斯最优下一词元交叉熵可分解为不可约条件熵与詹森-香农过剩项之和。当且仅当该编码保留训练生态系统的等价类时,该过剩项为零。这给出了语言模型生态真实性的精确概念,并将最小复杂度零过剩解识别为训练等价性的商划分。进而我们判定这种固定编码分析何时适用于Transformer家族:冻结密集型和冻结混合专家型Transformer满足该分析,上下文学习不会扩大模型的分离集,而任务自适应破坏了前提。该框架预测了两种典型失败模式:简洁性压力优先移除低增益区分,而训练最优模型在精炼训练生态系统的部署生态系统上仍可能产生正过剩。基于条件动态扩展揭示了在明确的遗传、变异与选择假设下,跨模型选择与训练后如何恢复此种鸿沟区分。精确有限生态系统校验与受控微型gpt实验验证了相关量可直接观测场景下的静态分解、分裂-合并阈值、跨生态系统失败模式及双生态系统拯救机制。本研究目标并非大规模建模前沿系统,而是将小语言模型作为表征选择理论的实验室生物。

0
下载
关闭预览

相关内容

《大语言模型及其对生物武器研发与使用的潜在影响》
专知会员服务
15+阅读 · 2025年11月26日
多模态大型语言模型:综述
专知会员服务
47+阅读 · 2025年6月14日
赋能大型语言模型多领域资源挑战
专知会员服务
10+阅读 · 2025年6月10日
《多语言大型语言模型:系统综述》
专知会员服务
50+阅读 · 2024年11月21日
大模型如何迭代?北大等《大型语言模型自我进化》综述
《多模态大型语言模型进化》最新综述
专知会员服务
105+阅读 · 2024年2月23日
大型语言模型:原理、实现与发展
专知会员服务
102+阅读 · 2023年11月28日
大模型时代的自然语言处理:挑战、机遇与发展
专知会员服务
130+阅读 · 2023年6月17日
《大语言模型进展》69页ppt,谷歌研究科学家Jason Wei
专知会员服务
87+阅读 · 2022年10月29日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
绝对干货!NLP预训练模型:从transformer到albert
新智元
13+阅读 · 2019年11月10日
共享相关任务表征,一文读懂深度神经网络多任务学习
深度学习世界
16+阅读 · 2017年6月23日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
Arxiv
18+阅读 · 2023年9月2日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
6+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关VIP内容
《大语言模型及其对生物武器研发与使用的潜在影响》
专知会员服务
15+阅读 · 2025年11月26日
多模态大型语言模型:综述
专知会员服务
47+阅读 · 2025年6月14日
赋能大型语言模型多领域资源挑战
专知会员服务
10+阅读 · 2025年6月10日
《多语言大型语言模型:系统综述》
专知会员服务
50+阅读 · 2024年11月21日
大模型如何迭代?北大等《大型语言模型自我进化》综述
《多模态大型语言模型进化》最新综述
专知会员服务
105+阅读 · 2024年2月23日
大型语言模型:原理、实现与发展
专知会员服务
102+阅读 · 2023年11月28日
大模型时代的自然语言处理:挑战、机遇与发展
专知会员服务
130+阅读 · 2023年6月17日
《大语言模型进展》69页ppt,谷歌研究科学家Jason Wei
专知会员服务
87+阅读 · 2022年10月29日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员