复杂系统通常表现出特定的自组织几何与拓扑模式,其中蕴含的信息维度往往超越了传统统计方法的捕捉能力。本论文提出了一种统一的几何视角 (unified geometric perspective),用于剖析两个截然不同的领域:宇宙物质的大尺度分布以及大语言模型(LLM)的内部表示。 研究表明,持续同调 (persistent homology) —— 一种旨在追踪跨尺度几何特征“生灭”过程的拓扑数据分析工具 —— 在上述两种场景中均能提供与常规分析方法互补的关键信息。 * 在宇宙学领域:宇宙网的拓扑摘要能够捕捉到傅里叶空间统计量(Fourier-space statistics)所缺失的高阶空间相关性,进而优化对基本物理参数的约束,并有效打破参数间的简并性 (breaking degeneracies)。 * 在机器学习领域:通过追踪拓扑结构在 Transformer 隐藏层间的演化,本研究揭示了信息处理的通用相态 (universal phases),并为模型压缩 (model compression) 提供了理论依据。
此外,除拓扑特征外,本研究进一步证明了本征维度 (intrinsic dimension) 与统计累积量 (statistical cumulants) 等几何度量能够将内部表示的几何特性与模型行为直接关联。具体而言,Token 表示的本征维度与预测不确定性显著相关,而累积量展开则揭示了模型在训练过程中逐步习得高阶结构动力学过程。 核心结论强调了方法论的互补性:几何与拓扑方法并非旨在取代现有的分析框架,而是对其进行了深度扩展,提取出了原本隐匿的、具有高可解释性的结构特征。这种跨领域的成功应用表明,几何与拓扑学正成为理解从宏观宇宙到人工智能等复杂系统的通用工具。