The dynamics of many-body systems can often be captured in terms of only a few relevant variables. Mathematical and numerical approaches exist to identify these variables by exploiting a separation of time scales between slow relevant and fast irrelevant variables, but such a separation of scales is not always obvious or even available. In this work, we introduce an information-theoretic framework for dimensionality reduction in dynamical systems that bypasses this limitation by instead identifying relevant variables based on how predictive they are of the system's future. To do so, we mathematically formalize the intuition that model reduction is about keeping "relevant" information while throwing away "irrelevant" information. We characterize the solution of the resulting optimization problem and prove that it reduces to standard approaches when a separation of time scales is indeed present in the dynamics. Importantly, we find that within this framework, the problems of identifying relevant variables and identifying their effective dynamics decouple and may be solved separately. This makes the method tractable in practice and enables us to derive dimensionally-reduced variables from data with neural networks. Combined with existing equation learning methods, the procedure introduced in this work reveals the dynamical rules governing the system's evolution in a data-driven manner. We illustrate these tools in diverse settings including simulated chaotic systems, uncurated satellite recordings of atmospheric fluid flows, and experimental videos of cyanobacteria colonies in which we discover an emergent synchronization order parameter.


翻译:多体系统的动力学通常仅通过少数相关变量即可描述。目前已有数学与数值方法通过利用慢速相关变量与快速无关变量之间的时间尺度分离来识别这些变量,但这种尺度分离并非总是明显存在,甚至可能完全缺失。本研究提出一种基于信息论的降维框架,突破这一局限,通过衡量变量对系统未来状态的预测能力来识别相关变量。为此,我们数学形式化了模型降维的本质——保留"相关"信息并丢弃"无关"信息。我们对所得优化问题的解进行刻画,证明当动力学确实存在时间尺度分离时,该解可简化为标准方法。重要的是,我们发现该框架下识别相关变量与建立其有效动力学这两个问题可以解耦并分别求解,这使得方法在实际中具有可操作性,并可借助神经网络从数据中提取降维变量。结合现有方程学习方法,本工作提出的流程能以数据驱动方式揭示系统演化的动力学法则。我们通过模拟混沌系统、大气流体未筛选卫星记录以及蓝藻菌落实验视频(从中发现涌现的同步序参量)等多种场景验证了这些工具的有效性。

0
下载
关闭预览

相关内容

【新书】动力系统的收缩理论,258页pdf
专知会员服务
26+阅读 · 2024年11月22日
【新书】流形学习:工程中的模型降维
专知会员服务
53+阅读 · 2024年11月9日
【干货书】数据科学中的信息理论方法
专知会员服务
97+阅读 · 2022年6月27日
专知会员服务
56+阅读 · 2021年8月29日
异质信息网络分析与应用综述,软件学报-北京邮电大学
深度多模态表示学习综述论文,22页pdf
专知
33+阅读 · 2020年6月21日
从信息瓶颈理论一瞥机器学习的“大一统理论”
简述多种降维算法
算法与数学之美
11+阅读 · 2018年9月23日
从香农熵到手推KL散度:一文带你纵览机器学习中的信息论
算法与数学之美
10+阅读 · 2018年1月14日
【直观详解】信息熵、交叉熵和相对熵
机器学习研究会
10+阅读 · 2017年11月7日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
VIP会员
最新内容
美国从乌克兰无人机战争中学习经验
专知会员服务
1+阅读 · 今天15:03
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
0+阅读 · 今天14:31
学习数据的几何:形状空间分析数学综述
专知会员服务
8+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
10+阅读 · 6月17日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员