Modeling real-world systems requires accounting for noise - whether it arises from unpredictable fluctuations in financial markets, irregular rhythms in biological systems, or environmental variability in ecosystems. While the behavior of such systems can often be described by stochastic differential equations, a central challenge is understanding how noise influences the inference of system parameters and dynamics from data. Traditional symbolic regression methods can uncover governing equations but typically ignore uncertainty. Conversely, Gaussian processes provide principled uncertainty quantification but offer little insight into the underlying dynamics. In this work, we bridge this gap with a hybrid symbolic regression-probabilistic machine learning framework that recovers the symbolic form of the governing equations while simultaneously inferring uncertainty in the system parameters. The framework combines deep symbolic regression with Gaussian process-based maximum likelihood estimation to separately model the deterministic dynamics and the noise structure, without requiring prior assumptions about their functional forms. We verify the approach on numerical benchmarks, including harmonic, Duffing, and van der Pol oscillators, and validate it on an experimental system of coupled biological oscillators exhibiting synchronization, where the algorithm successfully identifies both the symbolic and stochastic components. The framework is data-efficient, requiring as few as 100-1000 data points, and robust to noise - demonstrating its broad potential in domains where uncertainty is intrinsic and both the structure and variability of dynamical systems must be understood.


翻译:对真实世界系统进行建模需要考虑噪声——无论该噪声源自金融市场的不可预测波动、生物系统的不规则节律,还是生态系统中的环境变异性。尽管此类系统的行为通常可用随机微分方程描述,但核心挑战在于理解噪声如何影响从数据中推断系统参数和动力学过程。传统符号回归方法虽能揭示控制方程,但通常忽略不确定性;而高斯过程虽能提供严谨的不确定性量化,却对潜在动力学过程揭示不足。本研究通过构建混合符号回归-概率机器学习框架弥合了这一鸿沟,该框架在推断系统参数不确定性的同时,可恢复控制方程的符号形式。该框架将深度符号回归与基于高斯过程的最大似然估计相结合,无需对确定性动力学和噪声结构的函数形式进行先验假设,即可对二者分别建模。我们在包括谐波、杜芬和范德波尔振荡器在内的数值基准上验证了该方法,并在呈现同步行为的耦合生物振荡器实验系统中进行了验证,算法成功识别了符号分量和随机分量。该框架具有数据高效性(仅需100-1000个数据点)和噪声鲁棒性,在不确定性固有存在且必须同时理解动力系统结构与变异性的领域中展现出广泛应用潜力。

0
下载
关闭预览

相关内容

【斯坦福大学博士论文】个性化机器学习的理论进展
专知会员服务
25+阅读 · 2025年3月25日
可解释的机器学习模型和架构
专知会员服务
92+阅读 · 2023年9月17日
机器学习的可解释性
专知会员服务
180+阅读 · 2020年8月27日
机器学习必备的数学基础有哪些?
人工智能头条
12+阅读 · 2019年10月18日
机器学习中如何处理不平衡数据?
机器之心
13+阅读 · 2019年2月17日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
17+阅读 · 2019年1月24日
论文浅尝 | 基于局内去噪和迁移学习的关系抽取
开放知识图谱
16+阅读 · 2018年12月2日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
最新内容
俄罗斯无人机战线实验
专知会员服务
6+阅读 · 今天3:29
高阶网络的表示:基于图的框架综述
专知会员服务
10+阅读 · 5月14日
《作战资源再分配的作战行动数学模型构建》
专知会员服务
15+阅读 · 5月14日
世界动作模型: 具身AI的下一个前沿
专知会员服务
16+阅读 · 5月13日
全球十大防空反导系统:列表、射程与用途
专知会员服务
16+阅读 · 5月13日
相关VIP内容
相关基金
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员