Spurious correlations are common in time-series analysis because simple, low-complexity patterns can produce high Pearson correlations even between unrelated series. We argue that Kolmogorov complexity, interpreted as resistance to compression, provides a principled safeguard against such false positives. Using effective Hausdorff dimension, we show that the probability of accidental correlation between two independent series decays exponentially with their complexity, while noise can inflate observed complexity and must therefore be accounted for in practice. We illustrate these ideas with coupled logistic maps and multivariate fractional Brownian motion (mfBm), where the Hurst parameter \(H\) controls both complexity and Hausdorff dimension \((\dim_H = 2 - H)\). Both models show that false positives are much more common among low-complexity series than among high-complexity ones. We introduce the joint complexity indicator \[ J_{\rm LZ} = \sqrt{\widetilde{C}_{\rm LZ}(x)\widetilde{C}_{\rm LZ}(y)}, \] which captures joint high complexity rather than simple similarity between individual complexities. Its threshold can be calibrated from the mfBm false-positive curve. In logistic maps, \(J_{\rm LZ}\) also anticipates the collapse of individual complexity just before synchronization. We recommend establishing stationarity first, then reporting \(J_{\rm LZ}\) alongside \(ρ\), and treating high correlation among low-complexity series with skepticism.


翻译:时间序列分析中虚假相关十分常见,因为即便是无关序列之间,简单低复杂度的模式也可能产生高皮尔逊相关性。我们认为,柯尔莫哥洛夫复杂度(解释为抗压缩性)为防范这类假阳性提供了理论依据。利用有效豪斯多夫维数,我们证明两个独立序列间偶然相关的概率随其复杂度呈指数衰减,而噪声会人为提升观测复杂度,因此实际应用中必须予以考虑。我们通过耦合逻辑映射与多元分数布朗运动(mfBm)阐释这些概念——其中赫斯特参数\(H\)同时控制复杂度与豪斯多夫维数\((\dim_H = 2 - H)\)。两种模型均表明:相较于高复杂度序列,低复杂度序列的假阳性现象更为普遍。我们提出联合复杂度指标\[ J_{\rm LZ} = \sqrt{\widetilde{C}_{\rm LZ}(x)\widetilde{C}_{\rm LZ}(y)} \],该指标捕捉的是联合高复杂度而非个体复杂度间的简单相似性。其阈值可通过mfBm假阳性曲线进行校准。在逻辑映射中,\(J_{\rm LZ}\)还能在同步发生前预判个体复杂度的坍缩。我们建议:首先验证序列平稳性,然后同时报告\(J_{\rm LZ}\)与\(ρ\),并对低复杂度序列间的高相关性持审慎态度。

0
下载
关闭预览

相关内容

数学上,序列是被排成一列的对象(或事件);这样每个元素不是在其他元素之前,就是在其他元素之后。这里,元素之间的顺序非常重要。
「深度时间序列模型」综述
专知会员服务
44+阅读 · 2024年7月19日
时间序列复杂网络分析中的可视图方法研究综述
专知会员服务
31+阅读 · 2024年3月9日
【干货书】基于R的非线性时间序列分析,510页pdf
专知会员服务
47+阅读 · 2023年6月12日
专知会员服务
63+阅读 · 2020年3月4日
R语言时间序列分析
R语言中文社区
12+阅读 · 2018年11月19日
相关性≠因果:概率图模型和do-calculus
论智
31+阅读 · 2018年10月29日
不用数学讲清马尔可夫链蒙特卡洛方法?
算法与数学之美
16+阅读 · 2018年8月8日
基于 Keras 用深度学习预测时间序列
R语言中文社区
23+阅读 · 2018年7月27日
R语言之数据分析高级方法「时间序列」
R语言中文社区
17+阅读 · 2018年4月24日
概率图模型体系:HMM、MEMM、CRF
机器学习研究会
30+阅读 · 2018年2月10日
回归预测&时间序列预测
GBASE数据工程部数据团队
44+阅读 · 2017年5月17日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
4+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关资讯
R语言时间序列分析
R语言中文社区
12+阅读 · 2018年11月19日
相关性≠因果:概率图模型和do-calculus
论智
31+阅读 · 2018年10月29日
不用数学讲清马尔可夫链蒙特卡洛方法?
算法与数学之美
16+阅读 · 2018年8月8日
基于 Keras 用深度学习预测时间序列
R语言中文社区
23+阅读 · 2018年7月27日
R语言之数据分析高级方法「时间序列」
R语言中文社区
17+阅读 · 2018年4月24日
概率图模型体系:HMM、MEMM、CRF
机器学习研究会
30+阅读 · 2018年2月10日
回归预测&时间序列预测
GBASE数据工程部数据团队
44+阅读 · 2017年5月17日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员