Learning under Distributional Drift: Reproducibility as an Intrinsic Statistical Resource - 专知论文

会员服务 ·

0

可复现性 · 复现性 · 泛化 · 极大 · 泛化误差 ·

Learning under Distributional Drift: Reproducibility as an Intrinsic Statistical Resource

翻译：分布漂移下的学习：可复现性作为一种内在统计资源

from arxiv, 37 pages, 4 figures

Statistical learning under distributional drift remains insufficiently characterized: when each observation alters the data-generating law, classical generalization bounds can collapse. We introduce a new statistical primitive, the reproducibility budget $C_T$, which quantifies a system's finite capacity for statistical reproducibility: the extent to which its sampling process can remain governed by a consistent underlying distribution in the presence of both exogenous change and endogenous feedback. Formally, $C_T$ is defined as the cumulative Fisher-Rao path length of the coupled learner-environment evolution, measuring the total distributional motion accumulated during learning. From this construct we derive a drift-feedback generalization bound of order $O(T^{-1/2} + C_T/T)$, and we prove a matching minimax lower bound showing that this rate is minimax-optimal. Consequently, the results establish a reproducibility speed limit: no algorithm can achieve smaller worst-case generalization error than that imposed by the average Fisher-Rao drift rate $C_T/T$ of the data-generating process. The framework situates exogenous drift, adaptive data analysis, and performative prediction within a common geometric structure, with $C_T$ emerging as the intrinsic quantity measuring distributional motion across these settings.

翻译：分布漂移下的统计学习仍缺乏充分刻画：当每个观测都会改变数据生成规律时，经典泛化界可能失效。我们引入一种新的统计原语——可复现性预算$C_T$，用以量化系统有限的统计可复现能力：即在存在外生变化与内生反馈的情况下，其抽样过程能在多大程度上保持由一致底层分布所支配。形式化地，$C_T$定义为耦合学习者-环境演化的累积Fisher-Rao路径长度，用于度量学习过程中积累的总分布运动量。基于此构造，我们推导出阶数为$O(T^{-1/2} + C_T/T)$的漂移-反馈泛化界，并证明与之匹配的极小极大下界，表明该速率是极小极大最优的。因此，这些结果确立了一个可复现性速度极限：任何算法都无法实现比数据生成过程的平均Fisher-Rao漂移率$C_T/T$所强加的泛化误差更小的最坏情况泛化误差。该框架将外生漂移、自适应数据分析和执行预测置于统一的几何结构中，而$C_T$则作为衡量这些场景中分布运动的内在量涌现出来。

0

相关内容

可复现性

图基础模型中的分布外（Out-of-Distribution）泛化研究

图基础模型中的分布外（Out-of-Distribution）泛化研究

专知会员服务

12+阅读 · 1月31日

【ICML2025】时序分布漂移下的自适应估计与学习

【ICML2025】时序分布漂移下的自适应估计与学习

专知会员服务

12+阅读 · 2025年5月25日

深度图学习在分布偏移下的综述：从图的分布外泛化到自适应

深度图学习在分布偏移下的综述：从图的分布外泛化到自适应

专知会员服务

18+阅读 · 2024年10月28日

【牛津大学博士论文】学习分布不确定性估计的语义分割，191页pdf

【牛津大学博士论文】学习分布不确定性估计的语义分割，191页pdf

专知会员服务

30+阅读 · 2024年7月31日

【CMU博士论文】分布偏移下的不确定性量化，226页pdf

【CMU博士论文】分布偏移下的不确定性量化，226页pdf

专知会员服务

31+阅读 · 2023年9月30日

【伯克利博士论文】学习跨领域的可迁移表示

【伯克利博士论文】学习跨领域的可迁移表示

专知会员服务

47+阅读 · 2022年8月17日

【AAAI 2022】基于数据分布生成的可预测概念漂移适应

【AAAI 2022】基于数据分布生成的可预测概念漂移适应

专知会员服务

34+阅读 · 2022年1月12日

分布外泛化(Out-Of-Distribution Generalization) 综述论文，22页pdf240篇文献

专知会员服务

64+阅读 · 2021年9月2日

【清华大学龙明盛副教授】迁移学习理论与算法，59页ppt

【清华大学龙明盛副教授】迁移学习理论与算法，59页ppt

专知会员服务

84+阅读 · 2020年11月27日

【IBM】在视觉和关系推理中迁移学习，Transfer Learning in Visual and Relational Reasoning

【IBM】在视觉和关系推理中迁移学习，Transfer Learning in Visual and Relational Reasoning

专知会员服务

45+阅读 · 2020年1月15日

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

专知

16+阅读 · 2020年4月27日

统计学习要素（The Elements of Statistical Learning）的中文翻译、代码实现及其习题解答，附下载

统计学习要素（The Elements of Statistical Learning）的中文翻译、代码实现及其习题解答，附下载

专知

41+阅读 · 2019年11月18日

里昂大学博士学位论文-图像分类中的迁移学习

里昂大学博士学位论文-图像分类中的迁移学习

专知

12+阅读 · 2019年4月10日

迁移自适应学习最新综述，附21页论文下载

迁移自适应学习最新综述，附21页论文下载

专知

34+阅读 · 2019年3月13日

当前最好的非深度迁移学习方法：流形空间下的分布对齐

当前最好的非深度迁移学习方法：流形空间下的分布对齐

PaperWeekly

11+阅读 · 2018年7月31日

【深度学习】深度学习的几何观点：流形分布定律、学习能力的上限、概率变换的几何观点

【深度学习】深度学习的几何观点：流形分布定律、学习能力的上限、概率变换的几何观点

产业智能官

10+阅读 · 2018年6月23日

基于Keras进行迁移学习

基于Keras进行迁移学习

论智

12+阅读 · 2018年5月6日

【迁移学习】迁移学习的干货学习资料 | 干货分享 | 技术解读

【迁移学习】迁移学习的干货学习资料 | 干货分享 | 技术解读

产业智能官

15+阅读 · 2018年1月2日

迁移学习在深度学习中的应用

迁移学习在深度学习中的应用

专知

24+阅读 · 2017年12月24日

什么是迁移学习？它都用在深度学习的哪些场景上？这篇文章替你讲清楚了

什么是迁移学习？它都用在深度学习的哪些场景上？这篇文章替你讲清楚了

AI100

16+阅读 · 2017年12月23日

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

基于迁移学习的图像隐写分析新方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

基于强化学习的分布参数系统数据驱动控制

国家自然科学基金

7+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

相依回归模型与扩散过程的统计推断及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

关于面板(纵向）数据的动态统计分析

国家自然科学基金

0+阅读 · 2014年12月31日

Positive Distribution Shift as a Framework for Understanding Tractable Learning

Arxiv

0+阅读 · 2月12日

Learning Tractable Distributions Of Language Model Continuations

Arxiv

0+阅读 · 2月10日

Resilient Class-Incremental Learning: on the Interplay of Drifting, Unlabelled and Imbalanced Data Streams

Arxiv

0+阅读 · 2月10日

Positive Distribution Shift as a Framework for Understanding Tractable Learning

Arxiv

0+阅读 · 2月9日

Federated Learning with Profile Mapping under Distribution Shifts and Drifts

Arxiv

0+阅读 · 2月7日

Transfer Learning Through Conditional Quantile Matching

Arxiv

0+阅读 · 2月2日

Evolving Machine Learning in Non-Stationary Environments: A Unified Survey of Drift, Forgetting, and Adaptation

Arxiv

0+阅读 · 1月25日

Composite Flow Matching for Reinforcement Learning with Shifted-Dynamics Data

Arxiv

0+阅读 · 1月21日

PAC Learnability in the Presence of Performativity

Arxiv

0+阅读 · 1月19日

Transfer Learning for Benign Overfitting in High-Dimensional Linear Regression

Arxiv

0+阅读 · 1月16日

VIP会员

文章信息

相关主题

最新内容

【CMU博士论文】物理世界的视觉感知与深度理解

【CMU博士论文】物理世界的视觉感知与深度理解

专知会员服务

0+阅读 · 今天14:36

多智能体系统：从经典范式到大基础模型驱动的未来

多智能体系统：从经典范式到大基础模型驱动的未来

专知会员服务

1+阅读 · 今天14:33

伊朗战争停火期间美军关键弹药状况分析

伊朗战争停火期间美军关键弹药状况分析

专知会员服务

5+阅读 · 今天11:13

电子战革命：塑造战场的十年突破（2015–2025）

电子战革命：塑造战场的十年突破（2015–2025）

专知会员服务

4+阅读 · 今天9:19

人工智能赋能电子战解决方案：实现电磁优势的认知方法（万字长文）

人工智能赋能电子战解决方案：实现电磁优势的认知方法（万字长文）

专知会员服务

5+阅读 · 今天9:00

《基于模型的系统工程框架及其在电子战系统中的应用》

《基于模型的系统工程框架及其在电子战系统中的应用》

专知会员服务

4+阅读 · 今天8:27

人工智能即服务与未来战争（印度视角）

人工智能即服务与未来战争（印度视角）

专知会员服务

2+阅读 · 今天7:57

《将量子技术集成到移动军事系统与战术作战中心框架》

《将量子技术集成到移动军事系统与战术作战中心框架》

专知会员服务

4+阅读 · 今天7:53

《美国战争部2027财年军事人员预算》

《美国战争部2027财年军事人员预算》

专知会员服务

2+阅读 · 今天7:44

伊朗战争中的电子战

伊朗战争中的电子战

专知会员服务

5+阅读 · 今天7:04

大语言模型平台在国防情报应用中的对比

大语言模型平台在国防情报应用中的对比

专知会员服务

8+阅读 · 今天3:12

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

专知会员服务

6+阅读 · 今天3:00

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

专知会员服务

5+阅读 · 今天2:56

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

专知会员服务

5+阅读 · 今天2:44

《仿真互操作性标准：实时平台参考联邦对象模型指南、原理与互操作性模式标准》300页

《仿真互操作性标准：实时平台参考联邦对象模型指南、原理与互操作性模式标准》300页

专知会员服务

9+阅读 · 今天2:37

相关VIP内容

图基础模型中的分布外（Out-of-Distribution）泛化研究

图基础模型中的分布外（Out-of-Distribution）泛化研究

专知会员服务

12+阅读 · 1月31日

【ICML2025】时序分布漂移下的自适应估计与学习

【ICML2025】时序分布漂移下的自适应估计与学习

专知会员服务

12+阅读 · 2025年5月25日

深度图学习在分布偏移下的综述：从图的分布外泛化到自适应

深度图学习在分布偏移下的综述：从图的分布外泛化到自适应

专知会员服务

18+阅读 · 2024年10月28日

【牛津大学博士论文】学习分布不确定性估计的语义分割，191页pdf

【牛津大学博士论文】学习分布不确定性估计的语义分割，191页pdf

专知会员服务

30+阅读 · 2024年7月31日

【CMU博士论文】分布偏移下的不确定性量化，226页pdf

【CMU博士论文】分布偏移下的不确定性量化，226页pdf

专知会员服务

31+阅读 · 2023年9月30日

【伯克利博士论文】学习跨领域的可迁移表示

【伯克利博士论文】学习跨领域的可迁移表示

专知会员服务

47+阅读 · 2022年8月17日

【AAAI 2022】基于数据分布生成的可预测概念漂移适应

【AAAI 2022】基于数据分布生成的可预测概念漂移适应

专知会员服务

34+阅读 · 2022年1月12日

分布外泛化(Out-Of-Distribution Generalization) 综述论文，22页pdf240篇文献

专知会员服务

64+阅读 · 2021年9月2日

【清华大学龙明盛副教授】迁移学习理论与算法，59页ppt

【清华大学龙明盛副教授】迁移学习理论与算法，59页ppt

专知会员服务

84+阅读 · 2020年11月27日

【IBM】在视觉和关系推理中迁移学习，Transfer Learning in Visual and Relational Reasoning

【IBM】在视觉和关系推理中迁移学习，Transfer Learning in Visual and Relational Reasoning

专知会员服务

45+阅读 · 2020年1月15日

热门VIP内容

开通专知VIP会员享更多权益服务

多智能体系统：从经典范式到大基础模型驱动的未来

电子战革命：塑造战场的十年突破（2015–2025）

【CMU博士论文】物理世界的视觉感知与深度理解

伊朗战争停火期间美军关键弹药状况分析

相关资讯

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

专知

16+阅读 · 2020年4月27日

统计学习要素（The Elements of Statistical Learning）的中文翻译、代码实现及其习题解答，附下载

统计学习要素（The Elements of Statistical Learning）的中文翻译、代码实现及其习题解答，附下载

专知

41+阅读 · 2019年11月18日

里昂大学博士学位论文-图像分类中的迁移学习

里昂大学博士学位论文-图像分类中的迁移学习

专知

12+阅读 · 2019年4月10日

迁移自适应学习最新综述，附21页论文下载

迁移自适应学习最新综述，附21页论文下载

专知

34+阅读 · 2019年3月13日

当前最好的非深度迁移学习方法：流形空间下的分布对齐

当前最好的非深度迁移学习方法：流形空间下的分布对齐

PaperWeekly

11+阅读 · 2018年7月31日

【深度学习】深度学习的几何观点：流形分布定律、学习能力的上限、概率变换的几何观点

【深度学习】深度学习的几何观点：流形分布定律、学习能力的上限、概率变换的几何观点

产业智能官

10+阅读 · 2018年6月23日

基于Keras进行迁移学习

基于Keras进行迁移学习

论智

12+阅读 · 2018年5月6日

【迁移学习】迁移学习的干货学习资料 | 干货分享 | 技术解读

【迁移学习】迁移学习的干货学习资料 | 干货分享 | 技术解读

产业智能官

15+阅读 · 2018年1月2日

迁移学习在深度学习中的应用

迁移学习在深度学习中的应用

专知

24+阅读 · 2017年12月24日

什么是迁移学习？它都用在深度学习的哪些场景上？这篇文章替你讲清楚了

什么是迁移学习？它都用在深度学习的哪些场景上？这篇文章替你讲清楚了

AI100

16+阅读 · 2017年12月23日

相关论文

Positive Distribution Shift as a Framework for Understanding Tractable Learning

Arxiv

0+阅读 · 2月12日

Learning Tractable Distributions Of Language Model Continuations

Arxiv

0+阅读 · 2月10日

Resilient Class-Incremental Learning: on the Interplay of Drifting, Unlabelled and Imbalanced Data Streams

Arxiv

0+阅读 · 2月10日

Positive Distribution Shift as a Framework for Understanding Tractable Learning

Arxiv

0+阅读 · 2月9日

Federated Learning with Profile Mapping under Distribution Shifts and Drifts

Arxiv

0+阅读 · 2月7日

Transfer Learning Through Conditional Quantile Matching

Arxiv

0+阅读 · 2月2日

Evolving Machine Learning in Non-Stationary Environments: A Unified Survey of Drift, Forgetting, and Adaptation

Arxiv

0+阅读 · 1月25日

Composite Flow Matching for Reinforcement Learning with Shifted-Dynamics Data

Arxiv

0+阅读 · 1月21日

PAC Learnability in the Presence of Performativity

Arxiv

0+阅读 · 1月19日

Transfer Learning for Benign Overfitting in High-Dimensional Linear Regression

Arxiv

0+阅读 · 1月16日

相关基金

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

基于迁移学习的图像隐写分析新方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

基于强化学习的分布参数系统数据驱动控制

国家自然科学基金

7+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

相依回归模型与扩散过程的统计推断及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

关于面板(纵向）数据的动态统计分析

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员