不完全U-统计量的等重复设计：Berry-Esseen界与高效构造 (Incomplete U-Statistics of Equireplicate Designs: Berry-Esseen Bound and Efficient Construction) - 专知论文

会员服务 ·

0

统计量 · 设计 · 退化 · 均值 · 样本 ·

Incomplete U-Statistics of Equireplicate Designs: Berry-Esseen Bound and Efficient Construction

翻译：不完全U-统计量的等重复设计：Berry-Esseen界与高效构造

Cesare Miglioli,Jordan Awan

U-statistics are a fundamental class of estimators that generalize the sample mean and underpin much of nonparametric statistics. Although extensively studied in both statistics and probability, key challenges remain: their high computational cost - addressed partly through incomplete U-statistics - and their non-standard asymptotic behavior in the degenerate case, which typically requires resampling methods for hypothesis testing. This paper presents a novel perspective on U-statistics, grounded in hypergraph theory and combinatorial designs. Our approach bypasses the traditional Hoeffding decomposition, the main analytical tool in this literature but one that is highly sensitive to degeneracy. By characterizing the dependence structure of a U-statistic, we derive a Berry-Esseen bound valid for incomplete U-statistics of deterministic designs, yielding conditions under which Gaussian limiting distributions can be established even in degenerate cases and when the order diverges. We also introduce efficient algorithms to construct incomplete U-statistics based on equireplicate designs, a subclass of deterministic designs that, in certain cases, achieve minimum variance. Beyond its theoretical contributions, our framework provides a systematic way to construct permutation-free counterparts to tests based on degenerate U-statistics, as demonstrated in experiments with kernel-based tests using the Maximum Mean Discrepancy and the Hilbert-Schmidt Independence Criterion.

翻译：U-统计量是一类基础估计量，它推广了样本均值并构成了非参数统计的重要基础。尽管在统计学和概率论领域已得到广泛研究，仍存在关键挑战：其高昂的计算成本——部分通过不完全U-统计量得以缓解——以及在退化情形下的非标准渐近行为，这通常需要借助重抽样方法进行假设检验。本文基于超图理论与组合设计，提出了研究U-统计量的新视角。我们的方法绕过了传统的Hoeffding分解（该领域的主要分析工具，但对退化性高度敏感）。通过刻画U-统计量的依赖结构，我们推导出适用于确定性设计不完全U-统计量的Berry-Esseen界，给出了即使在退化情形及阶数发散时仍能建立高斯极限分布的条件。我们还提出了基于等重复设计（确定性设计的一个子类，在某些情况下能达到最小方差）构造不完全U-统计量的高效算法。除了理论贡献外，我们的框架为基于退化U-统计量的检验提供了系统化的免置换替代方案，这在基于最大均值差异与希尔伯特-施密特独立性准则的核检验实验中得到验证。

0

相关内容

统计量

【CMU博士论文】校准不确定性量化的方法及其效用解析

【CMU博士论文】校准不确定性量化的方法及其效用解析

专知会员服务

22+阅读 · 2025年9月1日

【NeurIPS2024】超越冗余：信息感知的无监督多重图结构学习

【NeurIPS2024】超越冗余：信息感知的无监督多重图结构学习

专知会员服务

28+阅读 · 2024年9月29日

【2023新书】数理统计基础，259页pdf

【2023新书】数理统计基础，259页pdf

专知会员服务

88+阅读 · 2023年4月12日

【剑桥大学博士论文】模型不确定性下的统计假设检验，198页pdf

【剑桥大学博士论文】模型不确定性下的统计假设检验，198页pdf

专知会员服务

26+阅读 · 2023年2月7日

【干货书】工程和科学中的概率和统计，

【干货书】工程和科学中的概率和统计，

专知会员服务

58+阅读 · 2022年12月24日

2022最新综述《贝叶斯视角下深度学习分类系统中的不确定性估计综述》巴塞罗那大学

2022最新综述《贝叶斯视角下深度学习分类系统中的不确定性估计综述》巴塞罗那大学

专知会员服务

58+阅读 · 2022年7月26日

【经典书】数理统计学，142页pdf

【经典书】数理统计学，142页pdf

专知会员服务

99+阅读 · 2021年3月25日

【Nature】贝叶斯统计与建模综述，26页pdf

【Nature】贝叶斯统计与建模综述，26页pdf

专知会员服务

77+阅读 · 2021年1月21日

首篇《深度学习不确定性量化: 技术、应用与挑战》2020综述论文，61页pdf582篇文献

专知会员服务

106+阅读 · 2020年11月16日

【UIUC硬核书】统计学习理论，Statistical Learning Theory，213页pdf

【UIUC硬核书】统计学习理论，Statistical Learning Theory，213页pdf

专知会员服务

134+阅读 · 2020年4月14日

【2023新书】数理统计基础，259页pdf

【2023新书】数理统计基础，259页pdf

专知

61+阅读 · 2023年4月13日

【干货书】概率论:概率论与统计的导论，411页pdf

【干货书】概率论:概率论与统计的导论，411页pdf

专知

13+阅读 · 2022年10月6日

【2022新书】用回归来解决比较、估计、预测和因果推断的实际问题，546页pdf

【2022新书】用回归来解决比较、估计、预测和因果推断的实际问题，546页pdf

专知

26+阅读 · 2022年2月2日

【干货书】统计基础、推理与推断，361页pdf

【干货书】统计基础、推理与推断，361页pdf

专知

11+阅读 · 2022年1月25日

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知

21+阅读 · 2020年5月30日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

【机器学习】深入剖析机器学习中的统计思想

【机器学习】深入剖析机器学习中的统计思想

产业智能官

17+阅读 · 2019年1月24日

统计学常用数据类型

统计学常用数据类型

论智

19+阅读 · 2018年7月6日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

从概率论到多分类问题：综述贝叶斯统计分类

从概率论到多分类问题：综述贝叶斯统计分类

机器之心

14+阅读 · 2017年9月28日

不可忽略缺失机制下的广义矩方法和调整经验似然方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

不完备/冗余数据下复杂产品关联建模设计方法及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

一般最小低阶混杂设计中混杂结构的研究与应用

国家自然科学基金

0+阅读 · 2014年12月31日

强非线性偏微分方程基于梯度重构的新型算法

国家自然科学基金

0+阅读 · 2014年12月31日

非线性混合效应模型的最优与稳健设计

国家自然科学基金

0+阅读 · 2014年12月31日

概率抽样设计及其统计推断方法

国家自然科学基金

6+阅读 · 2014年12月31日

复杂数据下含指标项半参数模型结构的统计推断及应用

国家自然科学基金

0+阅读 · 2014年12月31日

基于似然函数的统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

Strong Gaussian approximation for U-statistics in high dimensions and beyond

Arxiv

0+阅读 · 3月11日

Accurate, private, secure, federated U-statistics with higher degree

Arxiv

0+阅读 · 3月2日

Beyond Maximum Likelihood: Variational Inequality Estimation for Generalized Linear Models

Arxiv

0+阅读 · 3月1日

Robust Power and Sample Size Calculations in Quasi-likelihood Models: Methods and Practice

Arxiv

0+阅读 · 2月28日

A Unified and Computationally Efficient Non-Gaussian Statistical Modeling Framework

Arxiv

0+阅读 · 2月27日

First versus full or first versus last: U-statistic change-point tests under fixed and local alternatives

Arxiv

0+阅读 · 2月18日

Calibrated and uncertain? Evaluating uncertainty estimates in binary classification models

Arxiv

0+阅读 · 2月17日

Bias analysis of a linear order-statistic inequality index estimator: Unbiasedness under gamma populations

Arxiv

0+阅读 · 2月16日

Unified Unbiased Variance Estimation for Maximum Mean Discrepancy: Robust Finite-Sample Performance with Imbalanced Data and Exact Acceleration under Null and Alternative Hypotheses

Arxiv

0+阅读 · 2月4日

Blinded sample size re-estimation accounting for uncertainty in mid-trial estimation

Arxiv

0+阅读 · 2月3日

VIP会员

文章信息

相关主题

最新内容

《利用大语言模型增强多域作战兵棋推演》（报告）

《利用大语言模型增强多域作战兵棋推演》（报告）

专知会员服务

2+阅读 · 今天15:00

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

专知会员服务

1+阅读 · 今天14:55

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

专知会员服务

1+阅读 · 今天13:45

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

专知会员服务

2+阅读 · 今天13:33

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

专知会员服务

2+阅读 · 今天13:25

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

专知会员服务

2+阅读 · 今天13:18

人工智能在战场行动中的演进及伊朗案例

人工智能在战场行动中的演进及伊朗案例

专知会员服务

2+阅读 · 今天13:08

美AI公司Anthropic推出网络安全模型“Mythos”

美AI公司Anthropic推出网络安全模型“Mythos”

专知会员服务

2+阅读 · 今天12:58

【博士论文】面向城市环境的可解释计算机视觉

【博士论文】面向城市环境的可解释计算机视觉

专知会员服务

0+阅读 · 今天12:57

【CVPR2026】SEATrack：一种简明、高效且具备自适应能力的多模态跟踪器

【CVPR2026】SEATrack：一种简明、高效且具备自适应能力的多模态跟踪器

专知会员服务

0+阅读 · 今天12:53

大语言模型的自改进机制：技术综述与未来展望

大语言模型的自改进机制：技术综述与未来展望

专知会员服务

0+阅读 · 今天12:50

《面向战术决策的广义智能：大语言模型驱动的动态武器-目标分配》

《面向战术决策的广义智能：大语言模型驱动的动态武器-目标分配》

专知会员服务

8+阅读 · 今天6:31

《分布式军事人工智能理论：部分可观测与通信条件下的协调约束多智能体强化学习》

《分布式军事人工智能理论：部分可观测与通信条件下的协调约束多智能体强化学习》

专知会员服务

7+阅读 · 今天6:28

《第四代军事特种作战部队选拔与评估》

《第四代军事特种作战部队选拔与评估》

专知会员服务

1+阅读 · 今天6:23

《迈向可解释强化学习及面向战略决策的定制化学习基准》（70页）

《迈向可解释强化学习及面向战略决策的定制化学习基准》（70页）

专知会员服务

4+阅读 · 今天6:19

相关VIP内容

【CMU博士论文】校准不确定性量化的方法及其效用解析

【CMU博士论文】校准不确定性量化的方法及其效用解析

专知会员服务

22+阅读 · 2025年9月1日

【NeurIPS2024】超越冗余：信息感知的无监督多重图结构学习

【NeurIPS2024】超越冗余：信息感知的无监督多重图结构学习

专知会员服务

28+阅读 · 2024年9月29日

【2023新书】数理统计基础，259页pdf

【2023新书】数理统计基础，259页pdf

专知会员服务

88+阅读 · 2023年4月12日

【剑桥大学博士论文】模型不确定性下的统计假设检验，198页pdf

【剑桥大学博士论文】模型不确定性下的统计假设检验，198页pdf

专知会员服务

26+阅读 · 2023年2月7日

【干货书】工程和科学中的概率和统计，

【干货书】工程和科学中的概率和统计，

专知会员服务

58+阅读 · 2022年12月24日

2022最新综述《贝叶斯视角下深度学习分类系统中的不确定性估计综述》巴塞罗那大学

2022最新综述《贝叶斯视角下深度学习分类系统中的不确定性估计综述》巴塞罗那大学

专知会员服务

58+阅读 · 2022年7月26日

【经典书】数理统计学，142页pdf

【经典书】数理统计学，142页pdf

专知会员服务

99+阅读 · 2021年3月25日

【Nature】贝叶斯统计与建模综述，26页pdf

【Nature】贝叶斯统计与建模综述，26页pdf

专知会员服务

77+阅读 · 2021年1月21日

首篇《深度学习不确定性量化: 技术、应用与挑战》2020综述论文，61页pdf582篇文献

专知会员服务

106+阅读 · 2020年11月16日

【UIUC硬核书】统计学习理论，Statistical Learning Theory，213页pdf

【UIUC硬核书】统计学习理论，Statistical Learning Theory，213页pdf

专知会员服务

134+阅读 · 2020年4月14日

热门VIP内容

开通专知VIP会员享更多权益服务

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

《利用大语言模型增强多域作战兵棋推演》（报告）

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

相关资讯

【2023新书】数理统计基础，259页pdf

【2023新书】数理统计基础，259页pdf

专知

61+阅读 · 2023年4月13日

【干货书】概率论:概率论与统计的导论，411页pdf

【干货书】概率论:概率论与统计的导论，411页pdf

专知

13+阅读 · 2022年10月6日

【2022新书】用回归来解决比较、估计、预测和因果推断的实际问题，546页pdf

【2022新书】用回归来解决比较、估计、预测和因果推断的实际问题，546页pdf

专知

26+阅读 · 2022年2月2日

【干货书】统计基础、推理与推断，361页pdf

【干货书】统计基础、推理与推断，361页pdf

专知

11+阅读 · 2022年1月25日

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知

21+阅读 · 2020年5月30日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

【机器学习】深入剖析机器学习中的统计思想

【机器学习】深入剖析机器学习中的统计思想

产业智能官

17+阅读 · 2019年1月24日

统计学常用数据类型

统计学常用数据类型

论智

19+阅读 · 2018年7月6日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

从概率论到多分类问题：综述贝叶斯统计分类

从概率论到多分类问题：综述贝叶斯统计分类

机器之心

14+阅读 · 2017年9月28日

相关论文

Strong Gaussian approximation for U-statistics in high dimensions and beyond

Arxiv

0+阅读 · 3月11日

Accurate, private, secure, federated U-statistics with higher degree

Arxiv

0+阅读 · 3月2日

Beyond Maximum Likelihood: Variational Inequality Estimation for Generalized Linear Models

Arxiv

0+阅读 · 3月1日

Robust Power and Sample Size Calculations in Quasi-likelihood Models: Methods and Practice

Arxiv

0+阅读 · 2月28日

A Unified and Computationally Efficient Non-Gaussian Statistical Modeling Framework

Arxiv

0+阅读 · 2月27日

First versus full or first versus last: U-statistic change-point tests under fixed and local alternatives

Arxiv

0+阅读 · 2月18日

Calibrated and uncertain? Evaluating uncertainty estimates in binary classification models

Arxiv

0+阅读 · 2月17日

Bias analysis of a linear order-statistic inequality index estimator: Unbiasedness under gamma populations

Arxiv

0+阅读 · 2月16日

Unified Unbiased Variance Estimation for Maximum Mean Discrepancy: Robust Finite-Sample Performance with Imbalanced Data and Exact Acceleration under Null and Alternative Hypotheses

Arxiv

0+阅读 · 2月4日

Blinded sample size re-estimation accounting for uncertainty in mid-trial estimation

Arxiv

0+阅读 · 2月3日

相关基金

不可忽略缺失机制下的广义矩方法和调整经验似然方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

不完备/冗余数据下复杂产品关联建模设计方法及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

一般最小低阶混杂设计中混杂结构的研究与应用

国家自然科学基金

0+阅读 · 2014年12月31日

强非线性偏微分方程基于梯度重构的新型算法

国家自然科学基金

0+阅读 · 2014年12月31日

非线性混合效应模型的最优与稳健设计

国家自然科学基金

0+阅读 · 2014年12月31日

概率抽样设计及其统计推断方法

国家自然科学基金

6+阅读 · 2014年12月31日

复杂数据下含指标项半参数模型结构的统计推断及应用

国家自然科学基金

0+阅读 · 2014年12月31日

基于似然函数的统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员