A pair of probability distributions over $\{0,1\}^n$ is said to be $(k,δ)$-wise indistinguishable if all of the size $k$ marginals are within statistical distance at most $δ$. Previous works introduced this concept and study when and how well one can distinguish between such a pair of symmetric distributions by observing $t$ bits. We use a simple hypergeometric smoothing approach and Hahn polynomials to obtain new upper bounds that apply across a wider range of parameters and improve previously available bounds in several regimes. In particular, prior works left open the basic question of whether there exist constants $0<c_1<c_2<1$ and a pair of $(c_1n,0)$-wise indistinguishable distributions such that the $c_2n$-wise marginals have statistical distance $Ω(1)$. One application of our new bounds is to rule this out for all $c_1,c_2$ and to show that the $c_2n$-wise marginals must in fact be exponentially close. Another application in this setting is to show that the $c_2n$-wise marginals must be super-polynomially close even if the $c_1n$-wise marginals are allowed to have statistical distance $δ$ for any $δ\leq\exp\left({-ω(\sqrt{n\log{n}})}\right)$. Our bounds also yield new results in other regimes, for example when $k$ is sublinear or when $t/n$ tends to 1.


翻译:一对定义在$\{0,1\}^n$上的概率分布被称为$(k,δ)$-wise不可区分的,如果所有大小为$k$的边缘分布之间的统计距离至多为$δ$。先前的工作引入了这一概念,并研究了在何种条件下以及如何通过观测$t$个比特来区分这样一对对称分布。我们采用一种简单的超几何平滑方法和哈恩多项式,得到了新的上界,这些上界适用于更广泛的参数范围,并在若干情形下改进了先前已有的界。特别地,先前的工作留下了一个基本未解问题:是否存在常数$0<c_1<c_2<1$以及一对$(c_1n,0)$-wise不可区分的分布,使得其$c_2n$-wise边缘分布的统计距离为$Ω(1)$。我们新上界的一个应用是排除了所有$c_1,c_2$下这一可能性,并证明$c_2n$-wise边缘分布实际上必须指数接近。另一个在该设定中的应用是,即使允许$c_1n$-wise边缘分布对于任意$δ\leq\exp\left({-ω(\sqrt{n\log{n}})}\right)$具有统计距离$δ$,$c_2n$-wise边缘分布也必须是超多项式接近的。我们的界还在其他情形下产生了新结果,例如当$k$为次线性或$t/n$趋近于1时。

0
下载
关闭预览

相关内容

WISE会议建立了一个致力于高质量研究的社区,并为推进与Web信息系统相关的主题提供了基础。 官网地址:http://dblp.uni-trier.de/db/conf/wise/
【牛津大学博士论文】机器学习中的对称性与泛化
专知会员服务
22+阅读 · 2025年1月8日
跨多个异构数据源的实体对齐
FCS
15+阅读 · 2019年3月13日
超像素、语义分割、实例分割、全景分割 傻傻分不清?
计算机视觉life
19+阅读 · 2018年11月27日
异常检测的阈值,你怎么选?给你整理好了...
机器学习算法与Python学习
10+阅读 · 2018年9月19日
概率论之概念解析:边缘化(Marginalisation)
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
0+阅读 · 5月13日
Arxiv
0+阅读 · 4月14日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
6+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
4+阅读 · 6月17日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员