Estimating the True Distribution of Data Collected with Randomized Response - 专知论文

会员服务 ·

0

算法 · 分析 · 服务器 · 直方图 · 贝叶斯 ·

Estimating the True Distribution of Data Collected with Randomized Response

翻译：估计随机响应收集数据的真实分布

Carlos Antonio Pinzón,Ehab ElSalamouny,Lucas Massot,Alexis Miller,Héber Hwang Arcolezi,Catuscia Palamidessi

Randomized Response (RR) is a protocol designed to collect and analyze categorical data with local differential privacy guarantees. It has been used as a building block of mechanisms deployed by Big tech companies to collect app or web users' data. Each user reports an automatic random alteration of their true value to the analytics server, which then estimates the histogram of the true unseen values of all users using a debiasing rule to compensate for the added randomness. A known issue is that the standard debiasing rule can yield a vector with negative values (which can not be interpreted as a histogram), and there is no consensus on the best fix. An elegant but slow solution is the Iterative Bayesian Update algorithm (IBU), which converges to the Maximum Likelihood Estimate (MLE) as the number of iterations goes to infinity. This paper bypasses IBU by providing a simple formula for the exact MLE of RR and compares it with other estimation methods experimentally to help practitioners decide which one to use.

翻译：随机响应是一种旨在收集和分析具有本地差分隐私保证的分类数据的协议。它已被用作大型科技公司部署的机制的基础构件，用于收集应用程序或网络用户的数据。每个用户向分析服务器报告其真实值的自动随机扰动，然后服务器使用去偏规则来补偿添加的随机性，从而估计所有用户真实未观测值的直方图。一个已知的问题是标准去偏规则可能产生具有负值的向量（这不能解释为直方图），并且对于最佳修复方法尚无共识。一种优雅但缓慢的解决方案是迭代贝叶斯更新算法，该算法随着迭代次数趋于无穷而收敛到最大似然估计。本文通过为随机响应的精确最大似然估计提供一个简单公式来绕过迭代贝叶斯更新算法，并通过实验将其与其他估计方法进行比较，以帮助从业者决定使用哪种方法。

0

相关内容

在数学和计算机科学之中，算法（Algorithm）为一个计算的具体步骤，常用于计算、数据处理和自动推理。精确而言，算法是一个表示为有限长列表的有效方法。算法应包含清晰定义的指令用于计算函数。来自维基百科：算法

基于因果推断的推荐系统去偏研究

基于因果推断的推荐系统去偏研究

专知会员服务

21+阅读 · 2024年11月10日

【博士论文】随机逼近在黎曼流形和度量空间上的应用，257页pdf

【博士论文】随机逼近在黎曼流形和度量空间上的应用，257页pdf

专知会员服务

35+阅读 · 2024年10月15日

【牛津大学博士论文】学习分布不确定性估计的语义分割，191页pdf

【牛津大学博士论文】学习分布不确定性估计的语义分割，191页pdf

专知会员服务

30+阅读 · 2024年7月31日

《边缘计算通信安全威胁及计算任务分类》

《边缘计算通信安全威胁及计算任务分类》

专知会员服务

36+阅读 · 2023年11月13日

【牛津大学博士论文】随机分析和代数在机器学习中的应用，235页pdf

【牛津大学博士论文】随机分析和代数在机器学习中的应用，235页pdf

专知会员服务

25+阅读 · 2023年8月23日

【2023新书】随机模型基础，815页pdf

【2023新书】随机模型基础，815页pdf

专知会员服务

105+阅读 · 2023年5月10日

【动态目标跟踪】《分布式数据融合网络的仿真框架》2023最新论文（含讲解PPT），北约科技组织“分布式多光谱和多静态传感”会议

【动态目标跟踪】《分布式数据融合网络的仿真框架》2023最新论文（含讲解PPT），北约科技组织“分布式多光谱和多静态传感”会议

专知会员服务

69+阅读 · 2023年2月6日

Nature计算科学综述：经由准实验从观察数据中推测因果关系

Nature计算科学综述：经由准实验从观察数据中推测因果关系

专知会员服务

36+阅读 · 2021年3月25日

随机特征核近似综述: 算法与理论，Random Features for Kernel Approximation: A Survey in Algorithms, Theory, and Beyond

随机特征核近似综述: 算法与理论，Random Features for Kernel Approximation: A Survey in Algorithms, Theory, and Beyond

专知会员服务

33+阅读 · 2020年4月26日

《应用随机微分方程》(Applied Stochastic Differential Equations)324页pdf新书分享

《应用随机微分方程》(Applied Stochastic Differential Equations)324页pdf新书分享

专知会员服务

44+阅读 · 2019年10月28日

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

机器学习领域必知必会的12种概率分布（附Python代码实现）

机器学习领域必知必会的12种概率分布（附Python代码实现）

算法与数学之美

21+阅读 · 2019年10月18日

一行TensorFlow/Keras代码解决真实场景中数据不平衡(imbalanced)问题

一行TensorFlow/Keras代码解决真实场景中数据不平衡(imbalanced)问题

专知

78+阅读 · 2019年5月31日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

从信息论的角度来理解损失函数

从信息论的角度来理解损失函数

深度学习每日摘要

17+阅读 · 2019年4月7日

【机器学习】深入剖析机器学习中的统计思想

【机器学习】深入剖析机器学习中的统计思想

产业智能官

17+阅读 · 2019年1月24日

数据分析师应该知道的16种回归技术：分位数回归

数据分析师应该知道的16种回归技术：分位数回归

数萃大数据

29+阅读 · 2018年8月8日

边缘计算应用：传感数据异常实时检测算法

边缘计算应用：传感数据异常实时检测算法

计算机研究与发展

11+阅读 · 2018年4月10日

15款免费预测分析软件！收藏好，别丢了！

15款免费预测分析软件！收藏好，别丢了！

七月在线实验室

11+阅读 · 2018年2月27日

基于超连续谱随机起伏并行产生高速、实时物理随机数研究

国家自然科学基金

0+阅读 · 2015年12月31日

分数阶随机共振行为机制及其自适应控制与强色噪声背景中的微弱信号检测

国家自然科学基金

0+阅读 · 2015年12月31日

随机接入中的分布式功率控制和数据包编码传输

国家自然科学基金

0+阅读 · 2015年12月31日

半参数回归模型中随机误差分布的检验问题

国家自然科学基金

2+阅读 · 2015年12月31日

随机文法作为通用统计模型的扩展

国家自然科学基金

1+阅读 · 2015年12月31日

随机波动率模型的统计推断及数值解

国家自然科学基金

1+阅读 · 2015年12月31日

基因表达随机调控的数学模型及动态分析

国家自然科学基金

0+阅读 · 2015年12月31日

稳健随机均值模型在时空数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

排序集抽样下随机删失数据的非参数估计

国家自然科学基金

1+阅读 · 2014年12月31日

随机方法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

Quantifying and Attributing Submodel Uncertainty in Stochastic Simulation Models and Digital Twins

Arxiv

0+阅读 · 2月18日

Random Forests as Statistical Procedures: Design, Variance, and Dependence

Arxiv

0+阅读 · 2月17日

Random Forests as Statistical Procedures: Design, Variance, and Dependence

Arxiv

0+阅读 · 2月13日

Truthful Fair Division under Stochastic Valuations

Arxiv

0+阅读 · 2月12日

Statistical Equilibrium of Optimistic Beliefs

Arxiv

0+阅读 · 2月10日

One RNG to Rule Them All: How Randomness Becomes an Attack Vector in Machine Learning

Arxiv

0+阅读 · 2月9日

On Randomized Algorithms in Online Strategic Classification

Arxiv

0+阅读 · 2月5日

Fiducial Inference for Random-Effects Calibration Models: Advancing Reliable Quantification in Environmental Analytical Chemistry

Arxiv

0+阅读 · 1月25日

Clustered random forests with correlated data for optimal estimation and inference under potential covariate shift

Arxiv

0+阅读 · 1月23日

Rerandomization for quantile treatment effects

Arxiv

0+阅读 · 1月18日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

2+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

4+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

5+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

6+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

10+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

10+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

7+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

13+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

8+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

8+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

10+阅读 · 6月17日

相关VIP内容

基于因果推断的推荐系统去偏研究

基于因果推断的推荐系统去偏研究

专知会员服务

21+阅读 · 2024年11月10日

【博士论文】随机逼近在黎曼流形和度量空间上的应用，257页pdf

【博士论文】随机逼近在黎曼流形和度量空间上的应用，257页pdf

专知会员服务

35+阅读 · 2024年10月15日

【牛津大学博士论文】学习分布不确定性估计的语义分割，191页pdf

【牛津大学博士论文】学习分布不确定性估计的语义分割，191页pdf

专知会员服务

30+阅读 · 2024年7月31日

《边缘计算通信安全威胁及计算任务分类》

《边缘计算通信安全威胁及计算任务分类》

专知会员服务

36+阅读 · 2023年11月13日

【牛津大学博士论文】随机分析和代数在机器学习中的应用，235页pdf

【牛津大学博士论文】随机分析和代数在机器学习中的应用，235页pdf

专知会员服务

25+阅读 · 2023年8月23日

【2023新书】随机模型基础，815页pdf

【2023新书】随机模型基础，815页pdf

专知会员服务

105+阅读 · 2023年5月10日

【动态目标跟踪】《分布式数据融合网络的仿真框架》2023最新论文（含讲解PPT），北约科技组织“分布式多光谱和多静态传感”会议

【动态目标跟踪】《分布式数据融合网络的仿真框架》2023最新论文（含讲解PPT），北约科技组织“分布式多光谱和多静态传感”会议

专知会员服务

69+阅读 · 2023年2月6日

Nature计算科学综述：经由准实验从观察数据中推测因果关系

Nature计算科学综述：经由准实验从观察数据中推测因果关系

专知会员服务

36+阅读 · 2021年3月25日

随机特征核近似综述: 算法与理论，Random Features for Kernel Approximation: A Survey in Algorithms, Theory, and Beyond

随机特征核近似综述: 算法与理论，Random Features for Kernel Approximation: A Survey in Algorithms, Theory, and Beyond

专知会员服务

33+阅读 · 2020年4月26日

《应用随机微分方程》(Applied Stochastic Differential Equations)324页pdf新书分享

《应用随机微分方程》(Applied Stochastic Differential Equations)324页pdf新书分享

专知会员服务

44+阅读 · 2019年10月28日

热门VIP内容

开通专知VIP会员享更多权益服务

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

相关资讯

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

机器学习领域必知必会的12种概率分布（附Python代码实现）

机器学习领域必知必会的12种概率分布（附Python代码实现）

算法与数学之美

21+阅读 · 2019年10月18日

一行TensorFlow/Keras代码解决真实场景中数据不平衡(imbalanced)问题

一行TensorFlow/Keras代码解决真实场景中数据不平衡(imbalanced)问题

专知

78+阅读 · 2019年5月31日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

从信息论的角度来理解损失函数

从信息论的角度来理解损失函数

深度学习每日摘要

17+阅读 · 2019年4月7日

【机器学习】深入剖析机器学习中的统计思想

【机器学习】深入剖析机器学习中的统计思想

产业智能官

17+阅读 · 2019年1月24日

数据分析师应该知道的16种回归技术：分位数回归

数据分析师应该知道的16种回归技术：分位数回归

数萃大数据

29+阅读 · 2018年8月8日

边缘计算应用：传感数据异常实时检测算法

边缘计算应用：传感数据异常实时检测算法

计算机研究与发展

11+阅读 · 2018年4月10日

15款免费预测分析软件！收藏好，别丢了！

15款免费预测分析软件！收藏好，别丢了！

七月在线实验室

11+阅读 · 2018年2月27日

相关论文

Quantifying and Attributing Submodel Uncertainty in Stochastic Simulation Models and Digital Twins

Arxiv

0+阅读 · 2月18日

Random Forests as Statistical Procedures: Design, Variance, and Dependence

Arxiv

0+阅读 · 2月17日

Random Forests as Statistical Procedures: Design, Variance, and Dependence

Arxiv

0+阅读 · 2月13日

Truthful Fair Division under Stochastic Valuations

Arxiv

0+阅读 · 2月12日

Statistical Equilibrium of Optimistic Beliefs

Arxiv

0+阅读 · 2月10日

One RNG to Rule Them All: How Randomness Becomes an Attack Vector in Machine Learning

Arxiv

0+阅读 · 2月9日

On Randomized Algorithms in Online Strategic Classification

Arxiv

0+阅读 · 2月5日

Fiducial Inference for Random-Effects Calibration Models: Advancing Reliable Quantification in Environmental Analytical Chemistry

Arxiv

0+阅读 · 1月25日

Clustered random forests with correlated data for optimal estimation and inference under potential covariate shift

Arxiv

0+阅读 · 1月23日

Rerandomization for quantile treatment effects

Arxiv

0+阅读 · 1月18日

相关基金

基于超连续谱随机起伏并行产生高速、实时物理随机数研究

国家自然科学基金

0+阅读 · 2015年12月31日

分数阶随机共振行为机制及其自适应控制与强色噪声背景中的微弱信号检测

国家自然科学基金

0+阅读 · 2015年12月31日

随机接入中的分布式功率控制和数据包编码传输

国家自然科学基金

0+阅读 · 2015年12月31日

半参数回归模型中随机误差分布的检验问题

国家自然科学基金

2+阅读 · 2015年12月31日

随机文法作为通用统计模型的扩展

国家自然科学基金

1+阅读 · 2015年12月31日

随机波动率模型的统计推断及数值解

国家自然科学基金

1+阅读 · 2015年12月31日

基因表达随机调控的数学模型及动态分析

国家自然科学基金

0+阅读 · 2015年12月31日

稳健随机均值模型在时空数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

排序集抽样下随机删失数据的非参数估计

国家自然科学基金

1+阅读 · 2014年12月31日

随机方法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员