First-Order Efficiency for Probabilistic Value Estimation via A Statistical Viewpoint - 专知论文

会员服务 ·

0

概率 · 有效性 · 替代函数 · 均方误差 · EASE ·

First-Order Efficiency for Probabilistic Value Estimation via A Statistical Viewpoint

翻译：基于统计视角的概率价值估计的一阶有效性

Ziqi Liu,Kiljae Lee,Yuan Zhang,Weijing Tang

Probabilistic values, including Shapley values and semivalues, provide a model-agnostic framework to attribute the behavior of a black-box model to data points or features, with a wide range of applications including explainable artificial intelligence and data valuation. However, their exact computation requires utility evaluations over exponentially many coalitions, making Monte Carlo approximation essential in modern machine learning applications. Existing estimators are often developed through different identification strategies, including weighted averages, self-normalized weighting, regression adjustment, and weighted least squares. Our key observation is that these seemingly distinct constructions share a common first-order error structure, in which the leading term is an augmented inverse-probability weighted influence term determined by the sampling law and a working surrogate function. This first-order representation yields an explicit expression for the leading mean squared error (MSE), which characterizes how the sampling law and the surrogate jointly determine statistical efficiency. Guided by this criterion, we propose an Efficiency-Aware Surrogate-adjusted Estimator (EASE) that directly chooses the sampling law and surrogate to minimize the first-order MSE. We demonstrate that EASE consistently outperforms state-of-the-art estimators for various probabilistic values.

翻译：概率价值（包括Shapley值和半值）提供了一种模型无关的框架，用于将黑箱模型的行为归因于数据点或特征，在可解释人工智能和数据估值等领域具有广泛应用。然而，其精确计算需要对指数级数量的联盟进行效用评估，这使得蒙特卡洛近似成为现代机器学习应用中的必要条件。现有估计器通常通过不同的识别策略开发，包括加权平均、自归一化加权、回归调整和加权最小二乘。我们的关键观察是，这些看似不同的构造共享一个共同的一阶误差结构，其中主导项是由采样律和工作替代函数确定的增广逆概率加权影响项。这一阶表示给出了主导均方误差（MSE）的显式表达式，刻画了采样律和替代函数如何共同决定统计有效性。在此准则指导下，我们提出了一种有效性感知的替代调整估计器（EASE），直接选择采样律和替代函数以最小化一阶均方误差。我们证明，EASE在各种概率价值的估计中始终优于最先进的估计器。

0

相关内容

本话题关于日常用语「概率」，用于讨论生活中的运气、机会，及赌博、彩票、游戏中的「技巧」。关于抽象数学概念「概率」的讨论，请转概率（数学）话题。

【斯坦福博士论文】概率机器学习中的不确定性原理

【斯坦福博士论文】概率机器学习中的不确定性原理

专知会员服务

27+阅读 · 2025年8月4日

【CMU博士论文】优化的新视角：应对数据中毒、解决欧几里得优化问题，以及学习最小最大最优估计器。

【CMU博士论文】优化的新视角：应对数据中毒、解决欧几里得优化问题，以及学习最小最大最优估计器。

专知会员服务

20+阅读 · 2024年12月5日

【ETHZ博士论文】《结构化数据的概率模型与近似推断方法》

【ETHZ博士论文】《结构化数据的概率模型与近似推断方法》

专知会员服务

29+阅读 · 2024年11月23日

【普林斯顿博士论文】可扩展和可解释的学习：用于知识发现的概率模型， 140页pdf

【普林斯顿博士论文】可扩展和可解释的学习：用于知识发现的概率模型， 140页pdf

专知会员服务

58+阅读 · 2023年10月10日

【ETH博士论文】机器学习数据估值算法与应用研究进展，225页pdf

【ETH博士论文】机器学习数据估值算法与应用研究进展，225页pdf

专知会员服务

38+阅读 · 2023年9月18日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知会员服务

93+阅读 · 2022年7月7日

【干货书】1270页pdf《概率图模型：原理与技术》MIT出版，用于构建和使用复杂系统概率模型的通用框架，使计算机能够使用可用信息做出决策。Probabilistic Graphical Models: Principles and Applications

【干货书】1270页pdf《概率图模型：原理与技术》MIT出版，用于构建和使用复杂系统概率模型的通用框架，使计算机能够使用可用信息做出决策。Probabilistic Graphical Models: Principles and Applications

专知会员服务

47+阅读 · 2022年4月11日

【经典书】概率论基础教程，A First Course in Probability，545页pdf

【经典书】概率论基础教程，A First Course in Probability，545页pdf

专知会员服务

122+阅读 · 2021年3月24日

【哈佛大学干货书】概率导论，589页pdf，Introduction to Probability

【哈佛大学干货书】概率导论，589页pdf，Introduction to Probability

专知会员服务

141+阅读 · 2021年1月24日

知识图谱嵌入模型的概率标定,Probability Calibration for Knowledge Graph Embedding Models

专知会员服务

36+阅读 · 2020年5月11日

【干货书】概率论:概率论与统计的导论，411页pdf

【干货书】概率论:概率论与统计的导论，411页pdf

专知

13+阅读 · 2022年10月6日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

33+阅读 · 2022年7月7日

【经典书】概率论基础教程，A First Course in Probability，545页pdf

【经典书】概率论基础教程，A First Course in Probability，545页pdf

专知

21+阅读 · 2021年3月24日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

【资源】经典著作《机器学习：概率视角》第二版，1098页pdf下载（附Python代码）

【资源】经典著作《机器学习：概率视角》第二版，1098页pdf下载（附Python代码）

新智元

83+阅读 · 2019年10月28日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

这是一本好玩的可视化统计概率入门书，66页pdf下载

这是一本好玩的可视化统计概率入门书，66页pdf下载

专知

40+阅读 · 2018年12月30日

118页概率思维教程——基础、技巧与算法

118页概率思维教程——基础、技巧与算法

专知

13+阅读 · 2018年9月5日

概率论之概念解析：用贝叶斯推断进行参数估计

概率论之概念解析：用贝叶斯推断进行参数估计

专知

14+阅读 · 2018年1月8日

一文读懂机器学习概率图模型（附示例&学习资源）

一文读懂机器学习概率图模型（附示例&学习资源）

数据派THU

47+阅读 · 2017年12月10日

两类分数阶微分方程有效数值计算方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

处理效应差异中位数的有效估计

国家自然科学基金

0+阅读 · 2015年12月31日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

随机波动率模型下金融衍生产品定价中的条件蒙特卡罗加速方法

国家自然科学基金

1+阅读 · 2015年12月31日

随机Kolmogorov型系统及其数值解的渐近性质分析

国家自然科学基金

0+阅读 · 2015年12月31日

复杂数据下带有形状约束的半参数模型统计推断

国家自然科学基金

3+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

概率抽样设计及其统计推断方法

国家自然科学基金

6+阅读 · 2014年12月31日

因果推断的统计方法

国家自然科学基金

26+阅读 · 2011年12月31日

RefineStat: Efficient Exploration for Probabilistic Program Synthesis

Arxiv

0+阅读 · 4月19日

A comparative analysis of machine learning models in SHAP analysis

Arxiv

0+阅读 · 4月8日

Active Statistical Inference

Arxiv

0+阅读 · 4月7日

Confidence Intervals for Rate Estimation with Importance Sampling in Autonomous Vehicle Evaluation

Arxiv

0+阅读 · 4月4日

A Unified Memory Perspective for Probabilistic Trustworthy AI

Arxiv

0+阅读 · 3月26日

Efficient Equilibrium Computation in Symmetric First-Price Auctions

Arxiv

0+阅读 · 3月25日

Objective Model Prior Probabilities in Variable Selection

Arxiv

0+阅读 · 3月20日

From Inference Efficiency to Embodied Efficiency: Revisiting Efficiency Metrics for Vision-Language-Action Models

Arxiv

0+阅读 · 3月19日

Refined Inference for Asymptotically Linear Estimators with Non-Negligible Second-Order Remainders

Arxiv

0+阅读 · 3月18日

Robust estimation of heterogeneous treatment effects in randomized trials leveraging external data

Arxiv

0+阅读 · 3月18日

VIP会员

文章信息

相关主题

最新内容

五角大楼启动“智能体网络”以推进人工智能赋能的战斗管理与目标打击

五角大楼启动“智能体网络”以推进人工智能赋能的战斗管理与目标打击

专知会员服务

10+阅读 · 6月27日

2025年全球二十起重大无人机作战事件

2025年全球二十起重大无人机作战事件

专知会员服务

4+阅读 · 6月27日

现代战争的隐蔽系统：伊朗战争十大启示

现代战争的隐蔽系统：伊朗战争十大启示

专知会员服务

5+阅读 · 6月27日

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

专知会员服务

5+阅读 · 6月26日

GNN跨域综述：从消息传递到图基础模型

GNN跨域综述：从消息传递到图基础模型

专知会员服务

8+阅读 · 6月26日

无人机自主控制与人工智能：系统性综述

无人机自主控制与人工智能：系统性综述

专知会员服务

15+阅读 · 6月26日

巡飞弹与反无人机系统——现代战场的两大支柱

巡飞弹与反无人机系统——现代战场的两大支柱

专知会员服务

5+阅读 · 6月26日

《打造“黄金舰队”》57页报告

《打造“黄金舰队”》57页报告

专知会员服务

4+阅读 · 6月26日

《北约数字教官网络发展路径》128页报告

《北约数字教官网络发展路径》128页报告

专知会员服务

3+阅读 · 6月26日

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

8+阅读 · 6月25日

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

7+阅读 · 6月25日

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

10+阅读 · 6月25日

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

9+阅读 · 6月25日

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

9+阅读 · 6月25日

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

8+阅读 · 6月25日

相关VIP内容

【斯坦福博士论文】概率机器学习中的不确定性原理

【斯坦福博士论文】概率机器学习中的不确定性原理

专知会员服务

27+阅读 · 2025年8月4日

【CMU博士论文】优化的新视角：应对数据中毒、解决欧几里得优化问题，以及学习最小最大最优估计器。

【CMU博士论文】优化的新视角：应对数据中毒、解决欧几里得优化问题，以及学习最小最大最优估计器。

专知会员服务

20+阅读 · 2024年12月5日

【ETHZ博士论文】《结构化数据的概率模型与近似推断方法》

【ETHZ博士论文】《结构化数据的概率模型与近似推断方法》

专知会员服务

29+阅读 · 2024年11月23日

【普林斯顿博士论文】可扩展和可解释的学习：用于知识发现的概率模型， 140页pdf

【普林斯顿博士论文】可扩展和可解释的学习：用于知识发现的概率模型， 140页pdf

专知会员服务

58+阅读 · 2023年10月10日

【ETH博士论文】机器学习数据估值算法与应用研究进展，225页pdf

【ETH博士论文】机器学习数据估值算法与应用研究进展，225页pdf

专知会员服务

38+阅读 · 2023年9月18日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知会员服务

93+阅读 · 2022年7月7日

【干货书】1270页pdf《概率图模型：原理与技术》MIT出版，用于构建和使用复杂系统概率模型的通用框架，使计算机能够使用可用信息做出决策。Probabilistic Graphical Models: Principles and Applications

【干货书】1270页pdf《概率图模型：原理与技术》MIT出版，用于构建和使用复杂系统概率模型的通用框架，使计算机能够使用可用信息做出决策。Probabilistic Graphical Models: Principles and Applications

专知会员服务

47+阅读 · 2022年4月11日

【经典书】概率论基础教程，A First Course in Probability，545页pdf

【经典书】概率论基础教程，A First Course in Probability，545页pdf

专知会员服务

122+阅读 · 2021年3月24日

【哈佛大学干货书】概率导论，589页pdf，Introduction to Probability

【哈佛大学干货书】概率导论，589页pdf，Introduction to Probability

专知会员服务

141+阅读 · 2021年1月24日

知识图谱嵌入模型的概率标定,Probability Calibration for Knowledge Graph Embedding Models

专知会员服务

36+阅读 · 2020年5月11日

热门VIP内容

开通专知VIP会员享更多权益服务

2025年全球二十起重大无人机作战事件

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

五角大楼启动“智能体网络”以推进人工智能赋能的战斗管理与目标打击

现代战争的隐蔽系统：伊朗战争十大启示

相关资讯

【干货书】概率论:概率论与统计的导论，411页pdf

【干货书】概率论:概率论与统计的导论，411页pdf

专知

13+阅读 · 2022年10月6日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

33+阅读 · 2022年7月7日

【经典书】概率论基础教程，A First Course in Probability，545页pdf

【经典书】概率论基础教程，A First Course in Probability，545页pdf

专知

21+阅读 · 2021年3月24日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

【资源】经典著作《机器学习：概率视角》第二版，1098页pdf下载（附Python代码）

【资源】经典著作《机器学习：概率视角》第二版，1098页pdf下载（附Python代码）

新智元

83+阅读 · 2019年10月28日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

这是一本好玩的可视化统计概率入门书，66页pdf下载

这是一本好玩的可视化统计概率入门书，66页pdf下载

专知

40+阅读 · 2018年12月30日

118页概率思维教程——基础、技巧与算法

118页概率思维教程——基础、技巧与算法

专知

13+阅读 · 2018年9月5日

概率论之概念解析：用贝叶斯推断进行参数估计

概率论之概念解析：用贝叶斯推断进行参数估计

专知

14+阅读 · 2018年1月8日

一文读懂机器学习概率图模型（附示例&学习资源）

一文读懂机器学习概率图模型（附示例&学习资源）

数据派THU

47+阅读 · 2017年12月10日

相关论文

RefineStat: Efficient Exploration for Probabilistic Program Synthesis

Arxiv

0+阅读 · 4月19日

A comparative analysis of machine learning models in SHAP analysis

Arxiv

0+阅读 · 4月8日

Active Statistical Inference

Arxiv

0+阅读 · 4月7日

Confidence Intervals for Rate Estimation with Importance Sampling in Autonomous Vehicle Evaluation

Arxiv

0+阅读 · 4月4日

A Unified Memory Perspective for Probabilistic Trustworthy AI

Arxiv

0+阅读 · 3月26日

Efficient Equilibrium Computation in Symmetric First-Price Auctions

Arxiv

0+阅读 · 3月25日

Objective Model Prior Probabilities in Variable Selection

Arxiv

0+阅读 · 3月20日

From Inference Efficiency to Embodied Efficiency: Revisiting Efficiency Metrics for Vision-Language-Action Models

Arxiv

0+阅读 · 3月19日

Refined Inference for Asymptotically Linear Estimators with Non-Negligible Second-Order Remainders

Arxiv

0+阅读 · 3月18日

Robust estimation of heterogeneous treatment effects in randomized trials leveraging external data

Arxiv

0+阅读 · 3月18日

相关基金

两类分数阶微分方程有效数值计算方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

处理效应差异中位数的有效估计

国家自然科学基金

0+阅读 · 2015年12月31日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

随机波动率模型下金融衍生产品定价中的条件蒙特卡罗加速方法

国家自然科学基金

1+阅读 · 2015年12月31日

随机Kolmogorov型系统及其数值解的渐近性质分析

国家自然科学基金

0+阅读 · 2015年12月31日

复杂数据下带有形状约束的半参数模型统计推断

国家自然科学基金

3+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

概率抽样设计及其统计推断方法

国家自然科学基金

6+阅读 · 2014年12月31日

因果推断的统计方法

国家自然科学基金

26+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员