Dynamic Shapley Computation - 专知论文

会员服务 ·

0

代价 · 相似度 · 训练数据 · Principle · 计算成本 ·

Dynamic Shapley Computation

翻译：动态沙普利计算

Xuan Yang,Hsi-Wen Chen,Ming-Syan Chen,Jian Pei

Shapley-based data valuation provides a principled way to quantify the contribution of training data, but its high computational cost makes it impractical in dynamic settings where tasks and training players evolve. Existing methods treat Shapley computation as a one-shot process and collapse contributions into aggregated scores, preventing reuse and requiring recomputation under any change. We introduce a new perspective that represents Shapley values as a player-by-task matrix and formulates dynamic valuation as a structured matrix maintenance problem. We exploit the fact that each task depends on a small subset of training players and that similar tasks yield similar valuations, leading to utility locality and coalition locality. Based on these insights, we propose D-Shap, a dynamic valuation framework that enables efficient updates by modifying only a small portion of the matrix: new task valuations are inferred via structure-aware interpolation, while updates induced by new players are confined to affected local matrix blocks. To eliminate the need for pre-specified evaluation tasks, we introduce self-valuation, which constructs the initial matrix directly from training data, supported by scalable subset reuse and coverage-aware anchor selection. Experiments across diverse models show that D-Shap performs task updates in milliseconds and reduces the cost of player updates by up to three orders of magnitude, while achieving valuation quality competitive with full recomputation.

翻译：基于沙普利值的数据估值提供了一种量化训练数据贡献的原则性方法，但其高昂的计算成本使其在任务和训练参与者动态演化的场景中难以实用。现有方法将沙普利计算视为一次性过程，并将贡献值压缩为聚合分数，这阻碍了复用机制，导致任何变化都需重新计算。我们提出一种新视角：将沙普利值表示为参与者-任务矩阵，并将动态估值形式化为结构化矩阵维护问题。我们利用每个任务仅依赖少量训练参与者、以及相似任务产生相似估值这一事实，推导出效用局部性和联盟局部性。基于这些洞察，我们提出D-Shap——一种动态估值框架，通过仅修改矩阵的极小部分实现高效更新：新任务估值通过结构感知插值推断，而新参与者引发的更新则被限制在受影响的局部矩阵块内。为消除预定义评估任务的需求，我们引入自估值机制——直接从训练数据构建初始矩阵，并辅以可扩展子集复用和覆盖感知锚点选择。跨多种模型的实验表明，D-Shap可在毫秒级完成任务更新，并将参与者更新成本降低三个数量级，同时保持与完全重算相当的估值质量。

0

相关内容

《自动机器学习在军事数据耕耘法中的应用》

《自动机器学习在军事数据耕耘法中的应用》

专知会员服务

10+阅读 · 6月10日

【MIT博士论文】数据驱动的动态决策:算法、结构和复杂性分析，404页pdf

【MIT博士论文】数据驱动的动态决策:算法、结构和复杂性分析，404页pdf

专知会员服务

70+阅读 · 2023年9月22日

【ETH博士论文】机器学习数据估值算法与应用研究进展，225页pdf

【ETH博士论文】机器学习数据估值算法与应用研究进展，225页pdf

专知会员服务

38+阅读 · 2023年9月18日

用Transformer学习通用超参数优化器，DeepMind Yutian Chen博士讲授，附Slides与视频

用Transformer学习通用超参数优化器，DeepMind Yutian Chen博士讲授，附Slides与视频

专知会员服务

40+阅读 · 2023年3月12日

最新《计算机视觉持续学习进展》综述论文，22页pdf

最新《计算机视觉持续学习进展》综述论文，22页pdf

专知会员服务

74+阅读 · 2021年9月25日

【CVPR2021】动态度量学习

【CVPR2021】动态度量学习

专知会员服务

42+阅读 · 2021年3月30日

Nature计算科学综述：经由准实验从观察数据中推测因果关系

Nature计算科学综述：经由准实验从观察数据中推测因果关系

专知会员服务

36+阅读 · 2021年3月25日

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

专知会员服务

87+阅读 · 2020年8月28日

【2020新书】现代数据挖掘算法C++和CUDA，233页pdf，数据科学的特征提取和选择算法的最新发展

【2020新书】现代数据挖掘算法C++和CUDA，233页pdf，数据科学的特征提取和选择算法的最新发展

专知会员服务

76+阅读 · 2020年6月11日

【Google 大脑】使用上千个优化任务学习超参数搜索策略，Using a thousand optimization tasks to learn hyperparameter search strategies

【Google 大脑】使用上千个优化任务学习超参数搜索策略，Using a thousand optimization tasks to learn hyperparameter search strategies

专知会员服务

18+阅读 · 2020年3月14日

《利用边缘高性能计算 (HPC) 加速战术决策过程》美国陆军，43页报告

《利用边缘高性能计算 (HPC) 加速战术决策过程》美国陆军，43页报告

专知

113+阅读 · 2023年4月5日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

33+阅读 · 2022年7月7日

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

专知

11+阅读 · 2020年8月28日

北航发布「深度学习人群计数」2020综述论文，220+基于CNN的密度估计和人群计数的方法大调研

北航发布「深度学习人群计数」2020综述论文，220+基于CNN的密度估计和人群计数的方法大调研

专知

10+阅读 · 2020年4月1日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

用一行tf.data实现数据Shuffle、Batch划分、异步预加载等

用一行tf.data实现数据Shuffle、Batch划分、异步预加载等

专知

21+阅读 · 2019年3月26日

类脑计算的前沿论文，看我们推荐的这7篇

类脑计算的前沿论文，看我们推荐的这7篇

人工智能前沿讲习班

21+阅读 · 2019年1月7日

448页伊利诺伊大学《算法》图书-附下载

448页伊利诺伊大学《算法》图书-附下载

专知

15+阅读 · 2018年12月31日

【最新PyTorch0.4.0教程01】PyTorch的动态计算图深入浅出

【最新PyTorch0.4.0教程01】PyTorch的动态计算图深入浅出

专知

31+阅读 · 2018年4月30日

基于动态网络结构的膜计算系统及其算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

事件驱动下信息-物理融合系统最优状态估计理论与应用研究

国家自然科学基金

1+阅读 · 2015年12月31日

浮力称重式粉状物料动态计量控制方法与应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

移动云计算中数据流应用的动态计算切分技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

任意网络中的可分数据处理研究

国家自然科学基金

0+阅读 · 2015年12月31日

普适计算对象感知多模态不精确性数据融合算法研究

国家自然科学基金

5+阅读 · 2014年12月31日

动态环境下基于耗散结构的新型粒子群算法及应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的粒计算理论与方法

国家自然科学基金

4+阅读 · 2014年12月31日

Priority-Aware Shapley Value

Arxiv

0+阅读 · 6月14日

Explaining a probabilistic prediction on the simplex with Shapley compositions

Arxiv

0+阅读 · 6月3日

ShaplEIG: Bayesian Experimental Design for Shapley Value Estimation

Arxiv

0+阅读 · 6月1日

Fairness-Aware Federated Learning with Trajectory Shapley Value

Arxiv

0+阅读 · 5月28日

Fast Computational Methods for Regularized Estimating Equations

Arxiv

0+阅读 · 5月26日

The Kinetic Hourglass Data Structure for Computing the Bottleneck Distance of Dynamic Data

Arxiv

0+阅读 · 5月21日

Shapley Value Approximation Based on k-Additive Games

Arxiv

0+阅读 · 5月12日

GenAI Powered Dynamic Causal Inference with Unstructured Data

Arxiv

0+阅读 · 5月8日

Dynamic Treatment on Networks

Arxiv

0+阅读 · 5月7日

Temporal-Decay Shapley: A Time-Aware Data Valuation Framework for Time-Series Data

Arxiv

0+阅读 · 5月4日

VIP会员

文章信息

相关主题

最新内容

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

1+阅读 · 今天15:03

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

0+阅读 · 今天14:31

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

0+阅读 · 今天14:29

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

12+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

4+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

7+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

8+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

11+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

12+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

8+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

21+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

10+阅读 · 6月17日

相关VIP内容

《自动机器学习在军事数据耕耘法中的应用》

《自动机器学习在军事数据耕耘法中的应用》

专知会员服务

10+阅读 · 6月10日

【MIT博士论文】数据驱动的动态决策:算法、结构和复杂性分析，404页pdf

【MIT博士论文】数据驱动的动态决策:算法、结构和复杂性分析，404页pdf

专知会员服务

70+阅读 · 2023年9月22日

【ETH博士论文】机器学习数据估值算法与应用研究进展，225页pdf

【ETH博士论文】机器学习数据估值算法与应用研究进展，225页pdf

专知会员服务

38+阅读 · 2023年9月18日

用Transformer学习通用超参数优化器，DeepMind Yutian Chen博士讲授，附Slides与视频

用Transformer学习通用超参数优化器，DeepMind Yutian Chen博士讲授，附Slides与视频

专知会员服务

40+阅读 · 2023年3月12日

最新《计算机视觉持续学习进展》综述论文，22页pdf

最新《计算机视觉持续学习进展》综述论文，22页pdf

专知会员服务

74+阅读 · 2021年9月25日

【CVPR2021】动态度量学习

【CVPR2021】动态度量学习

专知会员服务

42+阅读 · 2021年3月30日

Nature计算科学综述：经由准实验从观察数据中推测因果关系

Nature计算科学综述：经由准实验从观察数据中推测因果关系

专知会员服务

36+阅读 · 2021年3月25日

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

专知会员服务

87+阅读 · 2020年8月28日

【2020新书】现代数据挖掘算法C++和CUDA，233页pdf，数据科学的特征提取和选择算法的最新发展

【2020新书】现代数据挖掘算法C++和CUDA，233页pdf，数据科学的特征提取和选择算法的最新发展

专知会员服务

76+阅读 · 2020年6月11日

【Google 大脑】使用上千个优化任务学习超参数搜索策略，Using a thousand optimization tasks to learn hyperparameter search strategies

【Google 大脑】使用上千个优化任务学习超参数搜索策略，Using a thousand optimization tasks to learn hyperparameter search strategies

专知会员服务

18+阅读 · 2020年3月14日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

美国从乌克兰无人机战争中学习经验

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

相关资讯

《利用边缘高性能计算 (HPC) 加速战术决策过程》美国陆军，43页报告

《利用边缘高性能计算 (HPC) 加速战术决策过程》美国陆军，43页报告

专知

113+阅读 · 2023年4月5日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

33+阅读 · 2022年7月7日

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

专知

11+阅读 · 2020年8月28日

北航发布「深度学习人群计数」2020综述论文，220+基于CNN的密度估计和人群计数的方法大调研

北航发布「深度学习人群计数」2020综述论文，220+基于CNN的密度估计和人群计数的方法大调研

专知

10+阅读 · 2020年4月1日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

用一行tf.data实现数据Shuffle、Batch划分、异步预加载等

用一行tf.data实现数据Shuffle、Batch划分、异步预加载等

专知

21+阅读 · 2019年3月26日

类脑计算的前沿论文，看我们推荐的这7篇

类脑计算的前沿论文，看我们推荐的这7篇

人工智能前沿讲习班

21+阅读 · 2019年1月7日

448页伊利诺伊大学《算法》图书-附下载

448页伊利诺伊大学《算法》图书-附下载

专知

15+阅读 · 2018年12月31日

【最新PyTorch0.4.0教程01】PyTorch的动态计算图深入浅出

【最新PyTorch0.4.0教程01】PyTorch的动态计算图深入浅出

专知

31+阅读 · 2018年4月30日

相关论文

Priority-Aware Shapley Value

Arxiv

0+阅读 · 6月14日

Explaining a probabilistic prediction on the simplex with Shapley compositions

Arxiv

0+阅读 · 6月3日

ShaplEIG: Bayesian Experimental Design for Shapley Value Estimation

Arxiv

0+阅读 · 6月1日

Fairness-Aware Federated Learning with Trajectory Shapley Value

Arxiv

0+阅读 · 5月28日

Fast Computational Methods for Regularized Estimating Equations

Arxiv

0+阅读 · 5月26日

The Kinetic Hourglass Data Structure for Computing the Bottleneck Distance of Dynamic Data

Arxiv

0+阅读 · 5月21日

Shapley Value Approximation Based on k-Additive Games

Arxiv

0+阅读 · 5月12日

GenAI Powered Dynamic Causal Inference with Unstructured Data

Arxiv

0+阅读 · 5月8日

Dynamic Treatment on Networks

Arxiv

0+阅读 · 5月7日

Temporal-Decay Shapley: A Time-Aware Data Valuation Framework for Time-Series Data

Arxiv

0+阅读 · 5月4日

相关基金

基于动态网络结构的膜计算系统及其算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

事件驱动下信息-物理融合系统最优状态估计理论与应用研究

国家自然科学基金

1+阅读 · 2015年12月31日

浮力称重式粉状物料动态计量控制方法与应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

移动云计算中数据流应用的动态计算切分技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

任意网络中的可分数据处理研究

国家自然科学基金

0+阅读 · 2015年12月31日

普适计算对象感知多模态不精确性数据融合算法研究

国家自然科学基金

5+阅读 · 2014年12月31日

动态环境下基于耗散结构的新型粒子群算法及应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的粒计算理论与方法

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员