CVPL: A Geometric Framework for Post-Hoc Linkage Risk Assessment in Protected Tabular Data - 专知论文

会员服务 ·

0

表格数据 · 形式化 · 投影 · 分析 · 风险估计 ·

CVPL: A Geometric Framework for Post-Hoc Linkage Risk Assessment in Protected Tabular Data

翻译：CVPL：一种用于受保护表格数据事后链接风险评估的几何框架

Valery Khvatov,Alexey Neyman

from arxiv, 53 pages, 9 figures, 6 appendices. Code: https://github.com/DGT-Network/cvpl

Formal privacy metrics provide compliance-oriented guarantees but often fail to quantify actual linkability in released datasets. We introduce CVPL (Cluster-Vector-Projection Linkage), a geometric framework for post-hoc assessment of linkage risk between original and protected tabular data. CVPL represents linkage analysis as an operator pipeline comprising blocking, vectorization, latent projection, and similarity evaluation, yielding continuous, scenario-dependent risk estimates rather than binary compliance verdicts. We formally define CVPL under an explicit threat model and introduce threshold-aware risk surfaces, R(lambda, tau), that capture the joint effects of protection strength and attacker strictness. We establish a progressive blocking strategy with monotonicity guarantees, enabling anytime risk estimation with valid lower bounds. We demonstrate that the classical Fellegi-Sunter linkage emerges as a special case of CVPL under restrictive assumptions, and that violations of these assumptions can lead to systematic over-linking bias. Empirical validation on 10,000 records across 19 protection configurations demonstrates that formal k-anonymity compliance may coexist with substantial empirical linkability, with a significant portion arising from non-quasi-identifier behavioral patterns. CVPL provides interpretable diagnostics identifying which features drive linkage feasibility, supporting privacy impact assessment, protection mechanism comparison, and utility-risk trade-off analysis.

翻译：形式化隐私度量提供合规导向的保证，但往往无法量化已发布数据集中的实际可链接性。本文提出CVPL（聚类-向量-投影链接），一种用于事后评估原始表格数据与受保护表格数据间链接风险的几何框架。CVPL将链接分析表示为包含分块、向量化、潜在投影和相似度评估的算子流水线，产生连续、场景依赖的风险估计，而非二元合规判定。我们在显式威胁模型下形式化定义CVPL，并引入阈值感知风险曲面R(λ, τ)，以捕捉保护强度与攻击者严格程度的联合效应。我们建立了具有单调性保证的渐进分块策略，支持带有效下界的随时风险估计。我们证明经典Fellegi-Sunter链接是CVPL在严格假设下的特例，且违反这些假设可能导致系统性过度链接偏差。在19种保护配置下对10,000条记录进行的实证验证表明，形式化的k-匿名合规可能与显著的实证可链接性共存，其中相当部分源于非准标识符的行为模式。CVPL提供可解释的诊断，识别哪些特征驱动链接可行性，支持隐私影响评估、保护机制比较以及效用-风险权衡分析。

0

相关内容

表格数据

什么是共形预测(conformal prediction)？LPSM最新《共形预测》教程，71页ppt

什么是共形预测(conformal prediction)？LPSM最新《共形预测》教程，71页ppt

专知会员服务

44+阅读 · 2023年9月3日

【CVPR2023】视觉Transformer学习长尾数据，解决不平衡标注数据

【CVPR2023】视觉Transformer学习长尾数据，解决不平衡标注数据

专知会员服务

33+阅读 · 2023年6月16日

【CVPR2022】视频对比学习的概率表示，Probabilistic Representations for Video Contrastive Learning

【CVPR2022】视频对比学习的概率表示，Probabilistic Representations for Video Contrastive Learning

专知会员服务

16+阅读 · 2022年4月11日

【CVPR2022】语言引导与基于视觉的深度度量学习的集成

【CVPR2022】语言引导与基于视觉的深度度量学习的集成

专知会员服务

17+阅读 · 2022年3月17日

【哥伦比亚大学】复杂网络深度表示的几何和拓扑推理，Geometric and Topological Inference for Deep Representations of Complex Networks

【哥伦比亚大学】复杂网络深度表示的几何和拓扑推理，Geometric and Topological Inference for Deep Representations of Complex Networks

专知会员服务

22+阅读 · 2022年3月11日

【ICML2021】GeomCA: 数据表示几何评估

专知会员服务

15+阅读 · 2021年9月11日

【ICML2021】数据表示的几何评估

专知会员服务

38+阅读 · 2021年6月3日

【CVPR2021】MagFace:一种用于人脸识别和质量评估的通用表示

专知会员服务

29+阅读 · 2021年5月26日

【CVPR2020】在线深度聚类的无监督表示学习, Online Deep Clustering for Unsupervised Representation Learning

【CVPR2020】在线深度聚类的无监督表示学习, Online Deep Clustering for Unsupervised Representation Learning

专知会员服务

69+阅读 · 2020年6月19日

临床自然语言处理中的嵌入综述，SECNLP: A survey of embeddings

临床自然语言处理中的嵌入综述，SECNLP: A survey of embeddings

专知会员服务

39+阅读 · 2020年3月23日

论文推荐|[CVPR 2020]增广学习：面向文本行识别的网络优化协同数据增广方法

论文推荐|[CVPR 2020]增广学习：面向文本行识别的网络优化协同数据增广方法

专知

22+阅读 · 2020年4月9日

CVPR2020接收论文开源代码

CVPR2020接收论文开源代码

专知

30+阅读 · 2020年2月29日

CVPR2019教程《胶囊网络（Capsule Networks）综述》，附93页PPT

CVPR2019教程《胶囊网络（Capsule Networks）综述》，附93页PPT

GAN生成式对抗网络

29+阅读 · 2019年6月21日

【CVPR Oral】视频跟踪新思路，完全无需手工标注

【CVPR Oral】视频跟踪新思路，完全无需手工标注

新智元

19+阅读 · 2019年4月21日

【干货】CVPR2019 论文解读汇总（包括目标检测、姿态估计、语义分割等）

【干货】CVPR2019 论文解读汇总（包括目标检测、姿态估计、语义分割等）

GAN生成式对抗网络

46+阅读 · 2019年3月11日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

CVPR2019论文抢鲜看！20篇涵盖目标检测、跨模态、视频处理、语义分割和姿态估计等方向论文

CVPR2019论文抢鲜看！20篇涵盖目标检测、跨模态、视频处理、语义分割和姿态估计等方向论文

专知

30+阅读 · 2019年3月3日

刷新三项COCO纪录！姿态估计模型HRNet开源了，中科大微软出品 | CVPR

刷新三项COCO纪录！姿态估计模型HRNet开源了，中科大微软出品 | CVPR

量子位

11+阅读 · 2019年2月28日

论文笔记之attention mechanism专题1:SA-Net（CVPR 2018）

论文笔记之attention mechanism专题1:SA-Net（CVPR 2018）

统计学习与视觉计算组

16+阅读 · 2018年4月5日

推荐｜caffe-orc主流ocr算法：CNN+BLSTM+CTC架构实现！

推荐｜caffe-orc主流ocr算法：CNN+BLSTM+CTC架构实现！

全球人工智能

19+阅读 · 2017年10月29日

抗噪、抗假频叠前地震数据插值方法研究

国家自然科学基金

1+阅读 · 2016年12月31日

基于移动平台的视频信息隐藏关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

井震联合数据驱动下，多智能技术融合的煤层气储层参数预测与评价

国家自然科学基金

2+阅读 · 2015年12月31日

基于关键词的大规模链接数据搜索技术研究

国家自然科学基金

7+阅读 · 2015年12月31日

数据流发布中的隐私保护理论和方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

场景深度关系下的视频遮挡目标检测

国家自然科学基金

1+阅读 · 2015年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

隐写模糊安全性测度及其优化嵌入算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于智能信息处理的Web服务可信性预测与评估技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

Accelerating Approximate Analytical Join Queries over Unstructured Data with Statistical Guarantees

Arxiv

0+阅读 · 3月17日

VisPoison: An Effective Backdoor Attack Framework for Tabular Data Visualization Models

Arxiv

0+阅读 · 3月10日

An interpretable prototype parts-based neural network for medical tabular data

Arxiv

0+阅读 · 3月5日

LinkML: An Open Data Modeling Framework

Arxiv

0+阅读 · 3月2日

TableTale: Reviving the Narrative Interplay Between Data Tables and Text in Scientific Papers

Arxiv

0+阅读 · 2月26日

IMMACULATE: A Practical LLM Auditing Framework via Verifiable Computation

Arxiv

0+阅读 · 2月26日

PII-Bench: Evaluating Query-Aware Privacy Protection Systems

Arxiv

0+阅读 · 2月17日

ModSSC: A Modular Framework for Semi-Supervised Classification on Heterogeneous Data

Arxiv

0+阅读 · 2月16日

DataCrumb: A Physical Probe for Reflections on Background Web Tracking

Arxiv

0+阅读 · 2月5日

TRACE: Transparent Web Reliability Assessment with Contextual Explanations

TRACE: Transparent Web Reliability Assessment with Contextual Explanations

Arxiv

0+阅读 · 2月4日

VIP会员

文章信息

相关主题

最新内容

《美陆军条例：陆军指挥政策（2026版）》

《美陆军条例：陆军指挥政策（2026版）》

专知会员服务

9+阅读 · 今天8:10

《提升美军全域城市作战训练最佳实践的案例研究》366页

《提升美军全域城市作战训练最佳实践的案例研究》366页

专知会员服务

8+阅读 · 今天8:06

《军用自主人工智能系统的治理与安全》

《军用自主人工智能系统的治理与安全》

专知会员服务

5+阅读 · 今天8:02

美海军数字作战负责人：如何利用数据快速生成战斗力

美海军数字作战负责人：如何利用数据快速生成战斗力

专知会员服务

5+阅读 · 今天7:32

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

11+阅读 · 4月20日

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

10+阅读 · 4月20日

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

6+阅读 · 4月20日

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

4+阅读 · 4月20日

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

专知会员服务

8+阅读 · 4月20日

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

专知会员服务

5+阅读 · 4月20日

高效视频扩散模型：进展与挑战

高效视频扩散模型：进展与挑战

专知会员服务

5+阅读 · 4月20日

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

8+阅读 · 4月20日

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

7+阅读 · 4月20日

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

12+阅读 · 4月20日

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

6+阅读 · 4月20日

相关VIP内容

什么是共形预测(conformal prediction)？LPSM最新《共形预测》教程，71页ppt

什么是共形预测(conformal prediction)？LPSM最新《共形预测》教程，71页ppt

专知会员服务

44+阅读 · 2023年9月3日

【CVPR2023】视觉Transformer学习长尾数据，解决不平衡标注数据

【CVPR2023】视觉Transformer学习长尾数据，解决不平衡标注数据

专知会员服务

33+阅读 · 2023年6月16日

【CVPR2022】视频对比学习的概率表示，Probabilistic Representations for Video Contrastive Learning

【CVPR2022】视频对比学习的概率表示，Probabilistic Representations for Video Contrastive Learning

专知会员服务

16+阅读 · 2022年4月11日

【CVPR2022】语言引导与基于视觉的深度度量学习的集成

【CVPR2022】语言引导与基于视觉的深度度量学习的集成

专知会员服务

17+阅读 · 2022年3月17日

【哥伦比亚大学】复杂网络深度表示的几何和拓扑推理，Geometric and Topological Inference for Deep Representations of Complex Networks

【哥伦比亚大学】复杂网络深度表示的几何和拓扑推理，Geometric and Topological Inference for Deep Representations of Complex Networks

专知会员服务

22+阅读 · 2022年3月11日

【ICML2021】GeomCA: 数据表示几何评估

专知会员服务

15+阅读 · 2021年9月11日

【ICML2021】数据表示的几何评估

专知会员服务

38+阅读 · 2021年6月3日

【CVPR2021】MagFace:一种用于人脸识别和质量评估的通用表示

专知会员服务

29+阅读 · 2021年5月26日

【CVPR2020】在线深度聚类的无监督表示学习, Online Deep Clustering for Unsupervised Representation Learning

【CVPR2020】在线深度聚类的无监督表示学习, Online Deep Clustering for Unsupervised Representation Learning

专知会员服务

69+阅读 · 2020年6月19日

临床自然语言处理中的嵌入综述，SECNLP: A survey of embeddings

临床自然语言处理中的嵌入综述，SECNLP: A survey of embeddings

专知会员服务

39+阅读 · 2020年3月23日

热门VIP内容

开通专知VIP会员享更多权益服务

《提升美军全域城市作战训练最佳实践的案例研究》366页

美海军数字作战负责人：如何利用数据快速生成战斗力

《美陆军条例：陆军指挥政策（2026版）》

《军用自主人工智能系统的治理与安全》

相关资讯

论文推荐|[CVPR 2020]增广学习：面向文本行识别的网络优化协同数据增广方法

论文推荐|[CVPR 2020]增广学习：面向文本行识别的网络优化协同数据增广方法

专知

22+阅读 · 2020年4月9日

CVPR2020接收论文开源代码

CVPR2020接收论文开源代码

专知

30+阅读 · 2020年2月29日

CVPR2019教程《胶囊网络（Capsule Networks）综述》，附93页PPT

CVPR2019教程《胶囊网络（Capsule Networks）综述》，附93页PPT

GAN生成式对抗网络

29+阅读 · 2019年6月21日

【CVPR Oral】视频跟踪新思路，完全无需手工标注

【CVPR Oral】视频跟踪新思路，完全无需手工标注

新智元

19+阅读 · 2019年4月21日

【干货】CVPR2019 论文解读汇总（包括目标检测、姿态估计、语义分割等）

【干货】CVPR2019 论文解读汇总（包括目标检测、姿态估计、语义分割等）

GAN生成式对抗网络

46+阅读 · 2019年3月11日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

CVPR2019论文抢鲜看！20篇涵盖目标检测、跨模态、视频处理、语义分割和姿态估计等方向论文

CVPR2019论文抢鲜看！20篇涵盖目标检测、跨模态、视频处理、语义分割和姿态估计等方向论文

专知

30+阅读 · 2019年3月3日

刷新三项COCO纪录！姿态估计模型HRNet开源了，中科大微软出品 | CVPR

刷新三项COCO纪录！姿态估计模型HRNet开源了，中科大微软出品 | CVPR

量子位

11+阅读 · 2019年2月28日

论文笔记之attention mechanism专题1:SA-Net（CVPR 2018）

论文笔记之attention mechanism专题1:SA-Net（CVPR 2018）

统计学习与视觉计算组

16+阅读 · 2018年4月5日

推荐｜caffe-orc主流ocr算法：CNN+BLSTM+CTC架构实现！

推荐｜caffe-orc主流ocr算法：CNN+BLSTM+CTC架构实现！

全球人工智能

19+阅读 · 2017年10月29日

相关论文

Accelerating Approximate Analytical Join Queries over Unstructured Data with Statistical Guarantees

Arxiv

0+阅读 · 3月17日

VisPoison: An Effective Backdoor Attack Framework for Tabular Data Visualization Models

Arxiv

0+阅读 · 3月10日

An interpretable prototype parts-based neural network for medical tabular data

Arxiv

0+阅读 · 3月5日

LinkML: An Open Data Modeling Framework

Arxiv

0+阅读 · 3月2日

TableTale: Reviving the Narrative Interplay Between Data Tables and Text in Scientific Papers

Arxiv

0+阅读 · 2月26日

IMMACULATE: A Practical LLM Auditing Framework via Verifiable Computation

Arxiv

0+阅读 · 2月26日

PII-Bench: Evaluating Query-Aware Privacy Protection Systems

Arxiv

0+阅读 · 2月17日

ModSSC: A Modular Framework for Semi-Supervised Classification on Heterogeneous Data

Arxiv

0+阅读 · 2月16日

DataCrumb: A Physical Probe for Reflections on Background Web Tracking

Arxiv

0+阅读 · 2月5日

TRACE: Transparent Web Reliability Assessment with Contextual Explanations

TRACE: Transparent Web Reliability Assessment with Contextual Explanations

Arxiv

0+阅读 · 2月4日

相关基金

抗噪、抗假频叠前地震数据插值方法研究

国家自然科学基金

1+阅读 · 2016年12月31日

基于移动平台的视频信息隐藏关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

井震联合数据驱动下，多智能技术融合的煤层气储层参数预测与评价

国家自然科学基金

2+阅读 · 2015年12月31日

基于关键词的大规模链接数据搜索技术研究

国家自然科学基金

7+阅读 · 2015年12月31日

数据流发布中的隐私保护理论和方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

场景深度关系下的视频遮挡目标检测

国家自然科学基金

1+阅读 · 2015年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

隐写模糊安全性测度及其优化嵌入算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于智能信息处理的Web服务可信性预测与评估技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员