This paper critically examines the 2022 Medibank health insurance data breach, which exposed sensitive medical records of 9.7 million individuals due to unencrypted storage, centralized access, and the absence of privacy-preserving analytics. To address these vulnerabilities, we propose an entropy-aware differential privacy (DP) framework that integrates Laplace and Gaussian mechanisms with adaptive budget allocation. The design incorporates TLS-encrypted database access, field-level mechanism selection, and smooth sensitivity models to mitigate re-identification risks. Experimental validation was conducted using synthetic Medibank datasets (N = 131,000) with entropy-calibrated DP mechanisms, where high-entropy attributes received stronger noise injection. Results demonstrate a 90.3% reduction in re-identification probability while maintaining analytical utility loss below 24%. The framework further aligns with GDPR Article 32 and Australian Privacy Principle 11.1, ensuring regulatory compliance. By combining rigorous privacy guarantees with practical usability, this work contributes a scalable and technically feasible solution for healthcare data protection, offering a pathway toward resilient, trustworthy, and regulation-ready medical analytics.


翻译:本文批判性地审视了2022年Medibank健康保险数据泄露事件,该事件因未加密存储、集中式访问以及缺乏隐私保护分析,导致970万个人的敏感医疗记录暴露。为应对这些漏洞,我们提出了一种熵感知差分隐私框架,该框架将拉普拉斯与高斯机制与自适应预算分配相结合。该设计融合了TLS加密的数据库访问、字段级机制选择以及平滑敏感度模型,以降低重识别风险。实验验证使用了合成的Medibank数据集(N = 131,000)并配合熵校准的差分隐私机制进行,其中高熵属性接受了更强的噪声注入。结果表明,在将分析效用损失维持在24%以下的同时,重识别概率降低了90.3%。该框架进一步符合《通用数据保护条例》第32条及澳大利亚隐私原则11.1,确保了法规遵从性。通过将严格的隐私保证与实际可用性相结合,本研究为医疗健康数据保护贡献了一个可扩展且技术可行的解决方案,为构建具有韧性、可信且符合法规要求的医疗分析提供了一条路径。

0
下载
关闭预览

相关内容

差分隐私全指南:从理论基础到用户期望
专知会员服务
13+阅读 · 2025年9月8日
利用表示学习推动多机构电子健康记录数据研究
专知会员服务
16+阅读 · 2025年2月17日
【斯坦福博士论文】隐私数据实用分析,200页pdf
专知会员服务
24+阅读 · 2024年7月14日
数据价值释放与隐私保护计算应用研究报告,64页pdf
专知会员服务
42+阅读 · 2021年11月29日
专知会员服务
14+阅读 · 2021年9月14日
专知会员服务
52+阅读 · 2021年3月28日
基于区块链的数据透明化:问题与挑战
专知会员服务
21+阅读 · 2021年3月4日
专知会员服务
41+阅读 · 2020年12月1日
联邦学习安全与隐私保护研究综述
专知
12+阅读 · 2020年8月7日
医疗健康领域的短文本解析探索----文本纠错
深度学习自然语言处理
10+阅读 · 2020年8月5日
缺失数据统计分析,第三版,462页pdf
专知
50+阅读 · 2020年2月28日
【专题】美国隐私立法进展的总体分析
蚂蚁金服评论
11+阅读 · 2019年4月25日
区块链隐私保护研究综述——祝烈煌详解
计算机研究与发展
23+阅读 · 2018年11月28日
差分隐私保护:从入门到脱坑
FreeBuf
17+阅读 · 2018年9月10日
综述——隐私保护集合交集计算技术研究
计算机研究与发展
22+阅读 · 2017年10月24日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2月2日
VIP会员
最新内容
“Maven计划”的发展演变之“Maven智能系统”应用
《无人机革命:来自俄乌战场的启示》(报告)
专知会员服务
5+阅读 · 今天6:48
《实现联合作战能力所需的技术》58页报告
专知会员服务
2+阅读 · 今天6:30
以色列运用人工智能优化空袭警报系统
专知会员服务
3+阅读 · 今天6:20
以色列在多条战线部署AI智能体
专知会员服务
4+阅读 · 今天6:12
2025年大语言模型进展报告
专知会员服务
19+阅读 · 4月25日
多智能体协作机制
专知会员服务
15+阅读 · 4月25日
相关VIP内容
差分隐私全指南:从理论基础到用户期望
专知会员服务
13+阅读 · 2025年9月8日
利用表示学习推动多机构电子健康记录数据研究
专知会员服务
16+阅读 · 2025年2月17日
【斯坦福博士论文】隐私数据实用分析,200页pdf
专知会员服务
24+阅读 · 2024年7月14日
数据价值释放与隐私保护计算应用研究报告,64页pdf
专知会员服务
42+阅读 · 2021年11月29日
专知会员服务
14+阅读 · 2021年9月14日
专知会员服务
52+阅读 · 2021年3月28日
基于区块链的数据透明化:问题与挑战
专知会员服务
21+阅读 · 2021年3月4日
专知会员服务
41+阅读 · 2020年12月1日
相关资讯
联邦学习安全与隐私保护研究综述
专知
12+阅读 · 2020年8月7日
医疗健康领域的短文本解析探索----文本纠错
深度学习自然语言处理
10+阅读 · 2020年8月5日
缺失数据统计分析,第三版,462页pdf
专知
50+阅读 · 2020年2月28日
【专题】美国隐私立法进展的总体分析
蚂蚁金服评论
11+阅读 · 2019年4月25日
区块链隐私保护研究综述——祝烈煌详解
计算机研究与发展
23+阅读 · 2018年11月28日
差分隐私保护:从入门到脱坑
FreeBuf
17+阅读 · 2018年9月10日
综述——隐私保护集合交集计算技术研究
计算机研究与发展
22+阅读 · 2017年10月24日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员