Shapley Value-Guided Adaptive Ensemble Learning for Explainable Financial Fraud Detection with U.S. Regulatory Compliance Validation - 专知论文

会员服务 ·

0

集成 · 自适应 · 金融 · 欺诈检测 · SR ·

Shapley Value-Guided Adaptive Ensemble Learning for Explainable Financial Fraud Detection with U.S. Regulatory Compliance Validation

翻译：基于Shapley值的自适应集成学习用于可解释金融欺诈检测及美国合规性验证

Mohammad Nasir Uddin,Md Munna Aziz

from arxiv, 28 pages. Submitted to Engineering Applications of Artificial Intelligence (Elsevier). IEEE-CIS dataset (590,540 transactions). Includes SGAE algorithm, SHAP stability evaluation, and OCC/SR 11-7 regulatory compliance mapping

Financial crime costs U.S. institutions over $32 billion each year. Although AI tools for fraud detection have become more advanced, their use in real-world systems still faces a major obstacle: many of these models operate as black boxes that cannot provide the transparent, auditable explanations required by regulations such as OCC Bulletin 2011-12 and Federal Reserve SR 11-7. This study makes three main contributions. First, it offers a thorough evaluation of explanation quality across faithfulness (sufficiency and comprehensiveness at k=5, 10, and 15) and stability (Kendall's W across 30 bootstrap samples). XGBoost paired with TreeExplainer achieves near-perfect stability (W=0.9912), while LSTM with DeepExplainer shows weak results (W=0.4962). Second, the paper introduces the SHAP-Guided Adaptive Ensemble (SGAE), which dynamically adjusts per-transaction ensemble weights based on SHAP attribution agreement, achieving the highest AUC-ROC among all tested models (0.8837 held-out; 0.9245 cross-validation). Third, a complete three-architecture evaluation of LSTM, Transformer, and GNN-GraphSAGE on the full 590,540-transaction IEEE-CIS dataset is provided, with GNN-GraphSAGE achieving AUC-ROC 0.9248 and F1=0.6013. All results are mapped directly to OCC, SR 11-7, and BSA-AML regulatory compliance requirements.

翻译：金融犯罪每年给美国机构造成超过320亿美元的损失。尽管用于欺诈检测的人工智能工具已变得更加先进，但其在现实系统中的应用仍面临重大障碍：许多模型作为黑箱运行，无法提供OCC公告2011-12号及美联储SR 11-7号等法规要求的透明、可审计的解释。本研究做出三项主要贡献。首先，对解释质量进行了全面评估，涵盖忠实度（在k=5、10、15下的充分性和完整性）和稳定性（基于30次自助法样本的Kendall's W）。XGBoost结合TreeExplainer达到了近乎完美的稳定性（W=0.9912），而LSTM结合DeepExplainer表现较弱（W=0.4962）。其次，本文提出了SHAP引导的自适应集成方法（SGAE），该方法基于SHAP归因一致性动态调整每笔交易的集成权重，在所有测试模型中取得了最高的AUC-ROC（保留集0.8837；交叉验证0.9245）。第三，在包含590,540笔交易的完整IEEE-CIS数据集上，对LSTM、Transformer和GNN-GraphSAGE三种架构进行了全面评估，其中GNN-GraphSAGE的AUC-ROC达到0.9248，F1分数为0.6013。所有结果均直接映射至OCC、SR 11-7及BSA-AML合规性监管要求。

0

相关内容

DGP双粒度提示框架：图增强大模型助力欺诈检测

DGP双粒度提示框架：图增强大模型助力欺诈检测

专知会员服务

9+阅读 · 2025年8月17日

ACM Computing Surveys | 港大等基于可靠性视角的深度伪造检测综述，覆盖主流基准库、模型

ACM Computing Surveys | 港大等基于可靠性视角的深度伪造检测综述，覆盖主流基准库、模型

专知会员服务

17+阅读 · 2025年1月12日

图神经网络在金融欺诈检测中的应用综述

图神经网络在金融欺诈检测中的应用综述

专知会员服务

28+阅读 · 2024年11月22日

【KDD2024】SEFraud：通过解释性掩码学习实现的基于图的自解释欺诈检测

【KDD2024】SEFraud：通过解释性掩码学习实现的基于图的自解释欺诈检测

专知会员服务

18+阅读 · 2024年6月18日

【AAAI2023教程】值得信赖和负责任的AI:公平性、可解释性、透明度及其相互作用，200+Slides

【AAAI2023教程】值得信赖和负责任的AI:公平性、可解释性、透明度及其相互作用，200+Slides

专知会员服务

33+阅读 · 2023年2月9日

图异常检测在金融反欺诈中的应用研究进展

图异常检测在金融反欺诈中的应用研究进展

专知会员服务

50+阅读 · 2022年11月20日

安全多方计算及其在机器学习中的应用

专知会员服务

38+阅读 · 2021年10月19日

【斯坦福大学】可信任机器学习课程，附课件

专知会员服务

47+阅读 · 2021年5月13日

央行发布《人工智能算法金融应用评价规范》，28页pdf

央行发布《人工智能算法金融应用评价规范》，28页pdf

专知会员服务

76+阅读 · 2021年5月2日

最新《监督机器学习可解释性》2020大综述论文，74页pdf

最新《监督机器学习可解释性》2020大综述论文，74页pdf

专知会员服务

130+阅读 · 2020年11月19日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

92+阅读 · 2022年4月17日

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

专知

25+阅读 · 2020年12月6日

如何构建「可信任的深度学习」？美国三院院士UCLA数学泰斗Stanley Osher教授这44页ppt为你讲述

如何构建「可信任的深度学习」？美国三院院士UCLA数学泰斗Stanley Osher教授这44页ppt为你讲述

专知

13+阅读 · 2020年3月14日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

1200+标星，3千多人点赞，这本书让你系统了解机器学习可解释性丨开源免费阅读

1200+标星，3千多人点赞，这本书让你系统了解机器学习可解释性丨开源免费阅读

量子位

13+阅读 · 2019年7月16日

【智能金融】机器学习在反欺诈中应用

【智能金融】机器学习在反欺诈中应用

产业智能官

35+阅读 · 2019年3月15日

【AAAI2019教程】面向隐私安全保密的联邦学习与迁移学习，101页pdf

【AAAI2019教程】面向隐私安全保密的联邦学习与迁移学习，101页pdf

专知

47+阅读 · 2019年1月29日

干货解析 | 如何通过用户的行为序列来提升欺诈风险识别

干货解析 | 如何通过用户的行为序列来提升欺诈风险识别

蚂蚁程序猿

13+阅读 · 2018年9月7日

智能时代如何构建金融反欺诈体系？

智能时代如何构建金融反欺诈体系？

数据猿

12+阅读 · 2018年3月26日

干货 | 人工智能如何帮助银行反欺诈：来看看关于银行智能欺诈风险预测模型的研究

干货 | 人工智能如何帮助银行反欺诈：来看看关于银行智能欺诈风险预测模型的研究

AI100

11+阅读 · 2017年11月17日

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

6+阅读 · 2017年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

针对S芯片验证模块引脚信息的自动分析技术

国家自然科学基金

0+阅读 · 2015年12月31日

高维单调转移模型的变量选择及其在违约风险评估中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

融合多源大数据的互联网金融个性化价值发现与风险评测

国家自然科学基金

2+阅读 · 2015年12月31日

自检测型量子密钥分配研究

国家自然科学基金

0+阅读 · 2014年12月31日

复杂需求场景驱动的软件安全防护模型检测技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

FinAcumen: Financial Multimodal Reasoning via Self-Evolving Experience Memory Harness

Arxiv

0+阅读 · 6月16日

An AI Security Agent for Banking: Multi-Vector Fraud and AML Detection Across Retail and Corporate Accounts

Arxiv

0+阅读 · 6月16日

Adaptive and Explicit safe: Triggering Latent Safety Awareness in Large Reasoning Models

Arxiv

0+阅读 · 6月15日

Beyond Defensive Reporting: Machine Learning for Active Anti-Money Laundering Control in Insurance

Arxiv

0+阅读 · 6月15日

The Anatomy of Scam Scenarios: Large-Scale Characterization and Conversation-Aware Detection

Arxiv

0+阅读 · 6月14日

DeceptionX: Explainable Deception Detection with Multimodal Large Language Models

Arxiv

0+阅读 · 6月9日

Validation-Stage Combinatorial Fusion Analysis for Imbalanced Credit-Card Fraud Detection

Arxiv

0+阅读 · 6月9日

DPAgent-in-the-Middle: Agentic Defense and Repair Against AI-Groomed Deceptive Patterns

Arxiv

0+阅读 · 6月5日

Explainable AI-Driven Cyber Risk Analytics and Model Reliability Assessment for Intelligent Governance of U.S. Critical Infrastructure: An XGBoost and SHAP-Based Intrusion Detection Framework

Arxiv

0+阅读 · 6月4日

An Efficient Machine Learning-based Framework for Detection and Prevention of Frauds in Telecom Networks

Arxiv

0+阅读 · 5月17日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

2+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

4+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

5+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

6+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

10+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

6+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

9+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

7+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

13+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

8+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

8+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

10+阅读 · 6月17日

相关VIP内容

DGP双粒度提示框架：图增强大模型助力欺诈检测

DGP双粒度提示框架：图增强大模型助力欺诈检测

专知会员服务

9+阅读 · 2025年8月17日

ACM Computing Surveys | 港大等基于可靠性视角的深度伪造检测综述，覆盖主流基准库、模型

ACM Computing Surveys | 港大等基于可靠性视角的深度伪造检测综述，覆盖主流基准库、模型

专知会员服务

17+阅读 · 2025年1月12日

图神经网络在金融欺诈检测中的应用综述

图神经网络在金融欺诈检测中的应用综述

专知会员服务

28+阅读 · 2024年11月22日

【KDD2024】SEFraud：通过解释性掩码学习实现的基于图的自解释欺诈检测

【KDD2024】SEFraud：通过解释性掩码学习实现的基于图的自解释欺诈检测

专知会员服务

18+阅读 · 2024年6月18日

【AAAI2023教程】值得信赖和负责任的AI:公平性、可解释性、透明度及其相互作用，200+Slides

【AAAI2023教程】值得信赖和负责任的AI:公平性、可解释性、透明度及其相互作用，200+Slides

专知会员服务

33+阅读 · 2023年2月9日

图异常检测在金融反欺诈中的应用研究进展

图异常检测在金融反欺诈中的应用研究进展

专知会员服务

50+阅读 · 2022年11月20日

安全多方计算及其在机器学习中的应用

专知会员服务

38+阅读 · 2021年10月19日

【斯坦福大学】可信任机器学习课程，附课件

专知会员服务

47+阅读 · 2021年5月13日

央行发布《人工智能算法金融应用评价规范》，28页pdf

央行发布《人工智能算法金融应用评价规范》，28页pdf

专知会员服务

76+阅读 · 2021年5月2日

最新《监督机器学习可解释性》2020大综述论文，74页pdf

最新《监督机器学习可解释性》2020大综述论文，74页pdf

专知会员服务

130+阅读 · 2020年11月19日

热门VIP内容

开通专知VIP会员享更多权益服务

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

相关资讯

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

92+阅读 · 2022年4月17日

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

专知

25+阅读 · 2020年12月6日

如何构建「可信任的深度学习」？美国三院院士UCLA数学泰斗Stanley Osher教授这44页ppt为你讲述

如何构建「可信任的深度学习」？美国三院院士UCLA数学泰斗Stanley Osher教授这44页ppt为你讲述

专知

13+阅读 · 2020年3月14日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

1200+标星，3千多人点赞，这本书让你系统了解机器学习可解释性丨开源免费阅读

1200+标星，3千多人点赞，这本书让你系统了解机器学习可解释性丨开源免费阅读

量子位

13+阅读 · 2019年7月16日

【智能金融】机器学习在反欺诈中应用

【智能金融】机器学习在反欺诈中应用

产业智能官

35+阅读 · 2019年3月15日

【AAAI2019教程】面向隐私安全保密的联邦学习与迁移学习，101页pdf

【AAAI2019教程】面向隐私安全保密的联邦学习与迁移学习，101页pdf

专知

47+阅读 · 2019年1月29日

干货解析 | 如何通过用户的行为序列来提升欺诈风险识别

干货解析 | 如何通过用户的行为序列来提升欺诈风险识别

蚂蚁程序猿

13+阅读 · 2018年9月7日

智能时代如何构建金融反欺诈体系？

智能时代如何构建金融反欺诈体系？

数据猿

12+阅读 · 2018年3月26日

干货 | 人工智能如何帮助银行反欺诈：来看看关于银行智能欺诈风险预测模型的研究

干货 | 人工智能如何帮助银行反欺诈：来看看关于银行智能欺诈风险预测模型的研究

AI100

11+阅读 · 2017年11月17日

相关论文

FinAcumen: Financial Multimodal Reasoning via Self-Evolving Experience Memory Harness

Arxiv

0+阅读 · 6月16日

An AI Security Agent for Banking: Multi-Vector Fraud and AML Detection Across Retail and Corporate Accounts

Arxiv

0+阅读 · 6月16日

Adaptive and Explicit safe: Triggering Latent Safety Awareness in Large Reasoning Models

Arxiv

0+阅读 · 6月15日

Beyond Defensive Reporting: Machine Learning for Active Anti-Money Laundering Control in Insurance

Arxiv

0+阅读 · 6月15日

The Anatomy of Scam Scenarios: Large-Scale Characterization and Conversation-Aware Detection

Arxiv

0+阅读 · 6月14日

DeceptionX: Explainable Deception Detection with Multimodal Large Language Models

Arxiv

0+阅读 · 6月9日

Validation-Stage Combinatorial Fusion Analysis for Imbalanced Credit-Card Fraud Detection

Arxiv

0+阅读 · 6月9日

DPAgent-in-the-Middle: Agentic Defense and Repair Against AI-Groomed Deceptive Patterns

Arxiv

0+阅读 · 6月5日

Explainable AI-Driven Cyber Risk Analytics and Model Reliability Assessment for Intelligent Governance of U.S. Critical Infrastructure: An XGBoost and SHAP-Based Intrusion Detection Framework

Arxiv

0+阅读 · 6月4日

An Efficient Machine Learning-based Framework for Detection and Prevention of Frauds in Telecom Networks

Arxiv

0+阅读 · 5月17日

相关基金

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

6+阅读 · 2017年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

针对S芯片验证模块引脚信息的自动分析技术

国家自然科学基金

0+阅读 · 2015年12月31日

高维单调转移模型的变量选择及其在违约风险评估中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

融合多源大数据的互联网金融个性化价值发现与风险评测

国家自然科学基金

2+阅读 · 2015年12月31日

自检测型量子密钥分配研究

国家自然科学基金

0+阅读 · 2014年12月31日

复杂需求场景驱动的软件安全防护模型检测技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员