Addressing class imbalance is a central challenge in credit card fraud detection, as it directly impacts predictive reliability in real-world financial systems. To overcome this, the study proposes an enhanced workflow based on the Explainable Boosting Machine (EBM)-a transparent, state-of-the-art implementation of the GA2M algorithm-optimized through systematic hyperparameter tuning, feature selection, and preprocessing refinement. Rather than relying on conventional sampling techniques that may introduce bias or cause information loss, the optimized EBM achieves an effective balance between accuracy and interpretability, enabling precise detection of fraudulent transactions while providing actionable insights into feature importance and interaction effects. Furthermore, the Taguchi method is employed to optimize both the sequence of data scalers and model hyperparameters, ensuring robust, reproducible, and systematically validated performance improvements. Experimental evaluation on benchmark credit card data yields an ROC-AUC of 0.983, surpassing prior EBM baselines (0.975) and outperforming Logistic Regression, Random Forest, XGBoost, and Decision Tree models. These results highlight the potential of interpretable machine learning and data-driven optimization for advancing trustworthy fraud analytics in financial systems.


翻译:类别不平衡是信用卡欺诈检测中的一个核心挑战,因为它直接影响现实世界金融系统中的预测可靠性。为克服此问题,本研究提出了一种基于可解释提升机(EBM)——GA2M算法的一种透明、先进的实现——的增强工作流程,并通过系统化的超参数调优、特征选择与预处理优化进行改进。该方法不依赖可能引入偏差或导致信息损失的传统采样技术,而是通过优化的EBM在准确性与可解释性之间实现了有效平衡,既能精确检测欺诈交易,又能提供关于特征重要性和交互效应的可操作见解。此外,研究采用田口方法对数据缩放器序列与模型超参数进行协同优化,确保了稳健、可复现且经过系统验证的性能提升。在基准信用卡数据集上的实验评估获得了0.983的ROC-AUC值,超越了先前的EBM基线(0.975),并优于逻辑回归、随机森林、XGBoost和决策树模型。这些结果凸显了可解释机器学习与数据驱动优化在推进金融系统可信欺诈分析方面的潜力。

0
下载
关闭预览

相关内容

DGP双粒度提示框架:图增强大模型助力欺诈检测
专知会员服务
9+阅读 · 2025年8月17日
基于深度学习的伪装目标检测研究进展
专知会员服务
30+阅读 · 2025年4月12日
图神经网络在金融欺诈检测中的应用综述
专知会员服务
28+阅读 · 2024年11月22日
卡尔曼滤波在装备故障预测中的应用综述
专知会员服务
12+阅读 · 2024年9月27日
检索增强生成系统中的可信度:综述
专知会员服务
43+阅读 · 2024年9月18日
图异常检测在金融反欺诈中的应用研究进展
专知会员服务
50+阅读 · 2022年11月20日
专知会员服务
34+阅读 · 2021年9月16日
可解释强化学习,Explainable Reinforcement Learning: A Survey
专知会员服务
132+阅读 · 2020年5月14日
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
浅谈最广泛应用的金融风控算法-评分卡
凡人机器学习
10+阅读 · 2020年8月3日
【智能金融】机器学习在反欺诈中应用
产业智能官
35+阅读 · 2019年3月15日
智能时代如何构建金融反欺诈体系?
数据猿
12+阅读 · 2018年3月26日
基于机器学习的KPI自动化异常检测系统
运维帮
13+阅读 · 2017年8月16日
侦测欺诈交易(异常点检测)
GBASE数据工程部数据团队
20+阅读 · 2017年5月10日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
VIP会员
相关VIP内容
DGP双粒度提示框架:图增强大模型助力欺诈检测
专知会员服务
9+阅读 · 2025年8月17日
基于深度学习的伪装目标检测研究进展
专知会员服务
30+阅读 · 2025年4月12日
图神经网络在金融欺诈检测中的应用综述
专知会员服务
28+阅读 · 2024年11月22日
卡尔曼滤波在装备故障预测中的应用综述
专知会员服务
12+阅读 · 2024年9月27日
检索增强生成系统中的可信度:综述
专知会员服务
43+阅读 · 2024年9月18日
图异常检测在金融反欺诈中的应用研究进展
专知会员服务
50+阅读 · 2022年11月20日
专知会员服务
34+阅读 · 2021年9月16日
可解释强化学习,Explainable Reinforcement Learning: A Survey
专知会员服务
132+阅读 · 2020年5月14日
相关资讯
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
浅谈最广泛应用的金融风控算法-评分卡
凡人机器学习
10+阅读 · 2020年8月3日
【智能金融】机器学习在反欺诈中应用
产业智能官
35+阅读 · 2019年3月15日
智能时代如何构建金融反欺诈体系?
数据猿
12+阅读 · 2018年3月26日
基于机器学习的KPI自动化异常检测系统
运维帮
13+阅读 · 2017年8月16日
侦测欺诈交易(异常点检测)
GBASE数据工程部数据团队
20+阅读 · 2017年5月10日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员