Illicit financial activities such as money laundering often manifest through recurrent topological patterns in transaction networks. Detecting these patterns automatically remains challenging due to the scarcity of labeled real-world data and strict privacy constraints. To address this, we investigate whether Graph Autoencoders (GAEs) can effectively learn and distinguish topological patterns that mimic money laundering operations when trained on synthetic data. The analysis consists of two phases: (i) data generation, where synthetic samples are created for seven well-known illicit activity patterns using parametrized generators that preserve structural consistency while introducing realistic variability; and (ii) model training and validation, where separate GAEs are trained on each pattern without explicit labels, relying solely on reconstruction error as an indicator of learned structure. We compare three GAE implementations based on three distinct convolutional layers: Graph Convolutional (GAE-GCN), GraphSAGE (GAE-SAGE), and Graph Attention Network (GAE-GAT). Experimental results show that GAE-GCN achieves the most consistent reconstruction performance across patterns, while GAE-SAGE and GAE-GAT exhibit competitive results only in few specific patterns. These findings suggest that graph-based representation learning on synthetic data provides a viable path toward developing AI-driven tools for detecting illicit behaviors, overcoming the limitations of financial datasets.


翻译:洗钱等非法金融活动通常通过交易网络中反复出现的拓扑模式显现。由于现实世界标注数据的稀缺性以及严格的隐私限制,自动检测这些模式仍然具有挑战性。为此,我们研究了图自编码器(GAE)在合成数据上训练时,能否有效学习并区分模拟洗钱操作的拓扑模式。分析包含两个阶段:(i)数据生成阶段,使用参数化生成器为七种已知的非法活动模式创建合成样本,这些生成器在保持结构一致性的同时引入了真实的变异性;(ii)模型训练与验证阶段,针对每种模式分别训练独立的GAE模型,无需显式标签,仅依靠重构误差作为学习结构的指标。我们比较了基于三种不同卷积层的GAE实现:图卷积(GAE-GCN)、GraphSAGE(GAE-SAGE)和图注意力网络(GAE-GAT)。实验结果表明,GAE-GCN在所有模式中实现了最一致的重构性能,而GAE-SAGE和GAE-GAT仅在少数特定模式中表现出有竞争力的结果。这些发现表明,基于合成数据的图表示学习为开发用于检测非法行为的人工智能驱动工具提供了一条可行路径,从而克服了金融数据集的局限性。

0
下载
关闭预览

相关内容

图神经网络在金融欺诈检测中的应用综述
专知会员服务
28+阅读 · 2024年11月22日
【港科大博士论文】生成模型的统计和结构特性,338页pdf
专知会员服务
47+阅读 · 2022年12月20日
图异常检测在金融反欺诈中的应用研究进展
专知会员服务
50+阅读 · 2022年11月20日
专知会员服务
37+阅读 · 2021年10月16日
一文看懂AutoEncoder模型演进图谱
AINLP
12+阅读 · 2019年6月17日
Self-Attention GAN 中的 self-attention 机制
PaperWeekly
12+阅读 · 2019年3月6日
【干货】深入理解变分自编码器
专知
21+阅读 · 2018年3月22日
【干货】深入理解自编码器(附代码实现)
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
VIP会员
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员