Nowadays, success of financial organizations heavily depends on their ability to process digital traces generated by their clients, e.g., transaction histories, gathered from various sources to improve user modeling pipelines. As general-purpose LLMs struggle with time-distributed tabular data, production stacks still depend on specialized tabular and sequence models with limited transferability and need for labeled data. To address this, we introduce FinTRACE, a retrieval-first architecture that converts raw transactions into reusable feature representations, applies rule-based detectors, and stores the resulting signals in a behavioral knowledge base with graded associations to the objectives of downstream tasks. Across public and industrial benchmarks, FinTRACE substantially improves low-supervision transaction analytics, doubling zero-shot MCC on churn prediction performance from 0.19 to 0.38 and improving 16-shot MCC from 0.25 to 0.40. We further use FinTRACE to ground LLMs via instruction tuning on retrieved behavioral patterns, achieving state-of-the-art LLM results on transaction analytics problems.


翻译:如今,金融机构的成功在很大程度上取决于其处理客户数字痕迹的能力,例如从不同来源收集的交易历史,以优化用户建模流程。由于通用大语言模型难以处理时间分布的表格数据,生产系统仍依赖于可迁移性有限且需要标注数据的专用表格与序列模型。为解决这一问题,我们提出了FinTRACE——一种检索优先的架构,该架构将原始交易转化为可复用的特征表示,应用基于规则的检测器,并将生成的信号存储于行为知识库中,同时建立与下游任务目标的分级关联。在公开及工业基准测试中,FinTRACE显著提升了低监督条件下的交易分析性能:在流失预测任务中,零样本马修斯相关系数从0.19提升至0.38(实现翻倍),16样本马修斯相关系数从0.25提升至0.40。我们进一步利用FinTRACE,通过对检索到的行为模式进行指令微调来增强大语言模型的推理基础,从而在交易分析问题上实现了当前最优的大语言模型性能。

0
下载
关闭预览

相关内容

在社会经济生活,银行、证券或保险业者从市场主体募集资金,并投资给其它市场主体的经济活动。
金融业数据应用发展报告(2024—2025年)
专知会员服务
17+阅读 · 2月5日
AI 参考架构及其在金融行业的应用,IBM12页pdf
专知会员服务
54+阅读 · 2022年3月23日
专知会员服务
146+阅读 · 2020年8月21日
【综述】金融领域中的深度学习,附52页论文下载
专知会员服务
165+阅读 · 2020年2月27日
金融领域自然语言处理研究资源大列表
专知
13+阅读 · 2020年2月27日
深度学习在金融文本情感分类中的应用
AI前线
36+阅读 · 2019年1月12日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
12+阅读 · 2023年9月21日
VIP会员
最新内容
基于声学的无人机检测技术综述
专知会员服务
1+阅读 · 15分钟前
《当代混合战争分析框架:俄乌战争经验教训》
专知会员服务
1+阅读 · 41分钟前
战略前沿人工智能的再思考(中文)
专知会员服务
7+阅读 · 5月29日
《量化地基防空系统间接效应的博弈论方法》
专知会员服务
5+阅读 · 5月29日
“史诗怒火行动”中美军损失的作战飞机
专知会员服务
5+阅读 · 5月29日
ICML 2026 | 理解上下文持续学习中的泛化与遗忘
专知会员服务
5+阅读 · 5月28日
Agent Harness综述:大模型智能体执行器工程全景
专知会员服务
15+阅读 · 5月28日
相关VIP内容
金融业数据应用发展报告(2024—2025年)
专知会员服务
17+阅读 · 2月5日
AI 参考架构及其在金融行业的应用,IBM12页pdf
专知会员服务
54+阅读 · 2022年3月23日
专知会员服务
146+阅读 · 2020年8月21日
【综述】金融领域中的深度学习,附52页论文下载
专知会员服务
165+阅读 · 2020年2月27日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员