Financial Transaction Retrieval and Contextual Evidence for Knowledge-Grounded Reasoning - 专知论文

会员服务 ·

0

金融 · 知识 · 语言模型 · 情境 · 知识驱动 ·

Financial Transaction Retrieval and Contextual Evidence for Knowledge-Grounded Reasoning

翻译：金融交易检索与情境证据：面向知识驱动推理的研究

Artem Sakhno,Daniil Tomilov,Yuliana Shakhvalieva,Inessa Fedorova,Daria Ruzanova,Omar Zoloev,Andrey Savchenko,Maksim Makarenko

Nowadays, success of financial organizations heavily depends on their ability to process digital traces generated by their clients, e.g., transaction histories, gathered from various sources to improve user modeling pipelines. As general-purpose LLMs struggle with time-distributed tabular data, production stacks still depend on specialized tabular and sequence models with limited transferability and need for labeled data. To address this, we introduce FinTRACE, a retrieval-first architecture that converts raw transactions into reusable feature representations, applies rule-based detectors, and stores the resulting signals in a behavioral knowledge base with graded associations to the objectives of downstream tasks. Across public and industrial benchmarks, FinTRACE substantially improves low-supervision transaction analytics, doubling zero-shot MCC on churn prediction performance from 0.19 to 0.38 and improving 16-shot MCC from 0.25 to 0.40. We further use FinTRACE to ground LLMs via instruction tuning on retrieved behavioral patterns, achieving state-of-the-art LLM results on transaction analytics problems.

翻译：如今，金融机构的成功在很大程度上取决于其处理客户数字痕迹的能力，例如从不同来源收集的交易历史，以优化用户建模流程。由于通用大语言模型难以处理时间分布的表格数据，生产系统仍依赖于可迁移性有限且需要标注数据的专用表格与序列模型。为解决这一问题，我们提出了FinTRACE——一种检索优先的架构，该架构将原始交易转化为可复用的特征表示，应用基于规则的检测器，并将生成的信号存储于行为知识库中，同时建立与下游任务目标的分级关联。在公开及工业基准测试中，FinTRACE显著提升了低监督条件下的交易分析性能：在流失预测任务中，零样本马修斯相关系数从0.19提升至0.38（实现翻倍），16样本马修斯相关系数从0.25提升至0.40。我们进一步利用FinTRACE，通过对检索到的行为模式进行指令微调来增强大语言模型的推理基础，从而在交易分析问题上实现了当前最优的大语言模型性能。

0

相关内容

在社会经济生活，银行、证券或保险业者从市场主体募集资金，并投资给其它市场主体的经济活动。

金融业数据应用发展报告（2024—2025年）

金融业数据应用发展报告（2024—2025年）

专知会员服务

17+阅读 · 2月5日

大模型如何用于金融？普林斯顿《大规模语言模型在金融应用中的综述：进展、前景与挑战》

大模型如何用于金融？普林斯顿《大规模语言模型在金融应用中的综述：进展、前景与挑战》

专知会员服务

37+阅读 · 2024年6月20日

【牛津大学博士论文】基于数据驱动的金融时间序列模拟和预测方法，238页pdf

【牛津大学博士论文】基于数据驱动的金融时间序列模拟和预测方法，238页pdf

专知会员服务

62+阅读 · 2023年9月4日

哥伦比亚大学最新博士论文《机器学习在金融市场中的应用》Essays on the Applications of Machine Learning in Financial Markets

哥伦比亚大学最新博士论文《机器学习在金融市场中的应用》Essays on the Applications of Machine Learning in Financial Markets

专知会员服务

28+阅读 · 2022年4月8日

【开放书】《经济与金融数据科学》，357页pdf，欧盟委员会联合研究中心，Data Science for Economics and Finance

【开放书】《经济与金融数据科学》，357页pdf，欧盟委员会联合研究中心，Data Science for Economics and Finance

专知会员服务

42+阅读 · 2022年3月24日

AI 参考架构及其在金融行业的应用，IBM12页pdf

AI 参考架构及其在金融行业的应用，IBM12页pdf

专知会员服务

54+阅读 · 2022年3月23日

最近《金融知识图谱构建》论文，79页pdf

专知会员服务

146+阅读 · 2020年8月21日

【综述】金融领域中的深度学习，附52页论文下载

【综述】金融领域中的深度学习，附52页论文下载

专知会员服务

165+阅读 · 2020年2月27日

【金融强化学习论文】金融资产组合管理问题的深度强化学习框架（A Deep Reinforcement Learning Framework for theFinancial Portfolio Management Problem）

【金融强化学习论文】金融资产组合管理问题的深度强化学习框架（A Deep Reinforcement Learning Framework for theFinancial Portfolio Management Problem）

专知会员服务

55+阅读 · 2019年12月16日

金融大数据平台建设实践，深圳证券信息有限公司数据中心张俊总监，第八届全国社会媒体处理大会SMP2019

金融大数据平台建设实践，深圳证券信息有限公司数据中心张俊总监，第八届全国社会媒体处理大会SMP2019

专知会员服务

38+阅读 · 2019年10月24日

【2022新书】机器学习在金融时间序列分析与预测中的应用，385页pdf

【2022新书】机器学习在金融时间序列分析与预测中的应用，385页pdf

专知

14+阅读 · 2022年11月12日

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

专知

41+阅读 · 2020年12月15日

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

专知

11+阅读 · 2020年8月28日

金融领域自然语言处理研究资源大列表

金融领域自然语言处理研究资源大列表

专知

13+阅读 · 2020年2月27日

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

AINLP

75+阅读 · 2020年1月14日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

【联邦学习】联邦学习的研究及应用、联邦学习的多种可能性

【联邦学习】联邦学习的研究及应用、联邦学习的多种可能性

产业智能官

30+阅读 · 2019年5月24日

NLP博士答辩41页PPT，面向自然语言处理的神经网络迁移学习

NLP博士答辩41页PPT，面向自然语言处理的神经网络迁移学习

新智元

30+阅读 · 2019年3月1日

深度学习在金融文本情感分类中的应用

深度学习在金融文本情感分类中的应用

AI前线

36+阅读 · 2019年1月12日

知识提取的一种应用，从上市公司年报中抽取因果关系

知识提取的一种应用，从上市公司年报中抽取因果关系

文因互联

10+阅读 · 2017年7月7日

面向金融市场走势预测的在线论坛公众情绪挖掘与演化分析算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

量质融合的移动轨迹相似性查询技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于反射理论的信息驱动金融市场模型研究

国家自然科学基金

2+阅读 · 2015年12月31日

金融数学交叉融合项目

国家自然科学基金

0+阅读 · 2015年12月31日

面向DS证据理论的关联信息融合研究

国家自然科学基金

4+阅读 · 2015年12月31日

大数据环境下的证券市场操纵行为发现机理、模型与方法

国家自然科学基金

0+阅读 · 2015年12月31日

融合多源大数据的互联网金融个性化价值发现与风险评测

国家自然科学基金

2+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

上市公司文本信息分析研究：基于大数据的视角

国家自然科学基金

8+阅读 · 2014年12月31日

网络用户隐私担忧与主动性泄露隐私信息之间的悖论：理论探索和基于社交网络的实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

Retrieval-Augmented Reasoning for Chartered Accountancy

Arxiv

0+阅读 · 4月30日

FinCARDS: Card-Based Analyst Reranking for Financial Document Question Answering

Arxiv

0+阅读 · 4月30日

FinTrace: Holistic Trajectory-Level Evaluation of LLM Tool Calling for Long-Horizon Financial Tasks

Arxiv

0+阅读 · 4月15日

Eliciting Medical Reasoning with Knowledge-enhanced Data Synthesis: A Semi-Supervised Reinforcement Learning Approach

Arxiv

0+阅读 · 4月13日

FinTradeBench: A Financial Reasoning Benchmark for LLMs

Arxiv

0+阅读 · 3月20日

Fin-R1: A Large Language Model for Financial Reasoning through Reinforcement Learning

Arxiv

0+阅读 · 3月19日

Streaming REST APIs for Large Financial Transaction Exports from Relational Databases

Arxiv

0+阅读 · 3月13日

Beyond Rows to Reasoning: Agentic Retrieval for Multimodal Spreadsheet Understanding and Editing

Arxiv

0+阅读 · 3月6日

Towards Efficient and Generalizable Retrieval: Adaptive Semantic Quantization and Residual Knowledge Transfer

Arxiv

0+阅读 · 2月27日

A Comprehensive Review on Financial Explainable AI

Arxiv

12+阅读 · 2023年9月21日

VIP会员

文章信息

相关主题

最新内容

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

专知会员服务

8+阅读 · 7月16日

《无人地面战车（UGV）的崛起》报告

《无人地面战车（UGV）的崛起》报告

专知会员服务

5+阅读 · 7月16日

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

专知会员服务

5+阅读 · 7月16日

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

专知会员服务

8+阅读 · 7月16日

美陆军任务式指挥人工智能解决方案

美陆军任务式指挥人工智能解决方案

专知会员服务

7+阅读 · 7月16日

ICML 2026 | 理论级自动形式化：从孤立命题到统一形式化知识库

ICML 2026 | 理论级自动形式化：从孤立命题到统一形式化知识库

专知会员服务

5+阅读 · 7月16日

综述 | 现代智能体自我改进，从模型更新到脚手架演化

综述 | 现代智能体自我改进，从模型更新到脚手架演化

专知会员服务

8+阅读 · 7月16日

美国陆军宣布“项目融合-顶点6”：现代化进程的关键里程碑

美国陆军宣布“项目融合-顶点6”：现代化进程的关键里程碑

专知会员服务

12+阅读 · 7月15日

五角大楼新版反无人机手册：内容解析与战略影响（附手册100页原件）

五角大楼新版反无人机手册：内容解析与战略影响（附手册100页原件）

专知会员服务

14+阅读 · 7月15日

《军事基地能源韧性与经济性权衡评估方法研究》

《军事基地能源韧性与经济性权衡评估方法研究》

专知会员服务

7+阅读 · 7月15日

ACM MM 2026 | UNIT：释放大语言模型在图持续学习中的潜力

ACM MM 2026 | UNIT：释放大语言模型在图持续学习中的潜力

专知会员服务

8+阅读 · 7月15日

综述 | 具身视觉语言导航：系统综述与真实世界评测

综述 | 具身视觉语言导航：系统综述与真实世界评测

专知会员服务

10+阅读 · 7月15日

应对第1、2类无人机威胁的推荐战术、技术与程序

应对第1、2类无人机威胁的推荐战术、技术与程序

专知会员服务

10+阅读 · 7月15日

《反制多无人机集群攻城：序贯斯塔克伯格安全博弈方法研究》59页

《反制多无人机集群攻城：序贯斯塔克伯格安全博弈方法研究》59页

专知会员服务

11+阅读 · 7月15日

博士论文 | 可扩展、自我改进的大语言模型智能体

博士论文 | 可扩展、自我改进的大语言模型智能体

专知会员服务

12+阅读 · 7月14日

相关VIP内容

金融业数据应用发展报告（2024—2025年）

金融业数据应用发展报告（2024—2025年）

专知会员服务

17+阅读 · 2月5日

大模型如何用于金融？普林斯顿《大规模语言模型在金融应用中的综述：进展、前景与挑战》

大模型如何用于金融？普林斯顿《大规模语言模型在金融应用中的综述：进展、前景与挑战》

专知会员服务

37+阅读 · 2024年6月20日

【牛津大学博士论文】基于数据驱动的金融时间序列模拟和预测方法，238页pdf

【牛津大学博士论文】基于数据驱动的金融时间序列模拟和预测方法，238页pdf

专知会员服务

62+阅读 · 2023年9月4日

哥伦比亚大学最新博士论文《机器学习在金融市场中的应用》Essays on the Applications of Machine Learning in Financial Markets

哥伦比亚大学最新博士论文《机器学习在金融市场中的应用》Essays on the Applications of Machine Learning in Financial Markets

专知会员服务

28+阅读 · 2022年4月8日

【开放书】《经济与金融数据科学》，357页pdf，欧盟委员会联合研究中心，Data Science for Economics and Finance

【开放书】《经济与金融数据科学》，357页pdf，欧盟委员会联合研究中心，Data Science for Economics and Finance

专知会员服务

42+阅读 · 2022年3月24日

AI 参考架构及其在金融行业的应用，IBM12页pdf

AI 参考架构及其在金融行业的应用，IBM12页pdf

专知会员服务

54+阅读 · 2022年3月23日

最近《金融知识图谱构建》论文，79页pdf

专知会员服务

146+阅读 · 2020年8月21日

【综述】金融领域中的深度学习，附52页论文下载

【综述】金融领域中的深度学习，附52页论文下载

专知会员服务

165+阅读 · 2020年2月27日

【金融强化学习论文】金融资产组合管理问题的深度强化学习框架（A Deep Reinforcement Learning Framework for theFinancial Portfolio Management Problem）

【金融强化学习论文】金融资产组合管理问题的深度强化学习框架（A Deep Reinforcement Learning Framework for theFinancial Portfolio Management Problem）

专知会员服务

55+阅读 · 2019年12月16日

金融大数据平台建设实践，深圳证券信息有限公司数据中心张俊总监，第八届全国社会媒体处理大会SMP2019

金融大数据平台建设实践，深圳证券信息有限公司数据中心张俊总监，第八届全国社会媒体处理大会SMP2019

专知会员服务

38+阅读 · 2019年10月24日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人地面战车（UGV）的崛起》报告

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

相关资讯

【2022新书】机器学习在金融时间序列分析与预测中的应用，385页pdf

【2022新书】机器学习在金融时间序列分析与预测中的应用，385页pdf

专知

14+阅读 · 2022年11月12日

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

专知

41+阅读 · 2020年12月15日

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

专知

11+阅读 · 2020年8月28日

金融领域自然语言处理研究资源大列表

金融领域自然语言处理研究资源大列表

专知

13+阅读 · 2020年2月27日

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

AINLP

75+阅读 · 2020年1月14日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

【联邦学习】联邦学习的研究及应用、联邦学习的多种可能性

【联邦学习】联邦学习的研究及应用、联邦学习的多种可能性

产业智能官

30+阅读 · 2019年5月24日

NLP博士答辩41页PPT，面向自然语言处理的神经网络迁移学习

NLP博士答辩41页PPT，面向自然语言处理的神经网络迁移学习

新智元

30+阅读 · 2019年3月1日

深度学习在金融文本情感分类中的应用

深度学习在金融文本情感分类中的应用

AI前线

36+阅读 · 2019年1月12日

知识提取的一种应用，从上市公司年报中抽取因果关系

知识提取的一种应用，从上市公司年报中抽取因果关系

文因互联

10+阅读 · 2017年7月7日

相关论文

Retrieval-Augmented Reasoning for Chartered Accountancy

Arxiv

0+阅读 · 4月30日

FinCARDS: Card-Based Analyst Reranking for Financial Document Question Answering

Arxiv

0+阅读 · 4月30日

FinTrace: Holistic Trajectory-Level Evaluation of LLM Tool Calling for Long-Horizon Financial Tasks

Arxiv

0+阅读 · 4月15日

Eliciting Medical Reasoning with Knowledge-enhanced Data Synthesis: A Semi-Supervised Reinforcement Learning Approach

Arxiv

0+阅读 · 4月13日

FinTradeBench: A Financial Reasoning Benchmark for LLMs

Arxiv

0+阅读 · 3月20日

Fin-R1: A Large Language Model for Financial Reasoning through Reinforcement Learning

Arxiv

0+阅读 · 3月19日

Streaming REST APIs for Large Financial Transaction Exports from Relational Databases

Arxiv

0+阅读 · 3月13日

Beyond Rows to Reasoning: Agentic Retrieval for Multimodal Spreadsheet Understanding and Editing

Arxiv

0+阅读 · 3月6日

Towards Efficient and Generalizable Retrieval: Adaptive Semantic Quantization and Residual Knowledge Transfer

Arxiv

0+阅读 · 2月27日

A Comprehensive Review on Financial Explainable AI

Arxiv

12+阅读 · 2023年9月21日

相关基金

面向金融市场走势预测的在线论坛公众情绪挖掘与演化分析算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

量质融合的移动轨迹相似性查询技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于反射理论的信息驱动金融市场模型研究

国家自然科学基金

2+阅读 · 2015年12月31日

金融数学交叉融合项目

国家自然科学基金

0+阅读 · 2015年12月31日

面向DS证据理论的关联信息融合研究

国家自然科学基金

4+阅读 · 2015年12月31日

大数据环境下的证券市场操纵行为发现机理、模型与方法

国家自然科学基金

0+阅读 · 2015年12月31日

融合多源大数据的互联网金融个性化价值发现与风险评测

国家自然科学基金

2+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

上市公司文本信息分析研究：基于大数据的视角

国家自然科学基金

8+阅读 · 2014年12月31日

网络用户隐私担忧与主动性泄露隐私信息之间的悖论：理论探索和基于社交网络的实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员