FiMI: A Domain-Specific Language Model for Indian Finance Ecosystem - 专知论文

会员服务 ·

0

金融 · 系统 · 基 · 工具 · 基准 ·

FiMI: A Domain-Specific Language Model for Indian Finance Ecosystem

翻译：FiMI：面向印度金融生态系统的领域专用语言模型

Aboli Kathar,Aman Kumar,Anusha Kamath,Araveeti Srujan,Ashish Sharma,Chandra Bhushan,Dilip Asbe,Divya Sorate,Duddu Prasanth Kumar,Evan Acharya,Harsh Sharma,Hrithik Kadam,Kanishk Singla,Keyur Doshi,Kiran Praveen,Kolisetty Krishna SK,Krishanu Adhikary,Lokesh MPT,Mayurdeep Sonowal,Nadeem Shaikh,Navya Prakash,Nimit Kothari,Nitin Kukreja,Prashant Devadiga,Rakesh Paul,Ratanjeet Pratap Chauhan,Raunak Kalani,Raviraj Joshi,Shamanth MH,Shantanu Pandey,Shubham Soni,Siddharth Dixit,Smriti Jopat,Sunil Patel,Suraj Singh,Suvradip Paul,Tulasi Pilla,Utkarsh Vaidya,Vineeth Nambiar,Vishal Kanvaty,Yatharth Dedhia

We present FiMI (Finance Model for India), a domain-specialized financial language model developed for Indian digital payment systems. We develop two model variants: FiMI Base and FiMI Instruct. FiMI adapts the Mistral Small 24B architecture through a multi-stage training pipeline, beginning with continuous pre-training on 68 Billion tokens of curated financial, multilingual (English, Hindi, Hinglish), and synthetic data. This is followed by instruction fine-tuning and domain-specific supervised fine-tuning focused on multi-turn, tool-driven conversations that model real-world workflows, such as transaction disputes and mandate lifecycle management. Evaluations reveal that FiMI Base achieves a 20% improvement over the Mistral Small 24B Base model on finance reasoning benchmark, while FiMI Instruct outperforms the Mistral Small 24B Instruct model by 87% on domain-specific tool-calling. Moreover, FiMI achieves these significant domain gains while maintaining comparable performance to models of similar size on general benchmarks.

翻译：本文提出FiMI（面向印度的金融模型），这是一种为印度数字支付系统开发的领域专用金融语言模型。我们开发了两个模型变体：FiMI Base 和 FiMI Instruct。FiMI 基于 Mistral Small 24B 架构，通过多阶段训练流程进行适配。该流程始于对 680 亿个经过筛选的金融、多语言（英语、印地语、印英混合语）以及合成数据标记的持续预训练。随后进行指令微调和领域特定的监督微调，重点关注多轮次、工具驱动的对话，以模拟现实世界的工作流程，例如交易纠纷和授权生命周期管理。评估结果表明，在金融推理基准测试中，FiMI Base 相较于 Mistral Small 24B Base 模型实现了 20% 的性能提升；而在领域特定的工具调用任务上，FiMI Instruct 比 Mistral Small 24B Instruct 模型高出 87%。此外，FiMI 在取得这些显著领域性能提升的同时，在通用基准测试上仍保持了与同规模模型相当的性能。

0

相关内容

在社会经济生活，银行、证券或保险业者从市场主体募集资金，并投资给其它市场主体的经济活动。

多模态金融基础模型（MFFMs）：进展、前景与挑战

多模态金融基础模型（MFFMs）：进展、前景与挑战

专知会员服务

19+阅读 · 2025年6月8日

在大语言模型（LLM）、多模态大语言模型（MLLM）及其他领域中的模型融合：方法、理论、应用与机遇

在大语言模型（LLM）、多模态大语言模型（MLLM）及其他领域中的模型融合：方法、理论、应用与机遇

专知会员服务

63+阅读 · 2024年8月15日

大模型如何用于金融？普林斯顿《大规模语言模型在金融应用中的综述：进展、前景与挑战》

大模型如何用于金融？普林斯顿《大规模语言模型在金融应用中的综述：进展、前景与挑战》

专知会员服务

37+阅读 · 2024年6月20日

大模型在金融领域的应用技术与安全白皮书2024

大模型在金融领域的应用技术与安全白皮书2024

专知会员服务

60+阅读 · 2024年4月10日

金融领域大型语言模型综述（FinLLMs）

金融领域大型语言模型综述（FinLLMs）

专知会员服务

71+阅读 · 2024年2月6日

NLP+Diffusion=？UMN最新《NLP中的扩散模型》综述，全面阐述离散和嵌入扩散模型方法

NLP+Diffusion=？UMN最新《NLP中的扩散模型》综述，全面阐述离散和嵌入扩散模型方法

专知会员服务

54+阅读 · 2023年5月26日

《金融大数据术语》行业标准，24页pdf

《金融大数据术语》行业标准，24页pdf

专知会员服务

55+阅读 · 2022年2月28日

央行发布《金融大数据术语》，25页pdf

央行发布《金融大数据术语》，25页pdf

专知会员服务

43+阅读 · 2022年1月25日

【综述】金融领域中的深度学习，附52页论文下载

【综述】金融领域中的深度学习，附52页论文下载

专知会员服务

166+阅读 · 2020年2月27日

【论文推荐】将机器语言模型扩展到人类级别的语言理解，Extending Machine Language Models toward Human-Level Language Understanding

【论文推荐】将机器语言模型扩展到人类级别的语言理解，Extending Machine Language Models toward Human-Level Language Understanding

专知会员服务

18+阅读 · 2019年12月14日

什么是多模态ML？CMU-Paul Liang170页PPT讲述《多模态机器学习》，阐述多模态深度学习5大进展，附ppt与视频

什么是多模态ML？CMU-Paul Liang170页PPT讲述《多模态机器学习》，阐述多模态深度学习5大进展，附ppt与视频

专知

23+阅读 · 2022年4月12日

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知

15+阅读 · 2022年2月16日

悉尼科技操龙兵教授《金融人工智能》综述，40页pdf阐述金融AI挑战、技术与机会

悉尼科技操龙兵教授《金融人工智能》综述，40页pdf阐述金融AI挑战、技术与机会

专知

12+阅读 · 2021年10月9日

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

专知

41+阅读 · 2020年12月15日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

金融领域自然语言处理研究资源大列表

金融领域自然语言处理研究资源大列表

专知

13+阅读 · 2020年2月27日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

互联网金融中的交易反欺诈模型

互联网金融中的交易反欺诈模型

炼数成金订阅号

14+阅读 · 2018年3月9日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

知识不确定性度量的粒计算模型及其应用研究

国家自然科学基金

1+阅读 · 2017年12月31日

基于概率计算的大规模MIMO检测方法

国家自然科学基金

1+阅读 · 2015年12月31日

基于反射理论的信息驱动金融市场模型研究

国家自然科学基金

2+阅读 · 2015年12月31日

金融数学交叉融合项目

国家自然科学基金

0+阅读 · 2015年12月31日

正倒向随机微分方程与两类衍生模型的统计推断及金融中的应用

国家自然科学基金

2+阅读 · 2015年12月31日

大规模MIMO检测的理论性能分析和算法设计

国家自然科学基金

0+阅读 · 2015年12月31日

融合多源大数据的互联网金融个性化价值发现与风险评测

国家自然科学基金

2+阅读 · 2015年12月31日

互联网金融三维信任机制及参与者信任感知与交易决策

国家自然科学基金

0+阅读 · 2014年12月31日

基于网络传导的金融系统风险度量：理论及其应用

国家自然科学基金

2+阅读 · 2014年12月31日

高维度、非线性模型下的金融资产定价和风险定量计算

国家自然科学基金

1+阅读 · 2014年12月31日

FCMBench: The First Large-scale Financial Credit Multimodal Benchmark for Real-world Applications

Arxiv

0+阅读 · 3月13日

FinBloom: Knowledge Grounding Large Language Model with Real-time Financial Data

Arxiv

0+阅读 · 2月27日

Evaluation and Benchmarking Suite for Financial Large Language Models and Agents

Arxiv

0+阅读 · 2月22日

IndicEval: A Bilingual Indian Educational Evaluation Framework for Large Language Models

Arxiv

0+阅读 · 2月18日

Designing Production-Scale OCR for India: Multilingual and Domain-Specific Systems

Arxiv

0+阅读 · 2月18日

MEME: Modeling the Evolutionary Modes of Financial Markets

Arxiv

0+阅读 · 2月12日

The CLEF-2026 FinMMEval Lab: Multilingual and Multimodal Evaluation of Financial AI Systems

Arxiv

0+阅读 · 2月11日

Fin-R1: A Large Language Model for Financial Reasoning through Reinforcement Learning

Arxiv

0+阅读 · 2月5日

FinCoT: Grounding Chain-of-Thought in Expert Financial Reasoning

Arxiv

0+阅读 · 2月2日

Ebisu: Benchmarking Large Language Models in Japanese Finance

Arxiv

0+阅读 · 2月1日

VIP会员

文章信息

相关主题

最新内容

《无人机对海面作战影响评估》

《无人机对海面作战影响评估》

专知会员服务

1+阅读 · 今天15:30

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

专知会员服务

2+阅读 · 今天15:27

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

专知会员服务

0+阅读 · 今天15:00

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

专知会员服务

0+阅读 · 今天14:55

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

专知会员服务

1+阅读 · 今天8:28

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

4+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

6+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

6+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

6+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

4+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

7+阅读 · 7月20日

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

专知会员服务

7+阅读 · 7月20日

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

14+阅读 · 7月19日

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

7+阅读 · 7月19日

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

10+阅读 · 7月19日

相关VIP内容

多模态金融基础模型（MFFMs）：进展、前景与挑战

多模态金融基础模型（MFFMs）：进展、前景与挑战

专知会员服务

19+阅读 · 2025年6月8日

在大语言模型（LLM）、多模态大语言模型（MLLM）及其他领域中的模型融合：方法、理论、应用与机遇

在大语言模型（LLM）、多模态大语言模型（MLLM）及其他领域中的模型融合：方法、理论、应用与机遇

专知会员服务

63+阅读 · 2024年8月15日

大模型如何用于金融？普林斯顿《大规模语言模型在金融应用中的综述：进展、前景与挑战》

大模型如何用于金融？普林斯顿《大规模语言模型在金融应用中的综述：进展、前景与挑战》

专知会员服务

37+阅读 · 2024年6月20日

大模型在金融领域的应用技术与安全白皮书2024

大模型在金融领域的应用技术与安全白皮书2024

专知会员服务

60+阅读 · 2024年4月10日

金融领域大型语言模型综述（FinLLMs）

金融领域大型语言模型综述（FinLLMs）

专知会员服务

71+阅读 · 2024年2月6日

NLP+Diffusion=？UMN最新《NLP中的扩散模型》综述，全面阐述离散和嵌入扩散模型方法

NLP+Diffusion=？UMN最新《NLP中的扩散模型》综述，全面阐述离散和嵌入扩散模型方法

专知会员服务

54+阅读 · 2023年5月26日

《金融大数据术语》行业标准，24页pdf

《金融大数据术语》行业标准，24页pdf

专知会员服务

55+阅读 · 2022年2月28日

央行发布《金融大数据术语》，25页pdf

央行发布《金融大数据术语》，25页pdf

专知会员服务

43+阅读 · 2022年1月25日

【综述】金融领域中的深度学习，附52页论文下载

【综述】金融领域中的深度学习，附52页论文下载

专知会员服务

166+阅读 · 2020年2月27日

【论文推荐】将机器语言模型扩展到人类级别的语言理解，Extending Machine Language Models toward Human-Level Language Understanding

【论文推荐】将机器语言模型扩展到人类级别的语言理解，Extending Machine Language Models toward Human-Level Language Understanding

专知会员服务

18+阅读 · 2019年12月14日

热门VIP内容

开通专知VIP会员享更多权益服务

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

《无人机对海面作战影响评估》

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

相关资讯

什么是多模态ML？CMU-Paul Liang170页PPT讲述《多模态机器学习》，阐述多模态深度学习5大进展，附ppt与视频

什么是多模态ML？CMU-Paul Liang170页PPT讲述《多模态机器学习》，阐述多模态深度学习5大进展，附ppt与视频

专知

23+阅读 · 2022年4月12日

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知

15+阅读 · 2022年2月16日

悉尼科技操龙兵教授《金融人工智能》综述，40页pdf阐述金融AI挑战、技术与机会

悉尼科技操龙兵教授《金融人工智能》综述，40页pdf阐述金融AI挑战、技术与机会

专知

12+阅读 · 2021年10月9日

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

专知

41+阅读 · 2020年12月15日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

金融领域自然语言处理研究资源大列表

金融领域自然语言处理研究资源大列表

专知

13+阅读 · 2020年2月27日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

互联网金融中的交易反欺诈模型

互联网金融中的交易反欺诈模型

炼数成金订阅号

14+阅读 · 2018年3月9日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

相关论文

FCMBench: The First Large-scale Financial Credit Multimodal Benchmark for Real-world Applications

Arxiv

0+阅读 · 3月13日

FinBloom: Knowledge Grounding Large Language Model with Real-time Financial Data

Arxiv

0+阅读 · 2月27日

Evaluation and Benchmarking Suite for Financial Large Language Models and Agents

Arxiv

0+阅读 · 2月22日

IndicEval: A Bilingual Indian Educational Evaluation Framework for Large Language Models

Arxiv

0+阅读 · 2月18日

Designing Production-Scale OCR for India: Multilingual and Domain-Specific Systems

Arxiv

0+阅读 · 2月18日

MEME: Modeling the Evolutionary Modes of Financial Markets

Arxiv

0+阅读 · 2月12日

The CLEF-2026 FinMMEval Lab: Multilingual and Multimodal Evaluation of Financial AI Systems

Arxiv

0+阅读 · 2月11日

Fin-R1: A Large Language Model for Financial Reasoning through Reinforcement Learning

Arxiv

0+阅读 · 2月5日

FinCoT: Grounding Chain-of-Thought in Expert Financial Reasoning

Arxiv

0+阅读 · 2月2日

Ebisu: Benchmarking Large Language Models in Japanese Finance

Arxiv

0+阅读 · 2月1日

相关基金

知识不确定性度量的粒计算模型及其应用研究

国家自然科学基金

1+阅读 · 2017年12月31日

基于概率计算的大规模MIMO检测方法

国家自然科学基金

1+阅读 · 2015年12月31日

基于反射理论的信息驱动金融市场模型研究

国家自然科学基金

2+阅读 · 2015年12月31日

金融数学交叉融合项目

国家自然科学基金

0+阅读 · 2015年12月31日

正倒向随机微分方程与两类衍生模型的统计推断及金融中的应用

国家自然科学基金

2+阅读 · 2015年12月31日

大规模MIMO检测的理论性能分析和算法设计

国家自然科学基金

0+阅读 · 2015年12月31日

融合多源大数据的互联网金融个性化价值发现与风险评测

国家自然科学基金

2+阅读 · 2015年12月31日

互联网金融三维信任机制及参与者信任感知与交易决策

国家自然科学基金

0+阅读 · 2014年12月31日

基于网络传导的金融系统风险度量：理论及其应用

国家自然科学基金

2+阅读 · 2014年12月31日

高维度、非线性模型下的金融资产定价和风险定量计算

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员