Credit C-GPT: A Domain-Specialized Large Language Model for Conversational Understanding in Vietnamese Debt Collection - 专知论文

会员服务 ·

0

语言模型 · 标注 · 大语言模型 · 金融 · 交互 ·

Credit C-GPT: A Domain-Specialized Large Language Model for Conversational Understanding in Vietnamese Debt Collection

翻译：Credit C-GPT：面向越南债务催收场景对话理解的专业领域大语言模型

Nhung Nguyen Thi Hong,Cuong Nguyen Dang,Tri Le Ngoc

from arxiv, 8 pages, 0 figures, 3 tables. Preprint

Debt collection is a critical function within the banking, financial services, and insurance (BFSI) sector, relying heavily on large-scale human-to-human conversational interactions conducted primarily in Vietnamese contact centers. These conversations involve informal spoken language, emotional variability, and complex domain-specific reasoning, which pose significant challenges for traditional natural language processing systems. This paper introduces Credit C-GPT, a domain-specialized large language model with seven billion parameters, fine-tuned for conversational understanding in Vietnamese debt collection scenarios. The proposed model integrates multiple conversational intelligence tasks, including dialogue understanding, sentiment recognition, intent detection, call stage classification, and structured slot-value extraction, within a single reasoning-based framework. We describe the data construction process, annotation strategy, and training methodology, and evaluate the model on proprietary human-annotated datasets. Experimental results show consistent improvements over traditional pipeline-based approaches, indicating that domain-specialized conversational language models provide a scalable and privacy-aware solution for real-time assistance and post-call analytics in enterprise contact centers.

翻译：债务催收是银行、金融服务和保险（BFSI）领域的一项关键职能，其严重依赖于主要在越南呼叫中心进行的大规模人际对话交互。这些对话涉及非正式口语、情绪波动以及复杂的领域特定推理，对传统自然语言处理系统构成了重大挑战。本文介绍了Credit C-GPT，这是一个拥有七十亿参数的专业领域大语言模型，专门针对越南债务催收场景下的对话理解进行了微调。所提出的模型在一个基于推理的统一框架内，集成了多项对话智能任务，包括对话理解、情感识别、意图检测、通话阶段分类以及结构化槽值提取。我们描述了数据构建过程、标注策略和训练方法，并在专有的人工标注数据集上对模型进行了评估。实验结果表明，相较于传统的基于流水线的方法，该模型取得了持续的改进，这表明专业领域的对话语言模型为企业呼叫中心的实时辅助和通话后分析提供了一个可扩展且注重隐私的解决方案。

0

相关内容

语言模型

【UIUC博士论文】迈向可信的大型语言模型，312页pdf

【UIUC博士论文】迈向可信的大型语言模型，312页pdf

专知会员服务

41+阅读 · 2024年6月8日

金融领域大型语言模型综述（FinLLMs）

金融领域大型语言模型综述（FinLLMs）

专知会员服务

71+阅读 · 2024年2月6日

【博士论文】负责任大型语言模型:安全性、公平性、可信性，142页pdf

【博士论文】负责任大型语言模型:安全性、公平性、可信性，142页pdf

专知会员服务

34+阅读 · 2024年1月26日

大模型长上下文核心技术是什么？南大等《长上下文大型语言模型中的Transformer架构》综述

大模型长上下文核心技术是什么？南大等《长上下文大型语言模型中的Transformer架构》综述

专知会员服务

66+阅读 · 2023年11月22日

选用哪个GPT？华中科大等最新《大型GPT模型》综述，37页pdf详述关于语言、多模态及科学GPT模型

选用哪个GPT？华中科大等最新《大型GPT模型》综述，37页pdf详述关于语言、多模态及科学GPT模型

专知会员服务

99+阅读 · 2023年9月30日

大模型最权威课程！MIT最新《生成式AI-大模型》课程，MIT斯坦福OpenAI-DeepMind众多专家讲授

大模型最权威课程！MIT最新《生成式AI-大模型》课程，MIT斯坦福OpenAI-DeepMind众多专家讲授

专知会员服务

121+阅读 · 2023年5月26日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知会员服务

182+阅读 · 2023年4月4日

语言模型如何产品落地？《GPT-3:使用大型语言模型构建创新的NLP产品》新书带你实操，151页pdf

语言模型如何产品落地？《GPT-3:使用大型语言模型构建创新的NLP产品》新书带你实操，151页pdf

专知会员服务

120+阅读 · 2022年8月15日

南洋理工75页最新「深度学习对话系统」大综述论文，最全面概述深度学习对话技术进展

南洋理工75页最新「深度学习对话系统」大综述论文，最全面概述深度学习对话技术进展

专知会员服务

49+阅读 · 2021年5月16日

【GPT-3作者亲解】超大型语言模型少样本学习，109页ppt

【GPT-3作者亲解】超大型语言模型少样本学习，109页ppt

专知会员服务

110+阅读 · 2020年12月19日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

25+阅读 · 2023年4月4日

浅谈最广泛应用的金融风控算法-评分卡

浅谈最广泛应用的金融风控算法-评分卡

凡人机器学习

10+阅读 · 2020年8月3日

金融领域自然语言处理研究资源大列表

金融领域自然语言处理研究资源大列表

专知

13+阅读 · 2020年2月27日

【AAAI2020论文】用于视觉对话中深度视觉理解的自适应双向编码模型—DualVD, 中科院信工所于静等

【AAAI2020论文】用于视觉对话中深度视觉理解的自适应双向编码模型—DualVD, 中科院信工所于静等

专知

20+阅读 · 2019年11月24日

超越 BERT 和 GPT，微软亚洲研究院开源新模型 MASS！

超越 BERT 和 GPT，微软亚洲研究院开源新模型 MASS！

雷锋网

10+阅读 · 2019年6月27日

逆天语言模型GPT-2最新开源：345M预训练模型和1.5B参数都来了

逆天语言模型GPT-2最新开源：345M预训练模型和1.5B参数都来了

量子位

18+阅读 · 2019年5月4日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

干货 | 人工智能如何帮助银行反欺诈：来看看关于银行智能欺诈风险预测模型的研究

干货 | 人工智能如何帮助银行反欺诈：来看看关于银行智能欺诈风险预测模型的研究

AI100

11+阅读 · 2017年11月17日

【技术贴】面对无孔不入的黑产，如何搭建反欺诈策略与模型？

【技术贴】面对无孔不入的黑产，如何搭建反欺诈策略与模型？

互联网金融

10+阅读 · 2017年7月13日

基于反射理论的信息驱动金融市场模型研究

国家自然科学基金

2+阅读 · 2015年12月31日

云环境多用户的情景化动态信任决策模型及算法的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于大数据的互联网借贷平台价值研究

国家自然科学基金

3+阅读 · 2015年12月31日

信用大数据背景下的异源共享信息融合研究

国家自然科学基金

0+阅读 · 2015年12月31日

小微企业互联网平台融资模式研究—基于双向拍卖和信号博弈双重视角

国家自然科学基金

4+阅读 · 2015年12月31日

基于大数据的消费金融信用风险计量与管理

国家自然科学基金

3+阅读 · 2014年12月31日

信用期限制条件下具有资金约束的库存管理优化模型研究

国家自然科学基金

0+阅读 · 2014年12月31日

互联网金融三维信任机制及参与者信任感知与交易决策

国家自然科学基金

0+阅读 · 2014年12月31日

商业银行小微企业信贷中的信任研究

国家自然科学基金

2+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

Retrospective In-Context Learning for Temporal Credit Assignment with Large Language Models

Arxiv

0+阅读 · 2月19日

BankMathBench: A Benchmark for Numerical Reasoning in Banking Scenarios

Arxiv

0+阅读 · 2月19日

FinAuditing: A Financial Taxonomy-Structured Multi-Document Benchmark for Evaluating LLMs

Arxiv

0+阅读 · 2月19日

Towards EnergyGPT: A Large Language Model Specialized for the Energy Sector

Arxiv

0+阅读 · 2月7日

Fin-R1: A Large Language Model for Financial Reasoning through Reinforcement Learning

Arxiv

0+阅读 · 2月5日

CreditAudit: 2$^\text{nd}$ Dimension for LLM Evaluation and Selection

Arxiv

0+阅读 · 2月4日

Ebisu: Benchmarking Large Language Models in Japanese Finance

Arxiv

0+阅读 · 2月1日

TruthTensor: Evaluating LLMs Human Imitation through Prediction Market Drift and Holistic Reasoning

Arxiv

0+阅读 · 1月20日

A Model Fusion Approach for Enhancing Credit Approval Decision Making

Arxiv

0+阅读 · 1月19日

The Cost of Convenience: Identifying, Analyzing, and Mitigating Predatory Loan Applications on Android

Arxiv

0+阅读 · 1月19日

VIP会员

文章信息

相关主题

大语言模型

最新内容

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

4+阅读 · 今天8:00

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

2+阅读 · 今天7:44

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

2+阅读 · 今天7:28

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

3+阅读 · 今天7:18

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

专知会员服务

4+阅读 · 今天7:07

军事欺骗：供作战战术指挥官使用的工具

军事欺骗：供作战战术指挥官使用的工具

专知会员服务

3+阅读 · 今天7:03

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

4+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

5+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

10+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

4+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

5+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

8+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

7+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

4+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

相关VIP内容

【UIUC博士论文】迈向可信的大型语言模型，312页pdf

【UIUC博士论文】迈向可信的大型语言模型，312页pdf

专知会员服务

41+阅读 · 2024年6月8日

金融领域大型语言模型综述（FinLLMs）

金融领域大型语言模型综述（FinLLMs）

专知会员服务

71+阅读 · 2024年2月6日

【博士论文】负责任大型语言模型:安全性、公平性、可信性，142页pdf

【博士论文】负责任大型语言模型:安全性、公平性、可信性，142页pdf

专知会员服务

34+阅读 · 2024年1月26日

大模型长上下文核心技术是什么？南大等《长上下文大型语言模型中的Transformer架构》综述

大模型长上下文核心技术是什么？南大等《长上下文大型语言模型中的Transformer架构》综述

专知会员服务

66+阅读 · 2023年11月22日

选用哪个GPT？华中科大等最新《大型GPT模型》综述，37页pdf详述关于语言、多模态及科学GPT模型

选用哪个GPT？华中科大等最新《大型GPT模型》综述，37页pdf详述关于语言、多模态及科学GPT模型

专知会员服务

99+阅读 · 2023年9月30日

大模型最权威课程！MIT最新《生成式AI-大模型》课程，MIT斯坦福OpenAI-DeepMind众多专家讲授

大模型最权威课程！MIT最新《生成式AI-大模型》课程，MIT斯坦福OpenAI-DeepMind众多专家讲授

专知会员服务

121+阅读 · 2023年5月26日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知会员服务

182+阅读 · 2023年4月4日

语言模型如何产品落地？《GPT-3:使用大型语言模型构建创新的NLP产品》新书带你实操，151页pdf

语言模型如何产品落地？《GPT-3:使用大型语言模型构建创新的NLP产品》新书带你实操，151页pdf

专知会员服务

120+阅读 · 2022年8月15日

南洋理工75页最新「深度学习对话系统」大综述论文，最全面概述深度学习对话技术进展

南洋理工75页最新「深度学习对话系统」大综述论文，最全面概述深度学习对话技术进展

专知会员服务

49+阅读 · 2021年5月16日

【GPT-3作者亲解】超大型语言模型少样本学习，109页ppt

【GPT-3作者亲解】超大型语言模型少样本学习，109页ppt

专知会员服务

110+阅读 · 2020年12月19日

热门VIP内容

开通专知VIP会员享更多权益服务

重新思考无人机时代的生存能力

在人工智能加速决策环境中拓展OODA循环

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

装甲突击旅：现代战争思考、战斗与组织

相关资讯

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

25+阅读 · 2023年4月4日

浅谈最广泛应用的金融风控算法-评分卡

浅谈最广泛应用的金融风控算法-评分卡

凡人机器学习

10+阅读 · 2020年8月3日

金融领域自然语言处理研究资源大列表

金融领域自然语言处理研究资源大列表

专知

13+阅读 · 2020年2月27日

【AAAI2020论文】用于视觉对话中深度视觉理解的自适应双向编码模型—DualVD, 中科院信工所于静等

【AAAI2020论文】用于视觉对话中深度视觉理解的自适应双向编码模型—DualVD, 中科院信工所于静等

专知

20+阅读 · 2019年11月24日

超越 BERT 和 GPT，微软亚洲研究院开源新模型 MASS！

超越 BERT 和 GPT，微软亚洲研究院开源新模型 MASS！

雷锋网

10+阅读 · 2019年6月27日

逆天语言模型GPT-2最新开源：345M预训练模型和1.5B参数都来了

逆天语言模型GPT-2最新开源：345M预训练模型和1.5B参数都来了

量子位

18+阅读 · 2019年5月4日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

干货 | 人工智能如何帮助银行反欺诈：来看看关于银行智能欺诈风险预测模型的研究

干货 | 人工智能如何帮助银行反欺诈：来看看关于银行智能欺诈风险预测模型的研究

AI100

11+阅读 · 2017年11月17日

【技术贴】面对无孔不入的黑产，如何搭建反欺诈策略与模型？

【技术贴】面对无孔不入的黑产，如何搭建反欺诈策略与模型？

互联网金融

10+阅读 · 2017年7月13日

相关论文

Retrospective In-Context Learning for Temporal Credit Assignment with Large Language Models

Arxiv

0+阅读 · 2月19日

BankMathBench: A Benchmark for Numerical Reasoning in Banking Scenarios

Arxiv

0+阅读 · 2月19日

FinAuditing: A Financial Taxonomy-Structured Multi-Document Benchmark for Evaluating LLMs

Arxiv

0+阅读 · 2月19日

Towards EnergyGPT: A Large Language Model Specialized for the Energy Sector

Arxiv

0+阅读 · 2月7日

Fin-R1: A Large Language Model for Financial Reasoning through Reinforcement Learning

Arxiv

0+阅读 · 2月5日

CreditAudit: 2$^\text{nd}$ Dimension for LLM Evaluation and Selection

Arxiv

0+阅读 · 2月4日

Ebisu: Benchmarking Large Language Models in Japanese Finance

Arxiv

0+阅读 · 2月1日

TruthTensor: Evaluating LLMs Human Imitation through Prediction Market Drift and Holistic Reasoning

Arxiv

0+阅读 · 1月20日

A Model Fusion Approach for Enhancing Credit Approval Decision Making

Arxiv

0+阅读 · 1月19日

The Cost of Convenience: Identifying, Analyzing, and Mitigating Predatory Loan Applications on Android

Arxiv

0+阅读 · 1月19日

相关基金

基于反射理论的信息驱动金融市场模型研究

国家自然科学基金

2+阅读 · 2015年12月31日

云环境多用户的情景化动态信任决策模型及算法的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于大数据的互联网借贷平台价值研究

国家自然科学基金

3+阅读 · 2015年12月31日

信用大数据背景下的异源共享信息融合研究

国家自然科学基金

0+阅读 · 2015年12月31日

小微企业互联网平台融资模式研究—基于双向拍卖和信号博弈双重视角

国家自然科学基金

4+阅读 · 2015年12月31日

基于大数据的消费金融信用风险计量与管理

国家自然科学基金

3+阅读 · 2014年12月31日

信用期限制条件下具有资金约束的库存管理优化模型研究

国家自然科学基金

0+阅读 · 2014年12月31日

互联网金融三维信任机制及参与者信任感知与交易决策

国家自然科学基金

0+阅读 · 2014年12月31日

商业银行小微企业信贷中的信任研究

国家自然科学基金

2+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员