We introduce SenseAI, a human-in-the-loop (HITL) validated financial sentiment dataset designed to capture not only model outputs but the full reasoning process behind them. Unlike existing resources, SenseAI incorporates reasoning chains, confidence scores, human correction signals, and real-world market outcomes, providing a structure aligned with Reinforcement Learning from Human Feedback (RLHF) paradigms. The dataset consists of 1,439 labelled data points across 40 US-listed equities and 13 financial data categories, enabling direct integration into modern LLM fine-tuning pipelines. Through analysis, we identify several systematic patterns in model behavior, including a novel failure mode we term Latent Reasoning Drift, where models introduce information not grounded in the input, as well as consistent confidence miscalibration and forward projection tendencies. These findings suggest that LLM errors in financial reasoning are not random but occur within a predictable and correctable regime, supporting the use of structured HITL data for targeted model improvement. We discuss implications for financial AI systems and highlight opportunities for applying SenseAI in model evaluation and alignment.


翻译:摘要:我们提出SenseAI——一个经人机交互验证的金融情感数据集,其独特之处在于不仅记录模型输出,更完整捕捉输出背后的推理过程。与现有资源不同,该数据集整合了推理链、置信度分数、人工修正信号及真实市场结果,构建出与基于人类反馈的强化学习范式相兼容的数据结构。数据集涵盖40只美国上市股票、13个金融数据类别共1439个标注数据点,可直接集成到现代大语言模型微调流程中。通过分析,我们识别出模型行为中的若干系统性模式,包括被称为潜在推理偏移的新型失效模式(模型引入非输入信息)、一致的置信度校准偏差及前向投影倾向。这些发现表明大语言模型在金融推理中的错误并非随机,而是出现在可预测且可修正的范围内,从而支持使用结构化人机交互数据进行针对性模型改进。本文探讨了对金融AI系统的启示,并指出了SenseAI在模型评估与对齐领域的应用前景。

0
下载
关闭预览

相关内容

在社会经济生活,银行、证券或保险业者从市场主体募集资金,并投资给其它市场主体的经济活动。
情感推荐系统综述:面向个性化的态度、情绪与情境建模
揭秘ChatGPT情感对话能力
专知会员服务
59+阅读 · 2023年4月9日
揭秘ChatGPT情感对话能力
专知
16+阅读 · 2023年4月9日
深度学习在金融文本情感分类中的应用
AI前线
36+阅读 · 2019年1月12日
【团队新作】连续情感识别,精准捕捉你的小情绪!
中国科学院自动化研究所
16+阅读 · 2018年4月17日
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
重新思考无人机时代的生存能力
专知会员服务
5+阅读 · 今天7:44
装甲突击旅:现代战争思考、战斗与组织
专知会员服务
4+阅读 · 今天7:28
在人工智能加速决策环境中拓展OODA循环
专知会员服务
4+阅读 · 今天7:18
军事欺骗:供作战战术指挥官使用的工具
专知会员服务
4+阅读 · 今天7:03
综述 | 世界动作模型:少做梦,多行动
专知会员服务
6+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
10+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
5+阅读 · 6月23日
相关VIP内容
相关资讯
揭秘ChatGPT情感对话能力
专知
16+阅读 · 2023年4月9日
深度学习在金融文本情感分类中的应用
AI前线
36+阅读 · 2019年1月12日
【团队新作】连续情感识别,精准捕捉你的小情绪!
中国科学院自动化研究所
16+阅读 · 2018年4月17日
相关基金
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员