HEART: Emotionally-Driven Test-Time Scaling of Language Models - 专知论文

会员服务 ·

0

缩放 · 语言模型 · AI · 导模 · 错误检测 ·

HEART: Emotionally-Driven Test-Time Scaling of Language Models

翻译：HEART：基于情感驱动的语言模型测试时缩放

Gabriela Pinto,Palash Goyal,Mihir Parmar,Yiwen Song,Souradip Chakraborty,Zifeng Wang,Jinsung Yoon,Hamid Palangi,Tomas Pfister

Test-time scaling has significantly improved how AI models solve problems, yet current methods often get stuck in repetitive, incorrect patterns of thought. We introduce HEART, a framework that uses emotional cues to guide the model's focus, much like how feelings contribute to human decision-making. By alternating between critical tones to sharpen error detection and encouraging tones to spark new ideas, HEART helps the model break out of dead-end reasoning and find the right solution. We evaluate HEART across seven high-difficulty benchmarks--including Humanity's Last Exam, GPQA Diamond, and LiveCodeBench--demonstrating robustness across diverse models. Results show that emotion facilitates deeper reasoning, yielding consistent accuracy gains over affect-sterile baselines. These findings suggest that the next frontier in machine reasoning lies in the strategic integration of affective regulation to guide logical synthesis.

翻译：测试时缩放技术显著提升了AI模型解决问题的性能，然而现有方法常陷入重复且错误的思维模式。我们提出了HEART框架，该框架利用情感线索引导模型注意力，其机制类似于情感在人类决策中的作用。通过交替使用批判性语气以增强错误检测能力，以及鼓励性语气以激发新思路，HEART帮助模型摆脱僵化推理路径并找到正确解决方案。我们在七个高难度基准测试（包括Humanity's Last Exam、GPQA Diamond和LiveCodeBench）上评估HEART，证明了该框架在不同模型间的鲁棒性。实验结果表明，情感机制能促进更深层次的推理，相比无情感干预的基线方法实现了持续稳定的准确率提升。这些发现表明，通过策略性整合情感调节来引导逻辑合成，将成为机器推理领域的下一个前沿方向。

0

相关内容

从预训练模型到大语言模型：人工智能驱动的心理计算综述

从预训练模型到大语言模型：人工智能驱动的心理计算综述

专知会员服务

15+阅读 · 4月7日

神经缩放定律的起源：从随机图到自然语言

神经缩放定律的起源：从随机图到自然语言

专知会员服务

14+阅读 · 1月17日

北大团队发布首篇大语言模型心理测量学系统综述：评估、验证、增强

北大团队发布首篇大语言模型心理测量学系统综述：评估、验证、增强

专知会员服务

10+阅读 · 2025年5月27日

《大型语言模型情感认知》最新进展

《大型语言模型情感认知》最新进展

专知会员服务

43+阅读 · 2024年10月3日

大模型情感计算？东北大学等最新《大语言模型时代的情感计算：从自然语言处理角度》综述

大模型情感计算？东北大学等最新《大语言模型时代的情感计算：从自然语言处理角度》综述

专知会员服务

33+阅读 · 2024年8月13日

大型语言模型遇上文本中心的多模态情感分析：综述

大型语言模型遇上文本中心的多模态情感分析：综述

专知会员服务

25+阅读 · 2024年6月13日

揭秘ChatGPT情感对话能力

揭秘ChatGPT情感对话能力

专知会员服务

59+阅读 · 2023年4月9日

【复旦大学等】情感计算的系统综述:情感模型、数据库及研究进展，A Systematic Review on Affective Computing: Emotion Models, Databases, and Recent Advances

【复旦大学等】情感计算的系统综述:情感模型、数据库及研究进展，A Systematic Review on Affective Computing: Emotion Models, Databases, and Recent Advances

专知会员服务

55+阅读 · 2022年3月17日

【NLP模型压缩方法综述】《A Survey of Methods for Model Compression in NLP》by Madison May

【NLP模型压缩方法综述】《A Survey of Methods for Model Compression in NLP》by Madison May

专知会员服务

43+阅读 · 2020年4月22日

【ECML-PKDD 2019】终身PU学习在情感分析中的解构面与观点词（Disentangling Aspect and Opinion Words inSentiment Analysis using Lifelong PU Learning）

【ECML-PKDD 2019】终身PU学习在情感分析中的解构面与观点词（Disentangling Aspect and Opinion Words inSentiment Analysis using Lifelong PU Learning）

专知会员服务

16+阅读 · 2019年12月3日

揭秘ChatGPT情感对话能力

揭秘ChatGPT情感对话能力

专知

16+阅读 · 2023年4月9日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

从Seq2seq到Attention模型到Self Attention（一）

从Seq2seq到Attention模型到Self Attention（一）

量化投资与机器学习

76+阅读 · 2018年10月8日

【论文推荐】最新八篇情感分析相关论文—注意力网络、多模态情感分析、情感分析局限性、跨语言情感分类、多语言情感分析

【论文推荐】最新八篇情感分析相关论文—注意力网络、多模态情感分析、情感分析局限性、跨语言情感分类、多语言情感分析

专知

52+阅读 · 2018年6月28日

【论文推荐】最新十二篇情感分析相关论文—自然语言推理框架、网络事件、多任务学习、实时情感变化检测、多因素分析、深度语境词表示

【论文推荐】最新十二篇情感分析相关论文—自然语言推理框架、网络事件、多任务学习、实时情感变化检测、多因素分析、深度语境词表示

专知

22+阅读 · 2018年5月7日

【团队新作】连续情感识别，精准捕捉你的小情绪！

【团队新作】连续情感识别，精准捕捉你的小情绪！

中国科学院自动化研究所

16+阅读 · 2018年4月17日

【论文推荐】最新5篇情感分析相关论文—深度学习情感分析综述、情感分析语料库、情感预测性、上下文和位置感知的因子分解模型、LSTM

【论文推荐】最新5篇情感分析相关论文—深度学习情感分析综述、情感分析语料库、情感预测性、上下文和位置感知的因子分解模型、LSTM

专知

55+阅读 · 2018年1月28日

就喜欢看综述论文：情感分析中的深度学习

就喜欢看综述论文：情感分析中的深度学习

机器之心

13+阅读 · 2018年1月26日

情感分析的新方法，使用word2vec对微博文本进行情感分析和分类

情感分析的新方法，使用word2vec对微博文本进行情感分析和分类

数据挖掘入门与实战

22+阅读 · 2018年1月6日

特定目标情感分析——神经网络这是要逆天么

特定目标情感分析——神经网络这是要逆天么

计算机研究与发展

14+阅读 · 2017年9月5日

基于范数熵的冠状动脉狭窄心音研究

国家自然科学基金

0+阅读 · 2015年12月31日

顿悟体验的心理机制和动态神经基础

国家自然科学基金

0+阅读 · 2015年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

内感受性与焦虑的相互作用及其神经机制

国家自然科学基金

0+阅读 · 2015年12月31日

心理与教育测量中项目反应时间数据的统计建模及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

阈下情绪启动影响正常人及分裂型特质个体情绪判断的神经机制

国家自然科学基金

0+阅读 · 2015年12月31日

中文社交化短文本情感分析与话题挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

精神压力下基于物理模型的变异语音生成机理探索及检测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多模式情感测量的考虑多维设计特征的产品外观情感设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

恐惧、高兴微表情识别的认知神经机制

国家自然科学基金

1+阅读 · 2014年12月31日

Large Language Model Psychometrics: A Systematic Review of Evaluation, Validation, and Enhancement

Arxiv

0+阅读 · 3月11日

Assessing Risks of Large Language Models in Mental Health Support: A Framework for Automated Clinical AI Red Teaming

Arxiv

0+阅读 · 3月5日

State Your Intention to Steer Your Attention: An AI Assistant for Intentional Digital Living

Arxiv

0+阅读 · 3月2日

egoEMOTION: Egocentric Vision and Physiological Signals for Emotion and Personality Recognition in Real-World Tasks

Arxiv

0+阅读 · 2月24日

Human-like Affective Cognition in Foundation Models

Arxiv

0+阅读 · 2月16日

MIND: Benchmarking Memory Consistency and Action Control in World Models

Arxiv

0+阅读 · 2月11日

CoRefine: Confidence-Guided Self-Refinement for Adaptive Test-Time Compute

Arxiv

0+阅读 · 2月9日

CORE: Comprehensive Ontological Relation Evaluation for Large Language Models

Arxiv

0+阅读 · 2月6日

EMO-TTA: Improving Test-Time Adaptation of Audio-Language Models for Speech Emotion Recognition

Arxiv

0+阅读 · 2月3日

Decoding Ambiguous Emotions with Test-Time Scaling in Audio-Language Models

Arxiv

0+阅读 · 2月1日

VIP会员

文章信息

相关主题

最新内容

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

1+阅读 · 今天6:14

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

2+阅读 · 今天5:59

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

4+阅读 · 今天5:54

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

3+阅读 · 今天5:51

《提升生成模型的安全性与保障》博士论文

《提升生成模型的安全性与保障》博士论文

专知会员服务

3+阅读 · 今天5:47

美国当前高超音速导弹发展概述

美国当前高超音速导弹发展概述

专知会员服务

4+阅读 · 4月19日

《高超音速武器：一项再度兴起的技术》120页slides

《高超音速武器：一项再度兴起的技术》120页slides

专知会员服务

10+阅读 · 4月19日

无人机蜂群建模与仿真方法

无人机蜂群建模与仿真方法

专知会员服务

11+阅读 · 4月19日

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

专知会员服务

4+阅读 · 4月19日

《量化反无人机系统对抗无人机蜂群效能的创新方法》

《量化反无人机系统对抗无人机蜂群效能的创新方法》

专知会员服务

13+阅读 · 4月19日

澳大利亚发布《国防战略（2026年）》

澳大利亚发布《国防战略（2026年）》

专知会员服务

6+阅读 · 4月19日

【CMU博士论文】迈向基于基础先验的 4D 感知研究

【CMU博士论文】迈向基于基础先验的 4D 感知研究

专知会员服务

8+阅读 · 4月19日

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

专知会员服务

18+阅读 · 4月19日

全球高超音速武器最新发展趋势

全球高超音速武器最新发展趋势

专知会员服务

5+阅读 · 4月19日

《利用大语言模型增强多域作战兵棋推演》（报告）

《利用大语言模型增强多域作战兵棋推演》（报告）

专知会员服务

15+阅读 · 4月18日

相关VIP内容

从预训练模型到大语言模型：人工智能驱动的心理计算综述

从预训练模型到大语言模型：人工智能驱动的心理计算综述

专知会员服务

15+阅读 · 4月7日

神经缩放定律的起源：从随机图到自然语言

神经缩放定律的起源：从随机图到自然语言

专知会员服务

14+阅读 · 1月17日

北大团队发布首篇大语言模型心理测量学系统综述：评估、验证、增强

北大团队发布首篇大语言模型心理测量学系统综述：评估、验证、增强

专知会员服务

10+阅读 · 2025年5月27日

《大型语言模型情感认知》最新进展

《大型语言模型情感认知》最新进展

专知会员服务

43+阅读 · 2024年10月3日

大模型情感计算？东北大学等最新《大语言模型时代的情感计算：从自然语言处理角度》综述

大模型情感计算？东北大学等最新《大语言模型时代的情感计算：从自然语言处理角度》综述

专知会员服务

33+阅读 · 2024年8月13日

大型语言模型遇上文本中心的多模态情感分析：综述

大型语言模型遇上文本中心的多模态情感分析：综述

专知会员服务

25+阅读 · 2024年6月13日

揭秘ChatGPT情感对话能力

揭秘ChatGPT情感对话能力

专知会员服务

59+阅读 · 2023年4月9日

【复旦大学等】情感计算的系统综述:情感模型、数据库及研究进展，A Systematic Review on Affective Computing: Emotion Models, Databases, and Recent Advances

【复旦大学等】情感计算的系统综述:情感模型、数据库及研究进展，A Systematic Review on Affective Computing: Emotion Models, Databases, and Recent Advances

专知会员服务

55+阅读 · 2022年3月17日

【NLP模型压缩方法综述】《A Survey of Methods for Model Compression in NLP》by Madison May

【NLP模型压缩方法综述】《A Survey of Methods for Model Compression in NLP》by Madison May

专知会员服务

43+阅读 · 2020年4月22日

【ECML-PKDD 2019】终身PU学习在情感分析中的解构面与观点词（Disentangling Aspect and Opinion Words inSentiment Analysis using Lifelong PU Learning）

【ECML-PKDD 2019】终身PU学习在情感分析中的解构面与观点词（Disentangling Aspect and Opinion Words inSentiment Analysis using Lifelong PU Learning）

专知会员服务

16+阅读 · 2019年12月3日

热门VIP内容

开通专知VIP会员享更多权益服务

军事通信系统与设备的技术演进综述

《北约标准：医疗评估手册》174页

乌克兰前线的五项创新

《北约 AI手册：作战人员的实用考量》（2026最新64页）

相关资讯

揭秘ChatGPT情感对话能力

揭秘ChatGPT情感对话能力

专知

16+阅读 · 2023年4月9日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

从Seq2seq到Attention模型到Self Attention（一）

从Seq2seq到Attention模型到Self Attention（一）

量化投资与机器学习

76+阅读 · 2018年10月8日

【论文推荐】最新八篇情感分析相关论文—注意力网络、多模态情感分析、情感分析局限性、跨语言情感分类、多语言情感分析

【论文推荐】最新八篇情感分析相关论文—注意力网络、多模态情感分析、情感分析局限性、跨语言情感分类、多语言情感分析

专知

52+阅读 · 2018年6月28日

【论文推荐】最新十二篇情感分析相关论文—自然语言推理框架、网络事件、多任务学习、实时情感变化检测、多因素分析、深度语境词表示

【论文推荐】最新十二篇情感分析相关论文—自然语言推理框架、网络事件、多任务学习、实时情感变化检测、多因素分析、深度语境词表示

专知

22+阅读 · 2018年5月7日

【团队新作】连续情感识别，精准捕捉你的小情绪！

【团队新作】连续情感识别，精准捕捉你的小情绪！

中国科学院自动化研究所

16+阅读 · 2018年4月17日

【论文推荐】最新5篇情感分析相关论文—深度学习情感分析综述、情感分析语料库、情感预测性、上下文和位置感知的因子分解模型、LSTM

【论文推荐】最新5篇情感分析相关论文—深度学习情感分析综述、情感分析语料库、情感预测性、上下文和位置感知的因子分解模型、LSTM

专知

55+阅读 · 2018年1月28日

就喜欢看综述论文：情感分析中的深度学习

就喜欢看综述论文：情感分析中的深度学习

机器之心

13+阅读 · 2018年1月26日

情感分析的新方法，使用word2vec对微博文本进行情感分析和分类

情感分析的新方法，使用word2vec对微博文本进行情感分析和分类

数据挖掘入门与实战

22+阅读 · 2018年1月6日

特定目标情感分析——神经网络这是要逆天么

特定目标情感分析——神经网络这是要逆天么

计算机研究与发展

14+阅读 · 2017年9月5日

相关论文

Large Language Model Psychometrics: A Systematic Review of Evaluation, Validation, and Enhancement

Arxiv

0+阅读 · 3月11日

Assessing Risks of Large Language Models in Mental Health Support: A Framework for Automated Clinical AI Red Teaming

Arxiv

0+阅读 · 3月5日

State Your Intention to Steer Your Attention: An AI Assistant for Intentional Digital Living

Arxiv

0+阅读 · 3月2日

egoEMOTION: Egocentric Vision and Physiological Signals for Emotion and Personality Recognition in Real-World Tasks

Arxiv

0+阅读 · 2月24日

Human-like Affective Cognition in Foundation Models

Arxiv

0+阅读 · 2月16日

MIND: Benchmarking Memory Consistency and Action Control in World Models

Arxiv

0+阅读 · 2月11日

CoRefine: Confidence-Guided Self-Refinement for Adaptive Test-Time Compute

Arxiv

0+阅读 · 2月9日

CORE: Comprehensive Ontological Relation Evaluation for Large Language Models

Arxiv

0+阅读 · 2月6日

EMO-TTA: Improving Test-Time Adaptation of Audio-Language Models for Speech Emotion Recognition

Arxiv

0+阅读 · 2月3日

Decoding Ambiguous Emotions with Test-Time Scaling in Audio-Language Models

Arxiv

0+阅读 · 2月1日

相关基金

基于范数熵的冠状动脉狭窄心音研究

国家自然科学基金

0+阅读 · 2015年12月31日

顿悟体验的心理机制和动态神经基础

国家自然科学基金

0+阅读 · 2015年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

内感受性与焦虑的相互作用及其神经机制

国家自然科学基金

0+阅读 · 2015年12月31日

心理与教育测量中项目反应时间数据的统计建模及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

阈下情绪启动影响正常人及分裂型特质个体情绪判断的神经机制

国家自然科学基金

0+阅读 · 2015年12月31日

中文社交化短文本情感分析与话题挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

精神压力下基于物理模型的变异语音生成机理探索及检测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多模式情感测量的考虑多维设计特征的产品外观情感设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

恐惧、高兴微表情识别的认知神经机制

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员