People readily follow personal advice from AI but it does not improve their well-being - 专知论文

会员服务 ·

0

People readily follow personal advice from AI but it does not improve their well-being

翻译：人们轻易采纳AI的个人建议，但这并未提升其幸福感

Lennart Luettgau,Vanessa Cheung,Magda Dubois,Keno Juechems,Jessica Bergs,Luke Symes,Henry Davidson,Bessie O'Dell,Hannah Rose Kirk,Max Rollwage,Christopher Summerfield

People increasingly seek personal advice from large language models (LLMs), yet whether humans follow their advice, and its consequences for their well-being, remains unknown. In a longitudinal randomised controlled trial with a representative UK sample (N = 6,474), we found that up to 79% of participants who had a 20-minute discussion with one of three AI chatbots (GPT-4o, LLama-3.3-70B, Gemini 3 Pro) about health, careers or relationships subsequently reported following its advice. Advice-following remained above 60% even for high-stakes recommendations, suggesting that users only weakly calibrate their reliance on AI advice to potential consequences. Based on autograder evaluations of chat transcripts, LLM advice rarely violated safety best practice. However, when queried 2-3 weeks later, participants receiving personal advice from AI showed no sustained well-being benefits compared to a control group who discussed hobbies and interests with the same chatbots. These findings reveal that consumer LLMs exert substantial influence over real-world personal decisions without delivering measurable psychological benefits.

翻译：人们越来越多地向大型语言模型（LLMs）寻求个人建议，但人类是否会遵循这些建议，以及这对他们的幸福感有何影响，目前尚不明确。在一项针对具有代表性的英国样本（N = 6,474）的纵向随机对照试验中，我们发现，与三款AI聊天机器人（GPT-4o、LLama-3.3-70B、Gemini 3 Pro）就健康、职业或人际关系进行20分钟讨论的参与者中，高达79%的人后来表示遵循了其建议。即使对于高风险建议，遵循率也保持在60%以上，表明用户对AI建议的依赖程度与潜在后果之间的校准非常微弱。基于对聊天记录进行自动评分器评估，LLM的建议很少违反安全最佳实践。然而，在两到三周后的回访中，与对照组（使用相同聊天机器人讨论爱好和兴趣）相比，接受AI个人建议的参与者在幸福感方面并未显示持久的改善。这些发现表明，消费级LLMs对现实世界中的个人决策产生了显著影响，但并未带来可衡量的心理益处。

0

相关内容

智能体化人工智能 (Agentic AI) 的前行之路：挑战与机遇

智能体化人工智能 (Agentic AI) 的前行之路：挑战与机遇

专知会员服务

43+阅读 · 1月8日

基于大语言模型的智能体易产生幻觉：分类体系、方法与未来方向综述

基于大语言模型的智能体易产生幻觉：分类体系、方法与未来方向综述

专知会员服务

32+阅读 · 2025年9月27日

“人工智能科学家距离改变世界还有多远？”

“人工智能科学家距离改变世界还有多远？”

专知会员服务

23+阅读 · 2025年8月1日

【斯坦福博士论文】通过以人为本的自然语言界面拓展 AI 的可及性

【斯坦福博士论文】通过以人为本的自然语言界面拓展 AI 的可及性

专知会员服务

22+阅读 · 2025年6月17日

召唤100多位学者打分，斯坦福新研究：「AI科学家」创新确实强

召唤100多位学者打分，斯坦福新研究：「AI科学家」创新确实强

专知会员服务

35+阅读 · 2024年9月12日

【新书】生成式人工智能的提示工程：为可靠的AI输出提供面向未来的输入

【新书】生成式人工智能的提示工程：为可靠的AI输出提供面向未来的输入

专知会员服务

67+阅读 · 2024年5月25日

《美国防部对人工智能和 LLM 编写评估因素的信心与偏见》2024最新275页论文

《美国防部对人工智能和 LLM 编写评估因素的信心与偏见》2024最新275页论文

专知会员服务

64+阅读 · 2024年3月4日

如何提示？浙大最新《大型语言模型提示框架》综述

如何提示？浙大最新《大型语言模型提示框架》综述

专知会员服务

83+阅读 · 2023年11月23日

AI Agent下一个热点？复旦最新86页《大型语言模型智能体的崛起与潜力》综述，详述LLM Agent: 大脑、感知和行动

AI Agent下一个热点？复旦最新86页《大型语言模型智能体的崛起与潜力》综述，详述LLM Agent: 大脑、感知和行动

专知会员服务

170+阅读 · 2023年9月15日

通过大语言模型和人工智能的力量改变军事规划

通过大语言模型和人工智能的力量改变军事规划

专知会员服务

150+阅读 · 2023年9月1日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

重磅！斯坦福HAI《2023人工智能指数报告》出炉，386页pdf了解AI十大态势进展（附中文版报告下载）

重磅！斯坦福HAI《2023人工智能指数报告》出炉，386页pdf了解AI十大态势进展（附中文版报告下载）

专知

24+阅读 · 2023年4月4日

AI的未来不是大模型，也不是端到端：Meta向我们证明了这一点

AI的未来不是大模型，也不是端到端：Meta向我们证明了这一点

机器之心

15+阅读 · 2022年11月26日

Gartner 报告：人工智能的现状与未来

Gartner 报告：人工智能的现状与未来

InfoQ

14+阅读 · 2019年11月29日

AI会话能力超越人类！CoQA挑战赛微软创新纪录

AI会话能力超越人类！CoQA挑战赛微软创新纪录

智东西

12+阅读 · 2019年5月5日

为了夸夸聊天机器人，爬了一份夸夸语料库

为了夸夸聊天机器人，爬了一份夸夸语料库

AINLP

21+阅读 · 2019年3月19日

为什么2018年AI领域缺乏突破性进展？

为什么2018年AI领域缺乏突破性进展？

AI前线

21+阅读 · 2018年12月24日

腾讯AI Lab 8篇论文入选，从0到1解读语音交互能力 | InterSpeech 2018

腾讯AI Lab 8篇论文入选，从0到1解读语音交互能力 | InterSpeech 2018

AI科技评论

12+阅读 · 2018年9月7日

数学是普通程序员入门人工智能的最大障碍

数学是普通程序员入门人工智能的最大障碍

算法与数据结构

12+阅读 · 2018年7月27日

【论文推荐】最新7篇聊天机器人（Chatbot）相关论文—触动你的心、DeepProbe、饮食推荐、知识学习、交互、挑战、管理

【论文推荐】最新7篇聊天机器人（Chatbot）相关论文—触动你的心、DeepProbe、饮食推荐、知识学习、交互、挑战、管理

专知

12+阅读 · 2018年3月15日

复合型移动群智感知关键技术研究

国家自然科学基金

9+阅读 · 2017年12月31日

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向聋儿言语康复的多模态人机交互模型及技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

人类双向选择行为的统计特征分析与预测方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

中文社交化短文本情感分析与话题挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向大数据的群体偏好决策分析研究

国家自然科学基金

6+阅读 · 2014年12月31日

基于人眼关注度与情感分析的电子商务智能推荐计算

国家自然科学基金

0+阅读 · 2014年12月31日

泛在计算环境中社会化驱动的情境感知个性化信息服务研究

国家自然科学基金

2+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

Can AI-Generated Persuasion Be Detected? Persuaficial Benchmark and AI vs. Human Linguistic Differences

Arxiv

0+阅读 · 4月21日

Confidence Without Competence in AI-Assisted Knowledge Work

Arxiv

0+阅读 · 4月10日

Decoding AI Authorship: Can LLMs Truly Mimic Human Style Across Literature and Politics?

Arxiv

0+阅读 · 3月24日

When Language Models Lose Their Mind: The Consequences of Brain Misalignment

Arxiv

0+阅读 · 3月24日

Greater accessibility can amplify discrimination in generative AI

Arxiv

0+阅读 · 3月23日

More Isn't Always Better: Balancing Decision Accuracy and Conformity Pressures in Multi-AI Advice

Arxiv

0+阅读 · 3月23日

Questionnaire Responses Do not Capture the Safety of AI Agents

Arxiv

0+阅读 · 3月15日

"Who wants to be nagged by AI?": Investigating the Effects of Agreeableness on Older Adults' Perception of LLM-Based Voice Assistants' Explanations

Arxiv

0+阅读 · 3月9日

When AI Gives Advice: Evaluating AI and Human Responses to Online Advice-Seeking for Well-Being

Arxiv

0+阅读 · 2月28日

How much does context affect the accuracy of AI health advice?

Arxiv

0+阅读 · 2月24日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

4+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

6+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

6+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

6+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

22+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

智能体化人工智能 (Agentic AI) 的前行之路：挑战与机遇

智能体化人工智能 (Agentic AI) 的前行之路：挑战与机遇

专知会员服务

43+阅读 · 1月8日

基于大语言模型的智能体易产生幻觉：分类体系、方法与未来方向综述

基于大语言模型的智能体易产生幻觉：分类体系、方法与未来方向综述

专知会员服务

32+阅读 · 2025年9月27日

“人工智能科学家距离改变世界还有多远？”

“人工智能科学家距离改变世界还有多远？”

专知会员服务

23+阅读 · 2025年8月1日

【斯坦福博士论文】通过以人为本的自然语言界面拓展 AI 的可及性

【斯坦福博士论文】通过以人为本的自然语言界面拓展 AI 的可及性

专知会员服务

22+阅读 · 2025年6月17日

召唤100多位学者打分，斯坦福新研究：「AI科学家」创新确实强

召唤100多位学者打分，斯坦福新研究：「AI科学家」创新确实强

专知会员服务

35+阅读 · 2024年9月12日

【新书】生成式人工智能的提示工程：为可靠的AI输出提供面向未来的输入

【新书】生成式人工智能的提示工程：为可靠的AI输出提供面向未来的输入

专知会员服务

67+阅读 · 2024年5月25日

《美国防部对人工智能和 LLM 编写评估因素的信心与偏见》2024最新275页论文

《美国防部对人工智能和 LLM 编写评估因素的信心与偏见》2024最新275页论文

专知会员服务

64+阅读 · 2024年3月4日

如何提示？浙大最新《大型语言模型提示框架》综述

如何提示？浙大最新《大型语言模型提示框架》综述

专知会员服务

83+阅读 · 2023年11月23日

AI Agent下一个热点？复旦最新86页《大型语言模型智能体的崛起与潜力》综述，详述LLM Agent: 大脑、感知和行动

AI Agent下一个热点？复旦最新86页《大型语言模型智能体的崛起与潜力》综述，详述LLM Agent: 大脑、感知和行动

专知会员服务

170+阅读 · 2023年9月15日

通过大语言模型和人工智能的力量改变军事规划

通过大语言模型和人工智能的力量改变军事规划

专知会员服务

150+阅读 · 2023年9月1日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

重磅！斯坦福HAI《2023人工智能指数报告》出炉，386页pdf了解AI十大态势进展（附中文版报告下载）

重磅！斯坦福HAI《2023人工智能指数报告》出炉，386页pdf了解AI十大态势进展（附中文版报告下载）

专知

24+阅读 · 2023年4月4日

AI的未来不是大模型，也不是端到端：Meta向我们证明了这一点

AI的未来不是大模型，也不是端到端：Meta向我们证明了这一点

机器之心

15+阅读 · 2022年11月26日

Gartner 报告：人工智能的现状与未来

Gartner 报告：人工智能的现状与未来

InfoQ

14+阅读 · 2019年11月29日

AI会话能力超越人类！CoQA挑战赛微软创新纪录

AI会话能力超越人类！CoQA挑战赛微软创新纪录

智东西

12+阅读 · 2019年5月5日

为了夸夸聊天机器人，爬了一份夸夸语料库

为了夸夸聊天机器人，爬了一份夸夸语料库

AINLP

21+阅读 · 2019年3月19日

为什么2018年AI领域缺乏突破性进展？

为什么2018年AI领域缺乏突破性进展？

AI前线

21+阅读 · 2018年12月24日

腾讯AI Lab 8篇论文入选，从0到1解读语音交互能力 | InterSpeech 2018

腾讯AI Lab 8篇论文入选，从0到1解读语音交互能力 | InterSpeech 2018

AI科技评论

12+阅读 · 2018年9月7日

数学是普通程序员入门人工智能的最大障碍

数学是普通程序员入门人工智能的最大障碍

算法与数据结构

12+阅读 · 2018年7月27日

【论文推荐】最新7篇聊天机器人（Chatbot）相关论文—触动你的心、DeepProbe、饮食推荐、知识学习、交互、挑战、管理

【论文推荐】最新7篇聊天机器人（Chatbot）相关论文—触动你的心、DeepProbe、饮食推荐、知识学习、交互、挑战、管理

专知

12+阅读 · 2018年3月15日

相关论文

Can AI-Generated Persuasion Be Detected? Persuaficial Benchmark and AI vs. Human Linguistic Differences

Arxiv

0+阅读 · 4月21日

Confidence Without Competence in AI-Assisted Knowledge Work

Arxiv

0+阅读 · 4月10日

Decoding AI Authorship: Can LLMs Truly Mimic Human Style Across Literature and Politics?

Arxiv

0+阅读 · 3月24日

When Language Models Lose Their Mind: The Consequences of Brain Misalignment

Arxiv

0+阅读 · 3月24日

Greater accessibility can amplify discrimination in generative AI

Arxiv

0+阅读 · 3月23日

More Isn't Always Better: Balancing Decision Accuracy and Conformity Pressures in Multi-AI Advice

Arxiv

0+阅读 · 3月23日

Questionnaire Responses Do not Capture the Safety of AI Agents

Arxiv

0+阅读 · 3月15日

"Who wants to be nagged by AI?": Investigating the Effects of Agreeableness on Older Adults' Perception of LLM-Based Voice Assistants' Explanations

Arxiv

0+阅读 · 3月9日

When AI Gives Advice: Evaluating AI and Human Responses to Online Advice-Seeking for Well-Being

Arxiv

0+阅读 · 2月28日

How much does context affect the accuracy of AI health advice?

Arxiv

0+阅读 · 2月24日

相关基金

复合型移动群智感知关键技术研究

国家自然科学基金

9+阅读 · 2017年12月31日

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向聋儿言语康复的多模态人机交互模型及技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

人类双向选择行为的统计特征分析与预测方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

中文社交化短文本情感分析与话题挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向大数据的群体偏好决策分析研究

国家自然科学基金

6+阅读 · 2014年12月31日

基于人眼关注度与情感分析的电子商务智能推荐计算

国家自然科学基金

0+阅读 · 2014年12月31日

泛在计算环境中社会化驱动的情境感知个性化信息服务研究

国家自然科学基金

2+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员