A Survey of Efficient Reasoning for Large Reasoning Models: Language, Multimodality, and Beyond - 专知论文

会员服务 ·

0

大型推理模型 · 综述 · 推理模型 · 香港理工大学 · 多模 ·

2025 年 12 月 31 日

A Survey of Efficient Reasoning for Large Reasoning Models: Language, Multimodality, and Beyond

翻译：高效推理大型推理模型综述：语言、多模态及前沿进展

Xiaoye Qu,Yafu Li,Zhao-Chen Su,Weigao Sun,Jianhao Yan,Dongrui Liu,Ganqu Cui,Daizong Liu,Shuxian Liang,Junxian He,Peng Li,Wei Wei,Jing Shao,Chaochao Lu,Yue Zhang,Xian-Sheng Hua,Bowen Zhou,Yu Cheng

from arxiv, Update recent RL papers. Project page: https://github.com/XiaoYee/Awesome_Efficient_LRM_Reasoning

Recent Large Reasoning Models (LRMs), such as DeepSeek-R1 and OpenAI o1, have demonstrated strong performance gains by scaling up the length of Chain-of-Thought (CoT) reasoning during inference. However, a growing concern lies in their tendency to produce excessively long reasoning traces, which are often filled with redundant content (e.g., repeated definitions), over-analysis of simple problems, and superficial exploration of multiple reasoning paths for harder tasks. This inefficiency introduces significant challenges for training, inference, and real-world deployment (e.g., in agent-based systems), where token economy is critical. In this survey, we provide a comprehensive overview of recent efforts aimed at improving reasoning efficiency in LRMs, with a particular focus on the unique challenges that arise in this new paradigm. We identify common patterns of inefficiency, examine methods proposed across the LRM lifecycle, i.e., from pretraining to inference, and discuss promising future directions for research. To support ongoing development, we also maintain a real-time GitHub repository tracking recent progress in the field. We hope this survey serves as a foundation for further exploration and inspires innovation in this rapidly evolving area.

翻译：近期的大型推理模型（LRMs），如DeepSeek-R1和OpenAI o1，通过扩展推理过程中思维链（CoT）的长度，展现出显著的性能提升。然而，一个日益凸显的问题在于其倾向于生成过长的推理轨迹，这些轨迹常包含冗余内容（如重复的定义）、对简单问题的过度分析，以及对复杂任务推理路径的浅层探索。这种低效性对训练、推理及实际部署（例如在基于智能体的系统中）带来了严峻挑战，其中令牌经济性至关重要。本综述系统梳理了近期旨在提升LRMs推理效率的研究工作，特别关注这一新范式下出现的独特挑战。我们归纳了低效性的常见模式，审视了LRM全生命周期（从预训练到推理）提出的各类方法，并探讨了未来有前景的研究方向。为支持持续发展，我们还维护了一个实时GitHub代码库，追踪该领域的最新进展。我们希望本综述能为后续探索奠定基础，并激发这一快速发展领域的创新。

0

相关内容

大型推理模型

大型推理模型

从感知到推理：深度思考赋能多模态大语言模型

从感知到推理：深度思考赋能多模态大语言模型

专知会员服务

25+阅读 · 2025年11月19日

面向大型语言模型推理的可信研究综述

面向大型语言模型推理的可信研究综述

专知会员服务

22+阅读 · 2025年9月6日

别想太多：高效 R1 风格大型推理模型综述

别想太多：高效 R1 风格大型推理模型综述

专知会员服务

23+阅读 · 2025年8月5日

多模态推理的基础、方法与未来前沿

多模态推理的基础、方法与未来前沿

专知会员服务

27+阅读 · 2025年7月6日

小型推理模型简要综述：训练、推理、应用与研究方向

小型推理模型简要综述：训练、推理、应用与研究方向

专知会员服务

42+阅读 · 2025年4月16日

大规模推理模型的高效推理：综述

大规模推理模型的高效推理：综述

专知会员服务

21+阅读 · 2025年4月3日

《高效推理的大模型研究综述：语言、多模态与前沿探索》

《高效推理的大模型研究综述：语言、多模态与前沿探索》

专知会员服务

46+阅读 · 2025年3月30日

停止过度思考：大型语言模型高效推理研究综述

停止过度思考：大型语言模型高效推理研究综述

专知会员服务

37+阅读 · 2025年3月21日

迈向推理时代：大型语言模型的长链推理研究综述

迈向推理时代：大型语言模型的长链推理研究综述

专知会员服务

46+阅读 · 2025年3月13日

大型语言模型高效推理综述

大型语言模型高效推理综述

专知会员服务

64+阅读 · 2024年4月23日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

25+阅读 · 2023年4月4日

机器推理系列文章概览：七大NLP任务最新方法与进展

机器推理系列文章概览：七大NLP任务最新方法与进展

AI100

12+阅读 · 2019年9月15日

自然语言处理常识推理综述论文，60页pdf

自然语言处理常识推理综述论文，60页pdf

专知

73+阅读 · 2019年4月4日

理解人类推理的深度学习

理解人类推理的深度学习

论智

19+阅读 · 2018年11月7日

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

专知

24+阅读 · 2018年9月6日

【CVPR2018】如何增强Attention Model的推理能力

【CVPR2018】如何增强Attention Model的推理能力

专知

15+阅读 · 2018年7月2日

【论文推荐】最新十二篇情感分析相关论文—自然语言推理框架、网络事件、多任务学习、实时情感变化检测、多因素分析、深度语境词表示

【论文推荐】最新十二篇情感分析相关论文—自然语言推理框架、网络事件、多任务学习、实时情感变化检测、多因素分析、深度语境词表示

专知

22+阅读 · 2018年5月7日

【论文推荐】最新6篇视觉问答（VQA）相关论文—目标推理、深度循环模型、可解释性、数据可视化、Triplet学习、基准

【论文推荐】最新6篇视觉问答（VQA）相关论文—目标推理、深度循环模型、可解释性、数据可视化、Triplet学习、基准

专知

15+阅读 · 2018年2月3日

【论文推荐】最新5篇自动问答相关论文——多关系自动问答、知识图谱联合实体和关系、生物医学问题、维基百科语料数据、多句式旅游推荐

【论文推荐】最新5篇自动问答相关论文——多关系自动问答、知识图谱联合实体和关系、生物医学问题、维基百科语料数据、多句式旅游推荐

专知

23+阅读 · 2018年1月17日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于格值逻辑的语言真值α-群锁语义归结自动推理研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

面向事件分析的信息意图检测、建模与群体意图推理技术研究

国家自然科学基金

12+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

Short Chains, Deep Thoughts: Balancing Reasoning Efficiency and Intra-Segment Capability via Split-Merge Optimization

Arxiv

0+阅读 · 2月3日

SafeRBench: Dissecting the Reasoning Safety of Large Language Models

Arxiv

0+阅读 · 1月26日

Dynamic Thinking-Token Selection for Efficient Reasoning in Large Reasoning Models

Arxiv

0+阅读 · 1月26日

Graph Reasoning Paradigm: Structured and Symbolic Reasoning with Topology-Aware Reinforcement Learning for Large Language Models

Arxiv

0+阅读 · 1月19日

Structured Reasoning for Large Language Models

Arxiv

0+阅读 · 1月12日

ConMax: Confidence-Maximizing Compression for Efficient Chain-of-Thought Reasoning

Arxiv

0+阅读 · 1月8日

Pruning the Unsurprising: Efficient LLM Reasoning via First-Token Surprisal

Arxiv

0+阅读 · 1月8日

Investigating CoT Monitorability in Large Reasoning Models

Arxiv

0+阅读 · 1月7日

Large Reasoning Models Are (Not Yet) Multilingual Latent Reasoners

Arxiv

0+阅读 · 1月6日

Red Teaming Large Reasoning Models

Arxiv

0+阅读 · 1月1日

VIP会员

文章信息

相关主题

大型推理模型

香港理工大学

最新内容

马赛克战：俄乌战场透析

马赛克战：俄乌战场透析

专知会员服务

7+阅读 · 今天4:12

《利用人工智能增强军事决策》

《利用人工智能增强军事决策》

专知会员服务

1+阅读 · 今天4:09

《自动机器学习在军事数据耕耘法中的应用》

《自动机器学习在军事数据耕耘法中的应用》

专知会员服务

3+阅读 · 今天4:02

为何指挥所生存能力要求范式转变

为何指挥所生存能力要求范式转变

专知会员服务

1+阅读 · 今天3:54

打造“新蛛网”模式与高科技动员

打造“新蛛网”模式与高科技动员

专知会员服务

1+阅读 · 今天3:33

“蛛网”行动一周年：远程无人机战争

“蛛网”行动一周年：远程无人机战争

专知会员服务

1+阅读 · 今天3:23

加沙、乌克兰和伊朗冲突：人工智能如何改变冲突

加沙、乌克兰和伊朗冲突：人工智能如何改变冲突

专知会员服务

2+阅读 · 今天3:15

为何“第一次人工智能战争（美以伊冲突）”仍是人类主导的斗争

为何“第一次人工智能战争（美以伊冲突）”仍是人类主导的斗争

专知会员服务

1+阅读 · 今天3:09

【剑桥博士论文】智能体-环境协同优化

【剑桥博士论文】智能体-环境协同优化

专知会员服务

5+阅读 · 6月9日

ACL 2026综述｜多模态基础模型测试时扩展：生成与推理统一框架

ACL 2026综述｜多模态基础模型测试时扩展：生成与推理统一框架

专知会员服务

3+阅读 · 6月9日

《面向国防应用的无人机选型：一种对比性多模糊多准则决策框架》

《面向国防应用的无人机选型：一种对比性多模糊多准则决策框架》

专知会员服务

10+阅读 · 6月9日

无人机战争：从乌克兰到中东战场的沙希德（Shahed）无人机分析

无人机战争：从乌克兰到中东战场的沙希德（Shahed）无人机分析

专知会员服务

7+阅读 · 6月9日

为初级军官战术训练设计生成式人工智能平台

为初级军官战术训练设计生成式人工智能平台

专知会员服务

8+阅读 · 6月9日

《美空军条令出版物 3-40，反大规模杀伤性武器作战》

《美空军条令出版物 3-40，反大规模杀伤性武器作战》

专知会员服务

9+阅读 · 6月9日

《美军条令：作战伤员后送保障》

《美军条令：作战伤员后送保障》

专知会员服务

6+阅读 · 6月9日

相关VIP内容

从感知到推理：深度思考赋能多模态大语言模型

从感知到推理：深度思考赋能多模态大语言模型

专知会员服务

25+阅读 · 2025年11月19日

面向大型语言模型推理的可信研究综述

面向大型语言模型推理的可信研究综述

专知会员服务

22+阅读 · 2025年9月6日

别想太多：高效 R1 风格大型推理模型综述

别想太多：高效 R1 风格大型推理模型综述

专知会员服务

23+阅读 · 2025年8月5日

多模态推理的基础、方法与未来前沿

多模态推理的基础、方法与未来前沿

专知会员服务

27+阅读 · 2025年7月6日

小型推理模型简要综述：训练、推理、应用与研究方向

小型推理模型简要综述：训练、推理、应用与研究方向

专知会员服务

42+阅读 · 2025年4月16日

大规模推理模型的高效推理：综述

大规模推理模型的高效推理：综述

专知会员服务

21+阅读 · 2025年4月3日

《高效推理的大模型研究综述：语言、多模态与前沿探索》

《高效推理的大模型研究综述：语言、多模态与前沿探索》

专知会员服务

46+阅读 · 2025年3月30日

停止过度思考：大型语言模型高效推理研究综述

停止过度思考：大型语言模型高效推理研究综述

专知会员服务

37+阅读 · 2025年3月21日

迈向推理时代：大型语言模型的长链推理研究综述

迈向推理时代：大型语言模型的长链推理研究综述

专知会员服务

46+阅读 · 2025年3月13日

大型语言模型高效推理综述

大型语言模型高效推理综述

专知会员服务

64+阅读 · 2024年4月23日

热门VIP内容

开通专知VIP会员享更多权益服务

《利用人工智能增强军事决策》

为何指挥所生存能力要求范式转变

马赛克战：俄乌战场透析

《自动机器学习在军事数据耕耘法中的应用》

相关资讯

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

25+阅读 · 2023年4月4日

机器推理系列文章概览：七大NLP任务最新方法与进展

机器推理系列文章概览：七大NLP任务最新方法与进展

AI100

12+阅读 · 2019年9月15日

自然语言处理常识推理综述论文，60页pdf

自然语言处理常识推理综述论文，60页pdf

专知

73+阅读 · 2019年4月4日

理解人类推理的深度学习

理解人类推理的深度学习

论智

19+阅读 · 2018年11月7日

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

专知

24+阅读 · 2018年9月6日

【CVPR2018】如何增强Attention Model的推理能力

【CVPR2018】如何增强Attention Model的推理能力

专知

15+阅读 · 2018年7月2日

【论文推荐】最新十二篇情感分析相关论文—自然语言推理框架、网络事件、多任务学习、实时情感变化检测、多因素分析、深度语境词表示

【论文推荐】最新十二篇情感分析相关论文—自然语言推理框架、网络事件、多任务学习、实时情感变化检测、多因素分析、深度语境词表示

专知

22+阅读 · 2018年5月7日

【论文推荐】最新6篇视觉问答（VQA）相关论文—目标推理、深度循环模型、可解释性、数据可视化、Triplet学习、基准

【论文推荐】最新6篇视觉问答（VQA）相关论文—目标推理、深度循环模型、可解释性、数据可视化、Triplet学习、基准

专知

15+阅读 · 2018年2月3日

【论文推荐】最新5篇自动问答相关论文——多关系自动问答、知识图谱联合实体和关系、生物医学问题、维基百科语料数据、多句式旅游推荐

【论文推荐】最新5篇自动问答相关论文——多关系自动问答、知识图谱联合实体和关系、生物医学问题、维基百科语料数据、多句式旅游推荐

专知

23+阅读 · 2018年1月17日

相关论文

Short Chains, Deep Thoughts: Balancing Reasoning Efficiency and Intra-Segment Capability via Split-Merge Optimization

Arxiv

0+阅读 · 2月3日

SafeRBench: Dissecting the Reasoning Safety of Large Language Models

Arxiv

0+阅读 · 1月26日

Dynamic Thinking-Token Selection for Efficient Reasoning in Large Reasoning Models

Arxiv

0+阅读 · 1月26日

Graph Reasoning Paradigm: Structured and Symbolic Reasoning with Topology-Aware Reinforcement Learning for Large Language Models

Arxiv

0+阅读 · 1月19日

Structured Reasoning for Large Language Models

Arxiv

0+阅读 · 1月12日

ConMax: Confidence-Maximizing Compression for Efficient Chain-of-Thought Reasoning

Arxiv

0+阅读 · 1月8日

Pruning the Unsurprising: Efficient LLM Reasoning via First-Token Surprisal

Arxiv

0+阅读 · 1月8日

Investigating CoT Monitorability in Large Reasoning Models

Arxiv

0+阅读 · 1月7日

Large Reasoning Models Are (Not Yet) Multilingual Latent Reasoners

Arxiv

0+阅读 · 1月6日

Red Teaming Large Reasoning Models

Arxiv

0+阅读 · 1月1日

相关基金

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于格值逻辑的语言真值α-群锁语义归结自动推理研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

面向事件分析的信息意图检测、建模与群体意图推理技术研究

国家自然科学基金

12+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员