EXAONE Deep: Reasoning Enhanced Language Models - 专知论文

会员服务 ·

0

增强型 · 语言模型 · 编程 · 基准 · 基准测试 ·

EXAONE Deep: Reasoning Enhanced Language Models

翻译：EXAONE Deep：推理增强型语言模型

Kyunghoon Bae,Eunbi Choi,Kibong Choi,Stanley Jungkyu Choi,Yemuk Choi,Seokhee Hong,Junwon Hwang,Hyojin Jeon,Kijeong Jeon,Gerrard Jeongwon Jo,Hyunjik Jo,Jiyeon Jung,Hyosang Kim,Joonkee Kim,Seonghwan Kim,Soyeon Kim,Sunkyoung Kim,Yireun Kim,Yongil Kim,Youchul Kim,Edward Hwayoung Lee,Haeju Lee,Honglak Lee,Jinsik Lee,Kyungmin Lee,Sangha Park,Yongmin Park,Sihoon Yang,Heuiyeen Yeen,Sihyuk Yi,Hyeongu Yun

We present EXAONE Deep series, which exhibits superior capabilities in various reasoning tasks, including math and coding benchmarks. We train our models mainly on the reasoning-specialized dataset that incorporates long streams of thought processes. Evaluation results show that our smaller models, EXAONE Deep 2.4B and 7.8B, outperform other models of comparable size, while the largest model, EXAONE Deep 32B, demonstrates competitive performance against leading open-weight models. All EXAONE Deep models are openly available for research purposes and can be downloaded from https://huggingface.co/LGAI-EXAONE.

翻译：我们推出EXAONE Deep系列模型，该系列在包括数学与编程基准测试在内的多种推理任务中展现出卓越能力。我们主要基于包含长链思维过程的推理专用数据集对模型进行训练。评估结果表明，我们较小的模型EXAONE Deep 2.4B与7.8B在同等规模模型中表现优异，而最大规模的EXAONE Deep 32B模型在与主流开源权重模型的对比中展现出竞争力。所有EXAONE Deep模型均面向研究用途开放，可通过https://huggingface.co/LGAI-EXAONE下载获取。

0

相关内容

增强型

DeepSeek-V3.2-Exp 论文快速解读

DeepSeek-V3.2-Exp 论文快速解读

专知会员服务

18+阅读 · 2025年10月2日

142页DeepSeek-R1 思维链技术：让我们一起<思考>大语言模型（LLM）的推理能力

142页DeepSeek-R1 思维链技术：让我们一起<思考>大语言模型（LLM）的推理能力

专知会员服务

48+阅读 · 2025年4月12日

《高效推理的大模型研究综述：语言、多模态与前沿探索》

《高效推理的大模型研究综述：语言、多模态与前沿探索》

专知会员服务

46+阅读 · 2025年3月30日

从o1-mini到DeepSeek-R1，万字长文带你读懂推理模型的历史与技术

从o1-mini到DeepSeek-R1，万字长文带你读懂推理模型的历史与技术

专知会员服务

41+阅读 · 2025年2月25日

DeepSeek模型在中文语境下的安全性评估

DeepSeek模型在中文语境下的安全性评估

专知会员服务

26+阅读 · 2025年2月21日

如何提升大模型通用推理能力？DeepSeek最新论文《CODEI/O：通过代码输入输出预测凝练推理模式》

如何提升大模型通用推理能力？DeepSeek最新论文《CODEI/O：通过代码输入输出预测凝练推理模式》

专知会员服务

42+阅读 · 2025年2月16日

DeepSeek专题研究：“低成本、高性能、强推理”三位一体，DeepSeek驱动高质量模型平价化

DeepSeek专题研究：“低成本、高性能、强推理”三位一体，DeepSeek驱动高质量模型平价化

专知会员服务

79+阅读 · 2025年2月14日

DeepSeek R1和推理模型，我有几点看法

DeepSeek R1和推理模型，我有几点看法

专知会员服务

38+阅读 · 2025年2月10日

DeepSeek与其他大型语言模型的比较

DeepSeek与其他大型语言模型的比较

专知会员服务

85+阅读 · 2025年2月9日

DeepSeek最新开源的R1推理模型：DeepSeek-R1：通过强化学习激励大语言模型中的推理能力

DeepSeek最新开源的R1推理模型：DeepSeek-R1：通过强化学习激励大语言模型中的推理能力

专知会员服务

45+阅读 · 2025年1月21日

【牛津大学|DeepMind】论深度学习中的统计思维，附49页ppt

【牛津大学|DeepMind】论深度学习中的统计思维，附49页ppt

专知

14+阅读 · 2019年11月25日

DeepMind开源最牛无监督学习BigBiGAN预训练模型

DeepMind开源最牛无监督学习BigBiGAN预训练模型

新智元

10+阅读 · 2019年10月10日

DeepMind爆出无监督表示学习模型BigBiGAN，GAN之父点赞！

DeepMind爆出无监督表示学习模型BigBiGAN，GAN之父点赞！

新智元

13+阅读 · 2019年7月9日

这个项目火了！各种深度学习架构，模型和技巧的集合

这个项目火了！各种深度学习架构，模型和技巧的集合

大数据技术

14+阅读 · 2019年6月13日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

理解人类推理的深度学习

理解人类推理的深度学习

论智

19+阅读 · 2018年11月7日

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

深度学习与NLP

12+阅读 · 2018年9月13日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

全球人工智能

12+阅读 · 2017年12月3日

【深度强化学习】深度强化学习揭秘

【深度强化学习】深度强化学习揭秘

产业智能官

21+阅读 · 2017年11月13日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

面向海量高维数据的可深度结合的贝叶斯网学习与推理新方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于格值逻辑的语言真值α-群锁语义归结自动推理研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

隐写模糊安全性测度及其优化嵌入算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

DeepAgent: A General Reasoning Agent with Scalable Toolsets

Arxiv

0+阅读 · 2月4日

SokoBench: Evaluating Long-Horizon Planning and Reasoning in Large Language Models

Arxiv

0+阅读 · 1月28日

DeepSeek-R1 Thoughtology: Let's think about LLM Reasoning

Arxiv

0+阅读 · 1月15日

Miner:Mining Intrinsic Mastery for Data-Efficient RL in Large Reasoning Models

Arxiv

0+阅读 · 1月8日

UltraLogic: Enhancing LLM Reasoning through Large-Scale Data Synthesis and Bipolar Float Reward

Arxiv

0+阅读 · 1月6日

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Arxiv

0+阅读 · 1月4日

EXAONE 3.5: Series of Large Language Models for Real-world Use Cases

Arxiv

0+阅读 · 1月2日

EXAONE 3.0 7.8B Instruction Tuned Language Model

Arxiv

0+阅读 · 1月2日

EXAONE 4.0: Unified Large Language Models Integrating Non-reasoning and Reasoning Modes

Arxiv

0+阅读 · 1月2日

A Survey of Efficient Reasoning for Large Reasoning Models: Language, Multimodality, and Beyond

Arxiv

0+阅读 · 2025年12月31日

VIP会员

文章信息

相关主题

最新内容

2025年大语言模型进展报告

2025年大语言模型进展报告

专知会员服务

6+阅读 · 4月25日

多智能体协作机制

多智能体协作机制

专知会员服务

5+阅读 · 4月25日

非对称优势：美海军开发低成本反无人机技术

非对称优势：美海军开发低成本反无人机技术

专知会员服务

8+阅读 · 4月25日

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

专知会员服务

17+阅读 · 4月25日

《美战争部小企业创新研究（SBIR）计划》

《美战争部小企业创新研究（SBIR）计划》

专知会员服务

7+阅读 · 4月25日

《军事模拟：将军事条令与目标融入AI智能体》

《军事模拟：将军事条令与目标融入AI智能体》

专知会员服务

10+阅读 · 4月25日

【NTU博士论文】3D人体动作生成

【NTU博士论文】3D人体动作生成

专知会员服务

8+阅读 · 4月24日

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

专知会员服务

10+阅读 · 4月24日

以色列军事技术对美国军力发展的持续性赋能

以色列军事技术对美国军力发展的持续性赋能

专知会员服务

8+阅读 · 4月24日

战场之外的较量：美伊冲突中的认知战与心理博弈

战场之外的较量：美伊冲突中的认知战与心理博弈

专知会员服务

6+阅读 · 4月24日

俄乌战争中乌克兰防空能力演变与见解（中文版）

俄乌战争中乌克兰防空能力演变与见解（中文版）

专知会员服务

7+阅读 · 4月24日

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

专知会员服务

10+阅读 · 4月24日

《深度强化学习在兵棋推演中的应用》40页报告

《深度强化学习在兵棋推演中的应用》40页报告

专知会员服务

14+阅读 · 4月24日

《多域作战面临复杂现实》

《多域作战面临复杂现实》

专知会员服务

10+阅读 · 4月24日

《印度的多域作战：条令与能力发展》报告

《印度的多域作战：条令与能力发展》报告

专知会员服务

5+阅读 · 4月24日

相关VIP内容

DeepSeek-V3.2-Exp 论文快速解读

DeepSeek-V3.2-Exp 论文快速解读

专知会员服务

18+阅读 · 2025年10月2日

142页DeepSeek-R1 思维链技术：让我们一起<思考>大语言模型（LLM）的推理能力

142页DeepSeek-R1 思维链技术：让我们一起<思考>大语言模型（LLM）的推理能力

专知会员服务

48+阅读 · 2025年4月12日

《高效推理的大模型研究综述：语言、多模态与前沿探索》

《高效推理的大模型研究综述：语言、多模态与前沿探索》

专知会员服务

46+阅读 · 2025年3月30日

从o1-mini到DeepSeek-R1，万字长文带你读懂推理模型的历史与技术

从o1-mini到DeepSeek-R1，万字长文带你读懂推理模型的历史与技术

专知会员服务

41+阅读 · 2025年2月25日

DeepSeek模型在中文语境下的安全性评估

DeepSeek模型在中文语境下的安全性评估

专知会员服务

26+阅读 · 2025年2月21日

如何提升大模型通用推理能力？DeepSeek最新论文《CODEI/O：通过代码输入输出预测凝练推理模式》

如何提升大模型通用推理能力？DeepSeek最新论文《CODEI/O：通过代码输入输出预测凝练推理模式》

专知会员服务

42+阅读 · 2025年2月16日

DeepSeek专题研究：“低成本、高性能、强推理”三位一体，DeepSeek驱动高质量模型平价化

DeepSeek专题研究：“低成本、高性能、强推理”三位一体，DeepSeek驱动高质量模型平价化

专知会员服务

79+阅读 · 2025年2月14日

DeepSeek R1和推理模型，我有几点看法

DeepSeek R1和推理模型，我有几点看法

专知会员服务

38+阅读 · 2025年2月10日

DeepSeek与其他大型语言模型的比较

DeepSeek与其他大型语言模型的比较

专知会员服务

85+阅读 · 2025年2月9日

DeepSeek最新开源的R1推理模型：DeepSeek-R1：通过强化学习激励大语言模型中的推理能力

DeepSeek最新开源的R1推理模型：DeepSeek-R1：通过强化学习激励大语言模型中的推理能力

专知会员服务

45+阅读 · 2025年1月21日

热门VIP内容

开通专知VIP会员享更多权益服务

多智能体协作机制

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

2025年大语言模型进展报告

非对称优势：美海军开发低成本反无人机技术

相关资讯

【牛津大学|DeepMind】论深度学习中的统计思维，附49页ppt

【牛津大学|DeepMind】论深度学习中的统计思维，附49页ppt

专知

14+阅读 · 2019年11月25日

DeepMind开源最牛无监督学习BigBiGAN预训练模型

DeepMind开源最牛无监督学习BigBiGAN预训练模型

新智元

10+阅读 · 2019年10月10日

DeepMind爆出无监督表示学习模型BigBiGAN，GAN之父点赞！

DeepMind爆出无监督表示学习模型BigBiGAN，GAN之父点赞！

新智元

13+阅读 · 2019年7月9日

这个项目火了！各种深度学习架构，模型和技巧的集合

这个项目火了！各种深度学习架构，模型和技巧的集合

大数据技术

14+阅读 · 2019年6月13日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

理解人类推理的深度学习

理解人类推理的深度学习

论智

19+阅读 · 2018年11月7日

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

深度学习与NLP

12+阅读 · 2018年9月13日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

全球人工智能

12+阅读 · 2017年12月3日

【深度强化学习】深度强化学习揭秘

【深度强化学习】深度强化学习揭秘

产业智能官

21+阅读 · 2017年11月13日

相关论文

DeepAgent: A General Reasoning Agent with Scalable Toolsets

Arxiv

0+阅读 · 2月4日

SokoBench: Evaluating Long-Horizon Planning and Reasoning in Large Language Models

Arxiv

0+阅读 · 1月28日

DeepSeek-R1 Thoughtology: Let's think about LLM Reasoning

Arxiv

0+阅读 · 1月15日

Miner:Mining Intrinsic Mastery for Data-Efficient RL in Large Reasoning Models

Arxiv

0+阅读 · 1月8日

UltraLogic: Enhancing LLM Reasoning through Large-Scale Data Synthesis and Bipolar Float Reward

Arxiv

0+阅读 · 1月6日

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Arxiv

0+阅读 · 1月4日

EXAONE 3.5: Series of Large Language Models for Real-world Use Cases

Arxiv

0+阅读 · 1月2日

EXAONE 3.0 7.8B Instruction Tuned Language Model

Arxiv

0+阅读 · 1月2日

EXAONE 4.0: Unified Large Language Models Integrating Non-reasoning and Reasoning Modes

Arxiv

0+阅读 · 1月2日

A Survey of Efficient Reasoning for Large Reasoning Models: Language, Multimodality, and Beyond

Arxiv

0+阅读 · 2025年12月31日

相关基金

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

面向海量高维数据的可深度结合的贝叶斯网学习与推理新方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于格值逻辑的语言真值α-群锁语义归结自动推理研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

隐写模糊安全性测度及其优化嵌入算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员