Tongyi DeepResearch Technical Report - 专知论文

会员服务 ·

0

设计 · 深度研究 · 智能体 · 信息检索 · 报告 ·

Tongyi DeepResearch Technical Report

翻译：通义深研技术报告

Tongyi DeepResearch Team,Baixuan Li,Bo Zhang,Dingchu Zhang,Fei Huang,Guangyu Li,Guoxin Chen,Huifeng Yin,Jialong Wu,Jingren Zhou,Kuan Li,Liangcai Su,Litu Ou,Liwen Zhang,Pengjun Xie,Rui Ye,Wenbiao Yin,Xinmiao Yu,Xinyu Wang,Xixi Wu,Xuanzhong Chen,Yida Zhao,Zhen Zhang,Zhengwei Tao,Zhongwang Zhang,Zile Qiao,Chenxi Wang,Donglei Yu,Gang Fu,Haiyang Shen,Jiayin Yang,Jun Lin,Junkai Zhang,Kui Zeng,Li Yang,Hailong Yin,Maojia Song,Ming Yan,Minpeng Liao,Peng Xia,Qian Xiao,Rui Min,Ruixue Ding,Runnan Fang,Shaowei Chen,Shen Huang,Shihang Wang,Shihao Cai,Weizhou Shen,Xiaobin Wang,Xin Guan,Xinyu Geng,Yingcheng Shi,Yuning Wu,Zhuo Chen,Zijian Li,Yong Jiang

from arxiv, https://tongyi-agent.github.io/blog

We present Tongyi DeepResearch, an agentic large language model, which is specifically designed for long-horizon, deep information-seeking research tasks. To incentivize autonomous deep research agency, Tongyi DeepResearch is developed through an end-to-end training framework that combines agentic mid-training and agentic post-training, enabling scalable reasoning and information seeking across complex tasks. We design a highly scalable data synthesis pipeline that is fully automatic, without relying on costly human annotation, and empowers all training stages. By constructing customized environments for each stage, our system enables stable and consistent interactions throughout. Tongyi DeepResearch, featuring 30.5 billion total parameters, with only 3.3 billion activated per token, achieves state-of-the-art performance across a range of agentic deep research benchmarks, including Humanity's Last Exam, BrowseComp, BrowseComp-ZH, WebWalkerQA, xbench-DeepSearch, FRAMES and xbench-DeepSearch-2510. We open-source the model, framework, and complete solutions to empower the community.

翻译：本文提出通义深研（Tongyi DeepResearch），一种专为长周期、深度信息检索研究任务设计的智能体大语言模型。为激励自主深度研究能力，通义深研通过端到端训练框架开发，融合智能体中期训练与智能体后期训练，实现跨复杂任务的可扩展推理与信息检索。我们设计了一个高度可扩展的数据合成流水线，该流水线完全自动化，无需依赖昂贵的人工标注，并为所有训练阶段提供支持。通过为每个阶段构建定制化环境，我们的系统确保了整个过程中稳定且一致的交互。通义深研拥有305亿总参数量，每次推理仅激活33亿参数，在包括Humanity's Last Exam、BrowseComp、BrowseComp-ZH、WebWalkerQA、xbench-DeepSearch、FRAMES及xbench-DeepSearch-2510等多项智能体深度研究基准测试中均达到最优性能。我们开源该模型、框架及完整解决方案，以赋能社区。

0

相关内容

设计是对现有状的一种重新认识和打破重组的过程，设计让一切变得更美。

DeepSeek技术溯源及前沿探索

DeepSeek技术溯源及前沿探索

专知会员服务

34+阅读 · 2025年5月28日

哈工大《“DeepSeek技术前沿与应用》专题讲座，1小时快速掌握DeepSeek基本原理, 67页ppt

哈工大《“DeepSeek技术前沿与应用》专题讲座，1小时快速掌握DeepSeek基本原理, 67页ppt

专知会员服务

38+阅读 · 2025年4月2日

北京大学：DeepSeek原理和落地应用智能交通技术，57页ppt

北京大学：DeepSeek原理和落地应用智能交通技术，57页ppt

专知会员服务

54+阅读 · 2025年3月11日

150页！《DeepSeek 大模型生态报告》

150页！《DeepSeek 大模型生态报告》

专知会员服务

86+阅读 · 2025年3月8日

117页《DeepSeek完全实用手册1.0版：从技术原理到使用技巧》

117页《DeepSeek完全实用手册1.0版：从技术原理到使用技巧》

专知会员服务

87+阅读 · 2025年3月4日

清华大学元宇宙实验室《DeepSeek：从入门到精通》文档，104页ppt

清华大学元宇宙实验室《DeepSeek：从入门到精通》文档，104页ppt

专知会员服务

245+阅读 · 2025年2月6日

最全面《DeepSeek R1》技术文章

最全面《DeepSeek R1》技术文章

专知会员服务

90+阅读 · 2025年1月29日

国产大模型DeepSeek-V3一夜火爆全球，《DeepSeek-V3技术报告》，53页pdf

国产大模型DeepSeek-V3一夜火爆全球，《DeepSeek-V3技术报告》，53页pdf

专知会员服务

88+阅读 · 2024年12月27日

《深度学习平台发展报告（2022年）》发布, 26页pdf

《深度学习平台发展报告（2022年）》发布, 26页pdf

专知会员服务

122+阅读 · 2022年7月29日

国防科大最新《深度学习视觉语音分析》综述论文，20页pdf涵盖200篇文献阐述视觉语音识别与生成技术进展

国防科大最新《深度学习视觉语音分析》综述论文，20页pdf涵盖200篇文献阐述视觉语音识别与生成技术进展

专知会员服务

44+阅读 · 2022年5月26日

深度学习可解释性研究进展

深度学习可解释性研究进展

专知

19+阅读 · 2020年6月26日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

免费中文深度学习全书：不仅有理论，还有配套代码分析

免费中文深度学习全书：不仅有理论，还有配套代码分析

PaperWeekly

26+阅读 · 2019年4月15日

清华大学朱文武课题组：《图深度学习》综述论文，15页pdf

清华大学朱文武课题组：《图深度学习》综述论文，15页pdf

专知

42+阅读 · 2018年12月16日

干货|36页最新深度学习综述论文：算法、技术、应用，181篇参考文献

干货|36页最新深度学习综述论文：算法、技术、应用，181篇参考文献

专知

27+阅读 · 2018年10月14日

大牛的《深度学习》笔记，Deep Learning速成教程

大牛的《深度学习》笔记，Deep Learning速成教程

极市平台

18+阅读 · 2018年4月10日

【深度学习】大牛的《深度学习》笔记，Deep Learning速成教程

【深度学习】大牛的《深度学习》笔记，Deep Learning速成教程

产业智能官

12+阅读 · 2018年4月6日

尽早跑通深度学习的实践代码，是入门深度学习的最快途径

尽早跑通深度学习的实践代码，是入门深度学习的最快途径

算法与数据结构

22+阅读 · 2017年12月13日

【下载】最新TensorFlow深度学习教程指引《Learning TensorFlow，构建深度学习系统指引》

【下载】最新TensorFlow深度学习教程指引《Learning TensorFlow，构建深度学习系统指引》

专知

28+阅读 · 2017年12月6日

Deep Learning（深度学习）各种资料网址

Deep Learning（深度学习）各种资料网址

数据挖掘入门与实战

11+阅读 · 2017年10月31日

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机映射框架下的图像语义分析与提取技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向物联网搜索的群智感知关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于极限学习单元的多生物特征图像深度学习建模与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于深度信息和显著计算的手势交互技术研究及应用

国家自然科学基金

1+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

面向多源遥感图像的深度学习技术与系统研究

国家自然科学基金

17+阅读 · 2014年12月31日

面向大规模知识图谱的查询处理关键技术研究

国家自然科学基金

18+阅读 · 2014年12月31日

DeepResearch-9K: A Challenging Benchmark Dataset of Deep-Research Agent

Arxiv

0+阅读 · 6月20日

One Interaction Is Worth a Thousand Guesses: Benchmarking the Interactive Capabilities of Deep Research Agents

Arxiv

0+阅读 · 6月20日

NeuroClaw Technical Report

Arxiv

0+阅读 · 6月16日

S1-DeepResearch: Beyond Search, Toward Real-World Long-Horizon Research Agents

Arxiv

0+阅读 · 6月13日

TVIR: Building Deep Research Agents Towards Text-Visual Interleaved Report Generation

Arxiv

0+阅读 · 6月11日

OneReason Technical Report

Arxiv

0+阅读 · 6月4日

Personalized Deep Research: A User-Centric Framework, Dataset, and Hybrid Evaluation for Knowledge Discovery

Arxiv

0+阅读 · 5月11日

OpenSearch-VL: An Open Recipe for Frontier Multimodal Search Agents

Arxiv

0+阅读 · 5月6日

DeepSeek-V3 Technical Report

Arxiv

18+阅读 · 2024年12月27日

Deep Generative Modelling: A Comparative Review of VAEs, GANs, Normalizing Flows, Energy-Based and Autoregressive Models

Arxiv

13+阅读 · 2021年3月8日

VIP会员

文章信息

相关主题

最新内容

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

专知会员服务

2+阅读 · 今天7:13

俄乌无人机战争的六大启示

俄乌无人机战争的六大启示

专知会员服务

4+阅读 · 今天7:07

《无人机空中监控：通信实验洞察》

《无人机空中监控：通信实验洞察》

专知会员服务

3+阅读 · 今天7:05

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

专知会员服务

3+阅读 · 今天6:59

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

12+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

5+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

10+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

12+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

6+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

10+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

8+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

9+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

8+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

6+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

13+阅读 · 7月31日

相关VIP内容

DeepSeek技术溯源及前沿探索

DeepSeek技术溯源及前沿探索

专知会员服务

34+阅读 · 2025年5月28日

哈工大《“DeepSeek技术前沿与应用》专题讲座，1小时快速掌握DeepSeek基本原理, 67页ppt

哈工大《“DeepSeek技术前沿与应用》专题讲座，1小时快速掌握DeepSeek基本原理, 67页ppt

专知会员服务

38+阅读 · 2025年4月2日

北京大学：DeepSeek原理和落地应用智能交通技术，57页ppt

北京大学：DeepSeek原理和落地应用智能交通技术，57页ppt

专知会员服务

54+阅读 · 2025年3月11日

150页！《DeepSeek 大模型生态报告》

150页！《DeepSeek 大模型生态报告》

专知会员服务

86+阅读 · 2025年3月8日

117页《DeepSeek完全实用手册1.0版：从技术原理到使用技巧》

117页《DeepSeek完全实用手册1.0版：从技术原理到使用技巧》

专知会员服务

87+阅读 · 2025年3月4日

清华大学元宇宙实验室《DeepSeek：从入门到精通》文档，104页ppt

清华大学元宇宙实验室《DeepSeek：从入门到精通》文档，104页ppt

专知会员服务

245+阅读 · 2025年2月6日

最全面《DeepSeek R1》技术文章

最全面《DeepSeek R1》技术文章

专知会员服务

90+阅读 · 2025年1月29日

国产大模型DeepSeek-V3一夜火爆全球，《DeepSeek-V3技术报告》，53页pdf

国产大模型DeepSeek-V3一夜火爆全球，《DeepSeek-V3技术报告》，53页pdf

专知会员服务

88+阅读 · 2024年12月27日

《深度学习平台发展报告（2022年）》发布, 26页pdf

《深度学习平台发展报告（2022年）》发布, 26页pdf

专知会员服务

122+阅读 · 2022年7月29日

国防科大最新《深度学习视觉语音分析》综述论文，20页pdf涵盖200篇文献阐述视觉语音识别与生成技术进展

国防科大最新《深度学习视觉语音分析》综述论文，20页pdf涵盖200篇文献阐述视觉语音识别与生成技术进展

专知会员服务

44+阅读 · 2022年5月26日

热门VIP内容

开通专知VIP会员享更多权益服务

俄乌无人机战争的六大启示

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《无人机空中监控：通信实验洞察》

相关资讯

深度学习可解释性研究进展

深度学习可解释性研究进展

专知

19+阅读 · 2020年6月26日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

免费中文深度学习全书：不仅有理论，还有配套代码分析

免费中文深度学习全书：不仅有理论，还有配套代码分析

PaperWeekly

26+阅读 · 2019年4月15日

清华大学朱文武课题组：《图深度学习》综述论文，15页pdf

清华大学朱文武课题组：《图深度学习》综述论文，15页pdf

专知

42+阅读 · 2018年12月16日

干货|36页最新深度学习综述论文：算法、技术、应用，181篇参考文献

干货|36页最新深度学习综述论文：算法、技术、应用，181篇参考文献

专知

27+阅读 · 2018年10月14日

大牛的《深度学习》笔记，Deep Learning速成教程

大牛的《深度学习》笔记，Deep Learning速成教程

极市平台

18+阅读 · 2018年4月10日

【深度学习】大牛的《深度学习》笔记，Deep Learning速成教程

【深度学习】大牛的《深度学习》笔记，Deep Learning速成教程

产业智能官

12+阅读 · 2018年4月6日

尽早跑通深度学习的实践代码，是入门深度学习的最快途径

尽早跑通深度学习的实践代码，是入门深度学习的最快途径

算法与数据结构

22+阅读 · 2017年12月13日

【下载】最新TensorFlow深度学习教程指引《Learning TensorFlow，构建深度学习系统指引》

【下载】最新TensorFlow深度学习教程指引《Learning TensorFlow，构建深度学习系统指引》

专知

28+阅读 · 2017年12月6日

Deep Learning（深度学习）各种资料网址

Deep Learning（深度学习）各种资料网址

数据挖掘入门与实战

11+阅读 · 2017年10月31日

相关论文

DeepResearch-9K: A Challenging Benchmark Dataset of Deep-Research Agent

Arxiv

0+阅读 · 6月20日

One Interaction Is Worth a Thousand Guesses: Benchmarking the Interactive Capabilities of Deep Research Agents

Arxiv

0+阅读 · 6月20日

NeuroClaw Technical Report

Arxiv

0+阅读 · 6月16日

S1-DeepResearch: Beyond Search, Toward Real-World Long-Horizon Research Agents

Arxiv

0+阅读 · 6月13日

TVIR: Building Deep Research Agents Towards Text-Visual Interleaved Report Generation

Arxiv

0+阅读 · 6月11日

OneReason Technical Report

Arxiv

0+阅读 · 6月4日

Personalized Deep Research: A User-Centric Framework, Dataset, and Hybrid Evaluation for Knowledge Discovery

Arxiv

0+阅读 · 5月11日

OpenSearch-VL: An Open Recipe for Frontier Multimodal Search Agents

Arxiv

0+阅读 · 5月6日

DeepSeek-V3 Technical Report

Arxiv

18+阅读 · 2024年12月27日

Deep Generative Modelling: A Comparative Review of VAEs, GANs, Normalizing Flows, Energy-Based and Autoregressive Models

Arxiv

13+阅读 · 2021年3月8日

相关基金

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机映射框架下的图像语义分析与提取技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向物联网搜索的群智感知关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于极限学习单元的多生物特征图像深度学习建模与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于深度信息和显著计算的手势交互技术研究及应用

国家自然科学基金

1+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

面向多源遥感图像的深度学习技术与系统研究

国家自然科学基金

17+阅读 · 2014年12月31日

面向大规模知识图谱的查询处理关键技术研究

国家自然科学基金

18+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员