【新书】推断工程，Inference Engineering,259页pdf - 专知VIP

会员服务 ·

4

推断工程 · 书籍 ·

【新书】推断工程，Inference Engineering,259页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

推理：AI 产业的核心价值与工程演进

在人工智能产业中，推理（Inference）是最具价值的范畴。相比之下，推理工程（Inference Engineering）仍处于起步阶段。推理工程师的工作贯穿了从 CUDA 到 Kubernetes 的整个技术栈，旨在实现生成式 AI 模型在生产环境（Production）中更快速、更低成本且更可靠的部署。 2022 年 11 月 30 日——即 ChatGPT 发布当天——全球范围内的推理工程师或许仅有数百名，尽管当时这一职位的称谓尚未统一。这些专家主要就职于 OpenAI、Midjourney、Anthropic 等前沿实验室，或 Google、NVIDIA 等科技巨头。

在当时看来，这似乎预示了 AI 产业的发展走向：生成式 AI 模型的训练门槛极高且耗资巨大，以至于可能只有极少数公司能够开发闭源模型，并进而需要推理工程来进行生产级部署。在这种假设的未来中，世界上的其他实体都将仅仅是 AI 的消费者，通过 API 以“Token”为单位租赁智能。

三年后的现状表明，训练生成式 AI 模型固然困难且昂贵，但其门槛并未高到让上述少数玩家垄断的程度。相反，开源模型的“寒武纪大爆发”（目前 Hugging Face 上的模型数量已超过 200 万且仍在增长）意味着每位工程师现在都可以部署专属的智能模型，以此为其 AI 产品赋能。全球的研究实验室——从美国的 OpenAI、NVIDIA Nemotron，到欧洲的 Mistral AI、Black Forest Labs，再到中国的阿里巴巴 Qwen（通义千问）、DeepSeek AI（深度求索）、零一万物（01.AI）及月之暗面（Moonshot AI）——都在定期发布涵盖各种模态（Modalities）的开源模型。

成为VIP会员查看完整内容

6

相关内容

推断工程

感知、推理、思考与规划：大型多模态推理模型综述

感知、推理、思考与规划：大型多模态推理模型综述

专知会员服务

40+阅读 · 2025年5月10日

【新书】AI工程：基于基础模型构建应用

【新书】AI工程：基于基础模型构建应用

专知会员服务

59+阅读 · 2024年12月30日

【博士论文】图神经网络算法推理，135页pdf

【博士论文】图神经网络算法推理，135页pdf

专知会员服务

49+阅读 · 2024年2月23日

161页《大模型推理》最新综述，涵盖650多篇大模型论文

161页《大模型推理》最新综述，涵盖650多篇大模型论文

专知会员服务

127+阅读 · 2024年1月27日

【2023新书】工程数学与人工智能:基础、方法与应用，530页pdf

【2023新书】工程数学与人工智能:基础、方法与应用，530页pdf

专知会员服务

136+阅读 · 2023年7月13日

【佐治亚理工学院博士论文】《基于图神经网络的知识推理》

【佐治亚理工学院博士论文】《基于图神经网络的知识推理》

专知会员服务

89+阅读 · 2022年8月31日

【新书】人工智能与因果推理，395页pdf

【新书】人工智能与因果推理，395页pdf

专知会员服务

215+阅读 · 2022年5月5日

【AAMAS2021】机器推理可解释，152页ppt，Machine Reasoning Explainability

专知会员服务

36+阅读 · 2021年5月9日

「因果推理」概述论文，13页pdf

专知会员服务

101+阅读 · 2021年3月20日

【干货书】面向工程师的机器学习，237页pdf概述机器学习理论、算法、概念全覆盖

【干货书】面向工程师的机器学习，237页pdf概述机器学习理论、算法、概念全覆盖

专知会员服务

85+阅读 · 2021年3月10日

【2022新书】人工智能自动医疗诊断的最新进展，371页pdf

【2022新书】人工智能自动医疗诊断的最新进展，371页pdf

专知

16+阅读 · 2022年8月16日

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

专知

33+阅读 · 2022年7月31日

「因果性机器学习」书册，88页pdf概述机器学习中的因果推理

「因果性机器学习」书册，88页pdf概述机器学习中的因果推理

专知

20+阅读 · 2021年3月21日

「因果推理」概述论文，13页pdf

「因果推理」概述论文，13页pdf

专知

16+阅读 · 2021年3月20日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

专知

23+阅读 · 2019年9月6日

【知识图谱】从知识工程到知识图谱全面回顾

【知识图谱】从知识工程到知识图谱全面回顾

产业智能官

20+阅读 · 2019年5月31日

自然语言处理常识推理综述论文，60页pdf

自然语言处理常识推理综述论文，60页pdf

专知

73+阅读 · 2019年4月4日

新书推荐《推荐系统进展：方法与技术》

新书推荐《推荐系统进展：方法与技术》

LibRec智能推荐

13+阅读 · 2019年3月18日

中国工程院：《全球工程前沿2018》（附PDF下载）

中国工程院：《全球工程前沿2018》（附PDF下载）

走向智能论坛

10+阅读 · 2018年12月5日

推荐系统的信息核挖掘及其应用研究

国家自然科学基金

8+阅读 · 2015年12月31日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

面向推荐系统中异构隐式反馈建模的迁移学习技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

考虑不确定性的结构动力学响应模型可信度确认方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

含有隐变量的因果结构学习与统计因果推断

国家自然科学基金

21+阅读 · 2013年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

因果推断的统计方法

国家自然科学基金

26+阅读 · 2011年12月31日

因果推断及不完全数据的统计分析

国家自然科学基金

23+阅读 · 2008年12月31日

Insidious Imaginaries: A Critical Overview of AI Speculations

Insidious Imaginaries: A Critical Overview of AI Speculations

Arxiv

0+阅读 · 2月19日

Toward Agentic Software Engineering Beyond Code: Framing Vision, Values, and Vocabulary

Arxiv

0+阅读 · 2月17日

Lifted Relational Probabilistic Inference via Implicit Learning

Arxiv

0+阅读 · 2月16日

Neural Force Field: Few-shot Learning of Generalized Physical Reasoning

Arxiv

0+阅读 · 2月10日

Towards Structured, State-Aware, and Execution-Grounded Reasoning for Software Engineering Agents

Arxiv

0+阅读 · 2月4日

Enhancing Mathematical Problem Solving in LLMs through Execution-Driven Reasoning Augmentation

Arxiv

0+阅读 · 2月3日

AdaReasoner: Dynamic Tool Orchestration for Iterative Visual Reasoning

Arxiv

0+阅读 · 1月28日

AdaReasoner: Dynamic Tool Orchestration for Iterative Visual Reasoning

Arxiv

0+阅读 · 1月26日

DeepSeek-R1 Thoughtology: Let's think about LLM Reasoning

Arxiv

0+阅读 · 1月15日

A Beautiful Mind: Principles and Strategies for AI-Augmented Human Reasoning

Arxiv

0+阅读 · 1月14日

VIP会员

相关主题

相关VIP内容

感知、推理、思考与规划：大型多模态推理模型综述

感知、推理、思考与规划：大型多模态推理模型综述

专知会员服务

40+阅读 · 2025年5月10日

【新书】AI工程：基于基础模型构建应用

【新书】AI工程：基于基础模型构建应用

专知会员服务

59+阅读 · 2024年12月30日

【博士论文】图神经网络算法推理，135页pdf

【博士论文】图神经网络算法推理，135页pdf

专知会员服务

49+阅读 · 2024年2月23日

161页《大模型推理》最新综述，涵盖650多篇大模型论文

161页《大模型推理》最新综述，涵盖650多篇大模型论文

专知会员服务

127+阅读 · 2024年1月27日

【2023新书】工程数学与人工智能:基础、方法与应用，530页pdf

【2023新书】工程数学与人工智能:基础、方法与应用，530页pdf

专知会员服务

136+阅读 · 2023年7月13日

【佐治亚理工学院博士论文】《基于图神经网络的知识推理》

【佐治亚理工学院博士论文】《基于图神经网络的知识推理》

专知会员服务

89+阅读 · 2022年8月31日

【新书】人工智能与因果推理，395页pdf

【新书】人工智能与因果推理，395页pdf

专知会员服务

215+阅读 · 2022年5月5日

【AAMAS2021】机器推理可解释，152页ppt，Machine Reasoning Explainability

专知会员服务

36+阅读 · 2021年5月9日

「因果推理」概述论文，13页pdf

专知会员服务

101+阅读 · 2021年3月20日

【干货书】面向工程师的机器学习，237页pdf概述机器学习理论、算法、概念全覆盖

【干货书】面向工程师的机器学习，237页pdf概述机器学习理论、算法、概念全覆盖

专知会员服务

85+阅读 · 2021年3月10日

热门VIP内容

开通专知VIP会员享更多权益服务

【新书】推断工程，Inference Engineering,259页pdf

伊朗称向以色列防空系统发射具备高超音速能力的“海巴尔”导弹

【博士论文】深度序列模型中的概率学习与生成机制

哈佛最新《面向系统设计的生成式 AI：从软件到硅片的重复性挑战与设计原则》

相关资讯

【2022新书】人工智能自动医疗诊断的最新进展，371页pdf

【2022新书】人工智能自动医疗诊断的最新进展，371页pdf

专知

16+阅读 · 2022年8月16日

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

专知

33+阅读 · 2022年7月31日

「因果性机器学习」书册，88页pdf概述机器学习中的因果推理

「因果性机器学习」书册，88页pdf概述机器学习中的因果推理

专知

20+阅读 · 2021年3月21日

「因果推理」概述论文，13页pdf

「因果推理」概述论文，13页pdf

专知

16+阅读 · 2021年3月20日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

专知

23+阅读 · 2019年9月6日

【知识图谱】从知识工程到知识图谱全面回顾

【知识图谱】从知识工程到知识图谱全面回顾

产业智能官

20+阅读 · 2019年5月31日

自然语言处理常识推理综述论文，60页pdf

自然语言处理常识推理综述论文，60页pdf

专知

73+阅读 · 2019年4月4日

新书推荐《推荐系统进展：方法与技术》

新书推荐《推荐系统进展：方法与技术》

LibRec智能推荐

13+阅读 · 2019年3月18日

中国工程院：《全球工程前沿2018》（附PDF下载）

中国工程院：《全球工程前沿2018》（附PDF下载）

走向智能论坛

10+阅读 · 2018年12月5日

相关基金

推荐系统的信息核挖掘及其应用研究

国家自然科学基金

8+阅读 · 2015年12月31日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

面向推荐系统中异构隐式反馈建模的迁移学习技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

考虑不确定性的结构动力学响应模型可信度确认方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

含有隐变量的因果结构学习与统计因果推断

国家自然科学基金

21+阅读 · 2013年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

因果推断的统计方法

国家自然科学基金

26+阅读 · 2011年12月31日

因果推断及不完全数据的统计分析

国家自然科学基金

23+阅读 · 2008年12月31日

相关论文

Insidious Imaginaries: A Critical Overview of AI Speculations

Insidious Imaginaries: A Critical Overview of AI Speculations

Arxiv

0+阅读 · 2月19日

Toward Agentic Software Engineering Beyond Code: Framing Vision, Values, and Vocabulary

Arxiv

0+阅读 · 2月17日

Lifted Relational Probabilistic Inference via Implicit Learning

Arxiv

0+阅读 · 2月16日

Neural Force Field: Few-shot Learning of Generalized Physical Reasoning

Arxiv

0+阅读 · 2月10日

Towards Structured, State-Aware, and Execution-Grounded Reasoning for Software Engineering Agents

Arxiv

0+阅读 · 2月4日

Enhancing Mathematical Problem Solving in LLMs through Execution-Driven Reasoning Augmentation

Arxiv

0+阅读 · 2月3日

AdaReasoner: Dynamic Tool Orchestration for Iterative Visual Reasoning

Arxiv

0+阅读 · 1月28日

AdaReasoner: Dynamic Tool Orchestration for Iterative Visual Reasoning

Arxiv

0+阅读 · 1月26日

DeepSeek-R1 Thoughtology: Let's think about LLM Reasoning

Arxiv

0+阅读 · 1月15日

A Beautiful Mind: Principles and Strategies for AI-Augmented Human Reasoning

Arxiv

0+阅读 · 1月14日

微信扫码咨询专知VIP会员