A Model-Free Universal AI - 专知论文

会员服务 ·

0

最优 · 最优性 · 通用人工智能 · 通用强化学习 · 智能体 ·

A Model-Free Universal AI

翻译：一种无模型的通用人工智能

Yegon Kim,Juho Lee

In general reinforcement learning, all established optimal agents, including AIXI, are model-based, explicitly maintaining and using environment models. This paper introduces Universal AI with Q-Induction (AIQI), the first model-free agent proven to be asymptotically $\varepsilon$-optimal in general RL. AIQI performs universal induction over distributional action-value functions, instead of policies or environments like previous works. Under a grain of truth condition, we prove that AIQI is strong asymptotically $\varepsilon$-optimal and asymptotically $\varepsilon$-Bayes-optimal. Our results significantly expand the diversity of known universal agents.

翻译：在通用强化学习中，所有已确立的最优智能体（包括AIXI）都是基于模型的，它们显式地维护并使用环境模型。本文介绍了基于Q归纳的通用人工智能（AIQI），这是首个被证明在通用强化学习中具有渐近$\varepsilon$最优性的无模型智能体。AIQI对分布式的动作-价值函数进行通用归纳，而非像先前工作那样对策略或环境进行归纳。在"真相颗粒"条件下，我们证明了AIQI具有强渐近$\varepsilon$最优性以及渐近$\varepsilon$贝叶斯最优性。我们的结果显著扩展了已知通用智能体的多样性。

0

相关内容

CVPR 2026 Findings | 算力砍半、性能不降！全开源 A₁模型：让机器人大模型真正走向落地

CVPR 2026 Findings | 算力砍半、性能不降！全开源 A₁模型：让机器人大模型真正走向落地

专知会员服务

13+阅读 · 4月12日

最新新Agent综述！76页327篇论文梳理，北交大桑基韬教授团队发布《迈向模型原生智能体式人工智能的范式转变综述》

最新新Agent综述！76页327篇论文梳理，北交大桑基韬教授团队发布《迈向模型原生智能体式人工智能的范式转变综述》

专知会员服务

40+阅读 · 2025年10月17日

可解释人工智能（XAI）：从内在可解释性到大语言模型

可解释人工智能（XAI）：从内在可解释性到大语言模型

专知会员服务

34+阅读 · 2025年1月20日

【新书】《普适人工智能导论》DeepMind Hutter等编著，附pdf与Slides

【新书】《普适人工智能导论》DeepMind Hutter等编著，附pdf与Slides

专知会员服务

56+阅读 · 2024年12月24日

通用型虚拟智能体：关于跨数字平台自主智能体的综述

通用型虚拟智能体：关于跨数字平台自主智能体的综述

专知会员服务

35+阅读 · 2024年11月20日

通往具身通用智能：如何让机器从自然模态中学习到世界模型？

通往具身通用智能：如何让机器从自然模态中学习到世界模型？

专知会员服务

61+阅读 · 2023年12月30日

走向通用虚拟智能体

走向通用虚拟智能体

专知会员服务

76+阅读 · 2023年11月26日

AI Agent：基于大模型的自主智能体

AI Agent：基于大模型的自主智能体

专知会员服务

249+阅读 · 2023年9月9日

AutoGPT太火了，无需人类插手自主完成任务，GitHub2.7万星

AutoGPT太火了，无需人类插手自主完成任务，GitHub2.7万星

专知会员服务

43+阅读 · 2023年4月14日

【量子强化学习概念】《量子计算和强化学习：实现通用人工智能的伙伴》2022最新17页论文

【量子强化学习概念】《量子计算和强化学习：实现通用人工智能的伙伴》2022最新17页论文

专知会员服务

58+阅读 · 2022年10月10日

精通ChatGPT等大模型，掌握最前沿技术，这有份绝佳资源

精通ChatGPT等大模型，掌握最前沿技术，这有份绝佳资源

机器之心

15+阅读 · 2023年4月12日

DeepMind开源最牛无监督学习BigBiGAN预训练模型

DeepMind开源最牛无监督学习BigBiGAN预训练模型

新智元

10+阅读 · 2019年10月10日

专访俞栋：多模态是迈向通用人工智能的重要方向

专访俞栋：多模态是迈向通用人工智能的重要方向

AI科技评论

26+阅读 · 2019年9月9日

大三学生独自破解逆天AI模型：我只是把撩妹的时间，都用来研究机器学习了

大三学生独自破解逆天AI模型：我只是把撩妹的时间，都用来研究机器学习了

量子位

12+阅读 · 2019年6月9日

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

云头条

18+阅读 · 2019年4月23日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

这可能是「多模态机器学习」最通俗易懂的介绍

这可能是「多模态机器学习」最通俗易懂的介绍

计算机视觉life

113+阅读 · 2018年12月20日

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

AI100

11+阅读 · 2018年9月4日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

面向聋儿言语康复的多模态人机交互模型及技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于神经网络的无约束0-1二次规划全局最优算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向存储受限应用的GPU性能预测模型和通信优化关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

无人驾驶车辆智能测试评估与环境设计

国家自然科学基金

28+阅读 · 2014年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

Scaling Generalist Data-Analytic Agents

Arxiv

0+阅读 · 3月12日

IronEngine: Towards General AI Assistant

Arxiv

0+阅读 · 3月9日

Federated Agentic AI for Wireless Networks: Fundamentals, Approaches, and Applications

Arxiv

0+阅读 · 3月2日

A Minimal Agent for Automated Theorem Proving

Arxiv

0+阅读 · 2月27日

OmniGAIA: Towards Native Omni-Modal AI Agents

Arxiv

0+阅读 · 2月26日

UniManip: General-Purpose Zero-Shot Robotic Manipulation with Agentic Operational Graph

Arxiv

0+阅读 · 2月13日

Can Complexity and Uncomputability Explain Intelligence? SuperARC: A Test for Artificial Super Intelligence Based on Recursive Compression

Arxiv

0+阅读 · 2月11日

Agentifying Agentic AI

Arxiv

0+阅读 · 2月10日

DeepAgent: A General Reasoning Agent with Scalable Toolsets

Arxiv

0+阅读 · 2月5日

Self-evolving Embodied AI

Arxiv

0+阅读 · 2月4日

VIP会员

文章信息

相关主题

通用人工智能

通用强化学习

最新内容

《美陆军条例：陆军指挥政策（2026版）》

《美陆军条例：陆军指挥政策（2026版）》

专知会员服务

7+阅读 · 今天8:10

《提升美军全域城市作战训练最佳实践的案例研究》366页

《提升美军全域城市作战训练最佳实践的案例研究》366页

专知会员服务

7+阅读 · 今天8:06

《军用自主人工智能系统的治理与安全》

《军用自主人工智能系统的治理与安全》

专知会员服务

5+阅读 · 今天8:02

美海军数字作战负责人：如何利用数据快速生成战斗力

美海军数字作战负责人：如何利用数据快速生成战斗力

专知会员服务

5+阅读 · 今天7:32

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

11+阅读 · 4月20日

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

9+阅读 · 4月20日

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

6+阅读 · 4月20日

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

4+阅读 · 4月20日

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

专知会员服务

8+阅读 · 4月20日

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

专知会员服务

4+阅读 · 4月20日

高效视频扩散模型：进展与挑战

高效视频扩散模型：进展与挑战

专知会员服务

4+阅读 · 4月20日

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

8+阅读 · 4月20日

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

7+阅读 · 4月20日

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

12+阅读 · 4月20日

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

6+阅读 · 4月20日

相关VIP内容

CVPR 2026 Findings | 算力砍半、性能不降！全开源 A₁模型：让机器人大模型真正走向落地

CVPR 2026 Findings | 算力砍半、性能不降！全开源 A₁模型：让机器人大模型真正走向落地

专知会员服务

13+阅读 · 4月12日

最新新Agent综述！76页327篇论文梳理，北交大桑基韬教授团队发布《迈向模型原生智能体式人工智能的范式转变综述》

最新新Agent综述！76页327篇论文梳理，北交大桑基韬教授团队发布《迈向模型原生智能体式人工智能的范式转变综述》

专知会员服务

40+阅读 · 2025年10月17日

可解释人工智能（XAI）：从内在可解释性到大语言模型

可解释人工智能（XAI）：从内在可解释性到大语言模型

专知会员服务

34+阅读 · 2025年1月20日

【新书】《普适人工智能导论》DeepMind Hutter等编著，附pdf与Slides

【新书】《普适人工智能导论》DeepMind Hutter等编著，附pdf与Slides

专知会员服务

56+阅读 · 2024年12月24日

通用型虚拟智能体：关于跨数字平台自主智能体的综述

通用型虚拟智能体：关于跨数字平台自主智能体的综述

专知会员服务

35+阅读 · 2024年11月20日

通往具身通用智能：如何让机器从自然模态中学习到世界模型？

通往具身通用智能：如何让机器从自然模态中学习到世界模型？

专知会员服务

61+阅读 · 2023年12月30日

走向通用虚拟智能体

走向通用虚拟智能体

专知会员服务

76+阅读 · 2023年11月26日

AI Agent：基于大模型的自主智能体

AI Agent：基于大模型的自主智能体

专知会员服务

249+阅读 · 2023年9月9日

AutoGPT太火了，无需人类插手自主完成任务，GitHub2.7万星

AutoGPT太火了，无需人类插手自主完成任务，GitHub2.7万星

专知会员服务

43+阅读 · 2023年4月14日

【量子强化学习概念】《量子计算和强化学习：实现通用人工智能的伙伴》2022最新17页论文

【量子强化学习概念】《量子计算和强化学习：实现通用人工智能的伙伴》2022最新17页论文

专知会员服务

58+阅读 · 2022年10月10日

热门VIP内容

开通专知VIP会员享更多权益服务

《提升美军全域城市作战训练最佳实践的案例研究》366页

美海军数字作战负责人：如何利用数据快速生成战斗力

《美陆军条例：陆军指挥政策（2026版）》

《军用自主人工智能系统的治理与安全》

相关资讯

精通ChatGPT等大模型，掌握最前沿技术，这有份绝佳资源

精通ChatGPT等大模型，掌握最前沿技术，这有份绝佳资源

机器之心

15+阅读 · 2023年4月12日

DeepMind开源最牛无监督学习BigBiGAN预训练模型

DeepMind开源最牛无监督学习BigBiGAN预训练模型

新智元

10+阅读 · 2019年10月10日

专访俞栋：多模态是迈向通用人工智能的重要方向

专访俞栋：多模态是迈向通用人工智能的重要方向

AI科技评论

26+阅读 · 2019年9月9日

大三学生独自破解逆天AI模型：我只是把撩妹的时间，都用来研究机器学习了

大三学生独自破解逆天AI模型：我只是把撩妹的时间，都用来研究机器学习了

量子位

12+阅读 · 2019年6月9日

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

云头条

18+阅读 · 2019年4月23日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

这可能是「多模态机器学习」最通俗易懂的介绍

这可能是「多模态机器学习」最通俗易懂的介绍

计算机视觉life

113+阅读 · 2018年12月20日

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

AI100

11+阅读 · 2018年9月4日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

相关论文

Scaling Generalist Data-Analytic Agents

Arxiv

0+阅读 · 3月12日

IronEngine: Towards General AI Assistant

Arxiv

0+阅读 · 3月9日

Federated Agentic AI for Wireless Networks: Fundamentals, Approaches, and Applications

Arxiv

0+阅读 · 3月2日

A Minimal Agent for Automated Theorem Proving

Arxiv

0+阅读 · 2月27日

OmniGAIA: Towards Native Omni-Modal AI Agents

Arxiv

0+阅读 · 2月26日

UniManip: General-Purpose Zero-Shot Robotic Manipulation with Agentic Operational Graph

Arxiv

0+阅读 · 2月13日

Can Complexity and Uncomputability Explain Intelligence? SuperARC: A Test for Artificial Super Intelligence Based on Recursive Compression

Arxiv

0+阅读 · 2月11日

Agentifying Agentic AI

Arxiv

0+阅读 · 2月10日

DeepAgent: A General Reasoning Agent with Scalable Toolsets

Arxiv

0+阅读 · 2月5日

Self-evolving Embodied AI

Arxiv

0+阅读 · 2月4日

相关基金

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

面向聋儿言语康复的多模态人机交互模型及技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于神经网络的无约束0-1二次规划全局最优算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向存储受限应用的GPU性能预测模型和通信优化关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

无人驾驶车辆智能测试评估与环境设计

国家自然科学基金

28+阅读 · 2014年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员