The Road to Artificial SuperIntelligence: A Comprehensive Survey of Superalignment - 专知论文

会员服务 ·

0

AI · 监督 · 语言模型化 · MoDELS · Spark ·

The Road to Artificial SuperIntelligence: A Comprehensive Survey of Superalignment

翻译：暂无翻译

HyunJin Kim,DongHyun Ryu,Xiaoyuan Yi,Jing Yao,Jianxun Lian,Muhua Huang,Shitong Duan,JinYeong Bak,Xing Xie

from arxiv, 24 pages

The emergence of large language models (LLMs) has sparked discussion on Artificial Superintelligence (ASI), a hypothetical AI system that surpasses human intelligence. Although ASI remains hypothetical and far beyond current AI capabilities, discussing its potential and exploring its feasibility and potential risks is critical for the development of future AI systems. The idea of superalignment originates from scalable oversight, which studies how to supervise increasingly capable AI systems when direct human supervision becomes insufficient. In this paper, we focus on the superalignment problem: "The process of supervising, controlling, and governing artificial superintelligence." We first review scalable oversight paradigms-Sandwiching, Self-Enhancement, and Weak-to-Strong Generalization -- then analyze the limitations of current paradigms through the lens of possibility and impossibility, discuss key challenges, and propose pathways for the safe and continual improvement of future AI systems.

翻译：暂无翻译

0

相关内容

人工智能杂志AI(Artificial Intelligence)是目前公认的发表该领域最新研究成果的主要国际论坛。该期刊欢迎有关AI广泛方面的论文，这些论文构成了整个领域的进步，也欢迎介绍人工智能应用的论文，但重点应该放在新的和新颖的人工智能方法如何提高应用领域的性能，而不是介绍传统人工智能方法的另一个应用。关于应用的论文应该描述一个原则性的解决方案，强调其新颖性，并对正在开发的人工智能技术进行深入的评估。官网地址：http://dblp.uni-trier.de/db/journals/ai/

大语言模型高效推理中的动态模型路由与级联技术综述

大语言模型高效推理中的动态模型路由与级联技术综述

专知会员服务

14+阅读 · 3月6日

超越语言的推理：潜在思维链推理的综合综述

超越语言的推理：潜在思维链推理的综合综述

专知会员服务

22+阅读 · 2025年5月23日

大语言模型复杂推理的自我进化机制：研究综述与前沿展望

大语言模型复杂推理的自我进化机制：研究综述与前沿展望

专知会员服务

32+阅读 · 2025年4月17日

142页DeepSeek-R1 思维链技术：让我们一起<思考>大语言模型（LLM）的推理能力

142页DeepSeek-R1 思维链技术：让我们一起<思考>大语言模型（LLM）的推理能力

专知会员服务

48+阅读 · 2025年4月12日

174页！《大语言模型》最新综述：能力与局限性分析

174页！《大语言模型》最新综述：能力与局限性分析

专知会员服务

64+阅读 · 2025年1月12日

通往人工超智能的道路：超级对齐的全面综述

通往人工超智能的道路：超级对齐的全面综述

专知会员服务

43+阅读 · 2024年12月24日

《SysEngBench：评估系统工程中大型语言模型的新基准》美海军最新报告

《SysEngBench：评估系统工程中大型语言模型的新基准》美海军最新报告

专知会员服务

51+阅读 · 2024年6月30日

中科大腾讯最新《多模态大型语言模型》综述，详述多模态指令微调、上下文学习、思维链和辅助视觉推理技术

中科大腾讯最新《多模态大型语言模型》综述，详述多模态指令微调、上下文学习、思维链和辅助视觉推理技术

专知会员服务

105+阅读 · 2023年6月27日

《大型语言模型》最新报告，52页ppt，DeepMind Angeliki Lazaridou

《大型语言模型》最新报告，52页ppt，DeepMind Angeliki Lazaridou

专知会员服务

67+阅读 · 2022年9月17日

【CVPR 2022】面向无噪声对象轮廓的弱监督语义分割，Towards Noiseless Object Contours for Weakly Supervised Semantic Segmentation

【CVPR 2022】面向无噪声对象轮廓的弱监督语义分割，Towards Noiseless Object Contours for Weakly Supervised Semantic Segmentation

专知会员服务

10+阅读 · 2022年3月12日

ICML20 workshop | 感知与推理的桥梁：超越图神经网络

ICML20 workshop | 感知与推理的桥梁：超越图神经网络

专知

30+阅读 · 2020年8月7日

【CIKM2019论文】韩家炜团队HyperMine：富文本异构信息网络探索上位词

【CIKM2019论文】韩家炜团队HyperMine：富文本异构信息网络探索上位词

专知

14+阅读 · 2019年11月9日

Graph Neural Networks 综述

Graph Neural Networks 综述

计算机视觉life

30+阅读 · 2019年8月13日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

赛尔原创 | AAAI 2019 Gaussian Transformer: 一种自然语言推理的轻量方法

赛尔原创 | AAAI 2019 Gaussian Transformer: 一种自然语言推理的轻量方法

哈工大SCIR

13+阅读 · 2019年5月6日

从网络设计到实际应用，深度学习图像超分辨率综述

从网络设计到实际应用，深度学习图像超分辨率综述

机器之心

25+阅读 · 2019年2月24日

深度学习图像超分辨率最新综述：从模型到应用

深度学习图像超分辨率最新综述：从模型到应用

炼数成金订阅号

65+阅读 · 2019年2月20日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

终于！Supervise.ly 发布人像分割数据集啦（免费开源）

终于！Supervise.ly 发布人像分割数据集啦（免费开源）

AI研习社

11+阅读 · 2018年4月10日

超导量子比特器件的材料、工艺、设计探索

国家自然科学基金

1+阅读 · 2017年12月31日

基于自媒体处理中的极坐标下的非线性理论及超分辨率重建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

广义Cartan型模李超代数的构作与阶化模

国家自然科学基金

0+阅读 · 2015年12月31日

读者视角的跨领域隐式情感分析理论及关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

基于网络的情感语义词典的自动构建技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

超图的张量表示及其谱理论研究

国家自然科学基金

2+阅读 · 2014年12月31日

笔迹图像中关键词语过滤技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于超像素稀疏表示的图像超分辨率方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

超光谱、全偏振、立体形貌的多模态成像研究

国家自然科学基金

0+阅读 · 2014年12月31日

The Trilemma of Truth in Large Language Models

Arxiv

0+阅读 · 6月22日

Beyond Value Benchmarks: Measuring Value-Structure Alignment in Large Language Models via Symmetric Q-Sorts

Arxiv

0+阅读 · 6月20日

Apparent Psychological Profiles of Large Language Models are Largely a Measurement Artifact

Arxiv

0+阅读 · 6月18日

From Texts to Scores: Tracing the Emergence of Essay Quality Representations in Large Language Models

Arxiv

0+阅读 · 6月18日

Diffusion Language Models: An Experimental Analysis

Arxiv

0+阅读 · 6月17日

Diffusion-Proof: Recipe for Formal Theorem Proving Beyond Auto-Regressive Generation

Arxiv

0+阅读 · 6月17日

MeEvo: Metacognitive Evolution Combined with Natural Evolution for Automatic Heuristic Design

Arxiv

0+阅读 · 6月17日

SciHorizon-GENE: Benchmarking LLM for Life Sciences Inference from Gene Knowledge to Functional Understanding

Arxiv

0+阅读 · 6月17日

A Comprehensive Survey of Direct Preference Optimization: Datasets, Theories, Variants, and Applications

Arxiv

0+阅读 · 6月9日

Graph Self-Supervised Learning: A Survey

Arxiv

15+阅读 · 2021年8月5日

VIP会员

文章信息

相关主题

语言模型化

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

4+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

5+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

6+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

6+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

22+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

大语言模型高效推理中的动态模型路由与级联技术综述

大语言模型高效推理中的动态模型路由与级联技术综述

专知会员服务

14+阅读 · 3月6日

超越语言的推理：潜在思维链推理的综合综述

超越语言的推理：潜在思维链推理的综合综述

专知会员服务

22+阅读 · 2025年5月23日

大语言模型复杂推理的自我进化机制：研究综述与前沿展望

大语言模型复杂推理的自我进化机制：研究综述与前沿展望

专知会员服务

32+阅读 · 2025年4月17日

142页DeepSeek-R1 思维链技术：让我们一起<思考>大语言模型（LLM）的推理能力

142页DeepSeek-R1 思维链技术：让我们一起<思考>大语言模型（LLM）的推理能力

专知会员服务

48+阅读 · 2025年4月12日

174页！《大语言模型》最新综述：能力与局限性分析

174页！《大语言模型》最新综述：能力与局限性分析

专知会员服务

64+阅读 · 2025年1月12日

通往人工超智能的道路：超级对齐的全面综述

通往人工超智能的道路：超级对齐的全面综述

专知会员服务

43+阅读 · 2024年12月24日

《SysEngBench：评估系统工程中大型语言模型的新基准》美海军最新报告

《SysEngBench：评估系统工程中大型语言模型的新基准》美海军最新报告

专知会员服务

51+阅读 · 2024年6月30日

中科大腾讯最新《多模态大型语言模型》综述，详述多模态指令微调、上下文学习、思维链和辅助视觉推理技术

中科大腾讯最新《多模态大型语言模型》综述，详述多模态指令微调、上下文学习、思维链和辅助视觉推理技术

专知会员服务

105+阅读 · 2023年6月27日

《大型语言模型》最新报告，52页ppt，DeepMind Angeliki Lazaridou

《大型语言模型》最新报告，52页ppt，DeepMind Angeliki Lazaridou

专知会员服务

67+阅读 · 2022年9月17日

【CVPR 2022】面向无噪声对象轮廓的弱监督语义分割，Towards Noiseless Object Contours for Weakly Supervised Semantic Segmentation

【CVPR 2022】面向无噪声对象轮廓的弱监督语义分割，Towards Noiseless Object Contours for Weakly Supervised Semantic Segmentation

专知会员服务

10+阅读 · 2022年3月12日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

ICML20 workshop | 感知与推理的桥梁：超越图神经网络

ICML20 workshop | 感知与推理的桥梁：超越图神经网络

专知

30+阅读 · 2020年8月7日

【CIKM2019论文】韩家炜团队HyperMine：富文本异构信息网络探索上位词

【CIKM2019论文】韩家炜团队HyperMine：富文本异构信息网络探索上位词

专知

14+阅读 · 2019年11月9日

Graph Neural Networks 综述

Graph Neural Networks 综述

计算机视觉life

30+阅读 · 2019年8月13日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

赛尔原创 | AAAI 2019 Gaussian Transformer: 一种自然语言推理的轻量方法

赛尔原创 | AAAI 2019 Gaussian Transformer: 一种自然语言推理的轻量方法

哈工大SCIR

13+阅读 · 2019年5月6日

从网络设计到实际应用，深度学习图像超分辨率综述

从网络设计到实际应用，深度学习图像超分辨率综述

机器之心

25+阅读 · 2019年2月24日

深度学习图像超分辨率最新综述：从模型到应用

深度学习图像超分辨率最新综述：从模型到应用

炼数成金订阅号

65+阅读 · 2019年2月20日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

终于！Supervise.ly 发布人像分割数据集啦（免费开源）

终于！Supervise.ly 发布人像分割数据集啦（免费开源）

AI研习社

11+阅读 · 2018年4月10日

相关论文

The Trilemma of Truth in Large Language Models

Arxiv

0+阅读 · 6月22日

Beyond Value Benchmarks: Measuring Value-Structure Alignment in Large Language Models via Symmetric Q-Sorts

Arxiv

0+阅读 · 6月20日

Apparent Psychological Profiles of Large Language Models are Largely a Measurement Artifact

Arxiv

0+阅读 · 6月18日

From Texts to Scores: Tracing the Emergence of Essay Quality Representations in Large Language Models

Arxiv

0+阅读 · 6月18日

Diffusion Language Models: An Experimental Analysis

Arxiv

0+阅读 · 6月17日

Diffusion-Proof: Recipe for Formal Theorem Proving Beyond Auto-Regressive Generation

Arxiv

0+阅读 · 6月17日

MeEvo: Metacognitive Evolution Combined with Natural Evolution for Automatic Heuristic Design

Arxiv

0+阅读 · 6月17日

SciHorizon-GENE: Benchmarking LLM for Life Sciences Inference from Gene Knowledge to Functional Understanding

Arxiv

0+阅读 · 6月17日

A Comprehensive Survey of Direct Preference Optimization: Datasets, Theories, Variants, and Applications

Arxiv

0+阅读 · 6月9日

Graph Self-Supervised Learning: A Survey

Arxiv

15+阅读 · 2021年8月5日

相关基金

超导量子比特器件的材料、工艺、设计探索

国家自然科学基金

1+阅读 · 2017年12月31日

基于自媒体处理中的极坐标下的非线性理论及超分辨率重建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

广义Cartan型模李超代数的构作与阶化模

国家自然科学基金

0+阅读 · 2015年12月31日

读者视角的跨领域隐式情感分析理论及关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

基于网络的情感语义词典的自动构建技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

超图的张量表示及其谱理论研究

国家自然科学基金

2+阅读 · 2014年12月31日

笔迹图像中关键词语过滤技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于超像素稀疏表示的图像超分辨率方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

超光谱、全偏振、立体形貌的多模态成像研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员