Limitations on Accurate, Trusted, Human-level Reasoning - 专知论文

会员服务 ·

0

系统 · 可信性 · 人工智能系统 · 智能系统 · 断言 ·

Limitations on Accurate, Trusted, Human-level Reasoning

翻译：关于精确、可信且具有人类水平推理能力的局限性

Rina Panigrahy,Vatsal Sharan

from arxiv, 19 pages, 1 figure

We identify a fundamental incompatibility between the goals of accuracy, trust, and human-level reasoning in artificial intelligence (AI) systems, for strict mathematical definitions of these notions. We define accuracy of a system as the property that it never makes any false claims when it has the ability to abstain from making a prediction on any input, and trust as the assumption that the system is accurate. We define human-level reasoning as the property of an AI system always matching or exceeding human capability. Our core finding is that -- for our formal definitions of these notions -- an accurate and trusted AI system cannot be a human-level reasoning system: for such an accurate, trusted system there are task instances which are easily and provably solvable by a human but not by the system. Our proofs draw parallels to Gödel's incompleteness theorems and Turing's proof of the undecidability of the halting problem, and can be regarded as interpretations of Gödel's and Turing's results. Key to our proof is the formalization of the notion of trust, which allows us to separate the intrinsic property of a system (being accurate) from its epistemic status (being trusted).

翻译：我们发现在严格数学定义下，人工智能系统中的精确性、可信性与人类水平推理目标之间存在根本性矛盾。我们将系统的精确性定义为：当其具备对任意输入可放弃预测的能力时，系统不会作出任何错误断言的性质；将可信性定义为系统精确性的预设前提。我们将人类水平推理定义为人工智能系统始终达到或超越人类能力水平的性质。核心发现是：基于对这些概念的正式定义，一个精确且可信的人工智能系统无法成为人类水平推理系统——对于这类精确可信的系统，存在人类可以轻松、可证明地解决但系统无法解决的任务实例。我们的证明与哥德尔不完备定理及图灵对停机问题不可判定性的证明存在相似性，可视为对哥德尔与图灵定理的诠释。证明的关键在于对可信性概念的形式化，这使我们得以区分系统的内在属性（精确性）与其认知地位（可信性）。

0

相关内容

可解释人工智能的基础

可解释人工智能的基础

专知会员服务

33+阅读 · 2025年10月26日

【CMU博士论文】基于机器学习的可信科学推理

【CMU博士论文】基于机器学习的可信科学推理

专知会员服务

17+阅读 · 2025年5月26日

《提高决策支持系统透明度的可解释人工智能》最新100页

《提高决策支持系统透明度的可解释人工智能》最新100页

专知会员服务

52+阅读 · 2024年11月28日

AI4Math？IJCAI2023最新《数学推理中的深度学习》教程，详述深度学习数学推理最新进展与未来展望，243页ppt

AI4Math？IJCAI2023最新《数学推理中的深度学习》教程，详述深度学习数学推理最新进展与未来展望，243页ppt

专知会员服务

57+阅读 · 2023年8月28日

《揭开黑盒：军事人工智能的可预测性和可理解性》40页报告

《揭开黑盒：军事人工智能的可预测性和可理解性》40页报告

专知会员服务

125+阅读 · 2023年3月4日

深度学习在数学推理中的应用综述

深度学习在数学推理中的应用综述

专知会员服务

49+阅读 · 2022年12月25日

人工智能系统可信性度量评估研究综述

人工智能系统可信性度量评估研究综述

专知会员服务

99+阅读 · 2022年1月30日

集大成者！经典书《知识表示学习》，1035页pdf系统性讲解人工智能知识表示与推理基础、算法与应用

集大成者！经典书《知识表示学习》，1035页pdf系统性讲解人工智能知识表示与推理基础、算法与应用

专知会员服务

156+阅读 · 2020年11月20日

【机器推理可解释性】Machine Reasoning Explainability

【机器推理可解释性】Machine Reasoning Explainability

专知会员服务

35+阅读 · 2020年9月3日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能，67页pdf402篇文献

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能，67页pdf402篇文献

专知会员服务

120+阅读 · 2019年12月27日

推荐！【中文版】《可信人工智能：重新思考未来军事指挥》英智库皇家国防安全联合军种研究所2022最新48页报告

推荐！【中文版】《可信人工智能：重新思考未来军事指挥》英智库皇家国防安全联合军种研究所2022最新48页报告

专知

69+阅读 · 2022年7月20日

「因果推理」概述论文，13页pdf

「因果推理」概述论文，13页pdf

专知

16+阅读 · 2021年3月20日

最新《可解释人工智能》概述，50页ppt

最新《可解释人工智能》概述，50页ppt

专知

12+阅读 · 2021年3月17日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

谷歌可解释人工智能白皮书，27页pdf，Google AI Explainability Whitepaper

谷歌可解释人工智能白皮书，27页pdf，Google AI Explainability Whitepaper

专知

28+阅读 · 2019年12月13日

知识图谱在可解释人工智能中的作用，附81页ppt

知识图谱在可解释人工智能中的作用，附81页ppt

专知

89+阅读 · 2019年11月11日

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

专知

11+阅读 · 2019年2月8日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

理解人类推理的深度学习

理解人类推理的深度学习

论智

19+阅读 · 2018年11月7日

【混合智能】人机混合智能的哲学思考

【混合智能】人机混合智能的哲学思考

产业智能官

12+阅读 · 2018年10月28日

正则双极值模糊推理的理论与方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于格值逻辑的语言真值α-群锁语义归结自动推理研究

国家自然科学基金

0+阅读 · 2015年12月31日

Choquet期望下极限定理及其收敛速度的刻画

国家自然科学基金

0+阅读 · 2015年12月31日

考虑不确定性的结构动力学响应模型可信度确认方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于信息密度的广义不确定直觉模糊集成算子及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

对偶三角模-余模逻辑的语义理论与应用

国家自然科学基金

0+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

因果推断及不完全数据的统计分析

国家自然科学基金

23+阅读 · 2008年12月31日

Actionable Interpretability Must Be Defined in Terms of Symmetries

Arxiv

0+阅读 · 6月12日

Possibilistic Predictive Uncertainty for Deep Learning

Arxiv

0+阅读 · 6月11日

MentisOculi: Revealing the Limits of Reasoning with Mental Imagery

Arxiv

0+阅读 · 6月10日

Reason, Then Re-reason: Cross-view Revisiting Improves Spatial Reasoning

Arxiv

0+阅读 · 6月10日

Ethical and Technical Limits of Deepfake Speech Datasets

Arxiv

0+阅读 · 6月9日

Fundamental Limitation in Explaining AI

Arxiv

0+阅读 · 5月31日

ReasonOps: A Unified Operational Paradigm for Trustworthy Verified LLM Reasoning

Arxiv

0+阅读 · 5月26日

On the Epistemic Uncertainty of Overparametrized Neural Networks

Arxiv

0+阅读 · 5月24日

The Reasoning Trap: An Information-Theoretic Bound on Closed-System Multi-Step LLM Reasoning

Arxiv

0+阅读 · 5月5日

The Computational Boundary of Inference: Capability Internalization, Training, and the Turing Jump

Arxiv

0+阅读 · 4月9日

VIP会员

文章信息

相关主题

人工智能系统

最新内容

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

4+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

1+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

5+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

6+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

2+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

6+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

4+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

4+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

8+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

8+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

8+阅读 · 7月31日

相关VIP内容

可解释人工智能的基础

可解释人工智能的基础

专知会员服务

33+阅读 · 2025年10月26日

【CMU博士论文】基于机器学习的可信科学推理

【CMU博士论文】基于机器学习的可信科学推理

专知会员服务

17+阅读 · 2025年5月26日

《提高决策支持系统透明度的可解释人工智能》最新100页

《提高决策支持系统透明度的可解释人工智能》最新100页

专知会员服务

52+阅读 · 2024年11月28日

AI4Math？IJCAI2023最新《数学推理中的深度学习》教程，详述深度学习数学推理最新进展与未来展望，243页ppt

AI4Math？IJCAI2023最新《数学推理中的深度学习》教程，详述深度学习数学推理最新进展与未来展望，243页ppt

专知会员服务

57+阅读 · 2023年8月28日

《揭开黑盒：军事人工智能的可预测性和可理解性》40页报告

《揭开黑盒：军事人工智能的可预测性和可理解性》40页报告

专知会员服务

125+阅读 · 2023年3月4日

深度学习在数学推理中的应用综述

深度学习在数学推理中的应用综述

专知会员服务

49+阅读 · 2022年12月25日

人工智能系统可信性度量评估研究综述

人工智能系统可信性度量评估研究综述

专知会员服务

99+阅读 · 2022年1月30日

集大成者！经典书《知识表示学习》，1035页pdf系统性讲解人工智能知识表示与推理基础、算法与应用

集大成者！经典书《知识表示学习》，1035页pdf系统性讲解人工智能知识表示与推理基础、算法与应用

专知会员服务

156+阅读 · 2020年11月20日

【机器推理可解释性】Machine Reasoning Explainability

【机器推理可解释性】Machine Reasoning Explainability

专知会员服务

35+阅读 · 2020年9月3日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能，67页pdf402篇文献

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能，67页pdf402篇文献

专知会员服务

120+阅读 · 2019年12月27日

热门VIP内容

开通专知VIP会员享更多权益服务

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

从采集到决策：美军视角下的战术情报范式重构

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

相关资讯

推荐！【中文版】《可信人工智能：重新思考未来军事指挥》英智库皇家国防安全联合军种研究所2022最新48页报告

推荐！【中文版】《可信人工智能：重新思考未来军事指挥》英智库皇家国防安全联合军种研究所2022最新48页报告

专知

69+阅读 · 2022年7月20日

「因果推理」概述论文，13页pdf

「因果推理」概述论文，13页pdf

专知

16+阅读 · 2021年3月20日

最新《可解释人工智能》概述，50页ppt

最新《可解释人工智能》概述，50页ppt

专知

12+阅读 · 2021年3月17日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

谷歌可解释人工智能白皮书，27页pdf，Google AI Explainability Whitepaper

谷歌可解释人工智能白皮书，27页pdf，Google AI Explainability Whitepaper

专知

28+阅读 · 2019年12月13日

知识图谱在可解释人工智能中的作用，附81页ppt

知识图谱在可解释人工智能中的作用，附81页ppt

专知

89+阅读 · 2019年11月11日

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

专知

11+阅读 · 2019年2月8日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

理解人类推理的深度学习

理解人类推理的深度学习

论智

19+阅读 · 2018年11月7日

【混合智能】人机混合智能的哲学思考

【混合智能】人机混合智能的哲学思考

产业智能官

12+阅读 · 2018年10月28日

相关论文

Actionable Interpretability Must Be Defined in Terms of Symmetries

Arxiv

0+阅读 · 6月12日

Possibilistic Predictive Uncertainty for Deep Learning

Arxiv

0+阅读 · 6月11日

MentisOculi: Revealing the Limits of Reasoning with Mental Imagery

Arxiv

0+阅读 · 6月10日

Reason, Then Re-reason: Cross-view Revisiting Improves Spatial Reasoning

Arxiv

0+阅读 · 6月10日

Ethical and Technical Limits of Deepfake Speech Datasets

Arxiv

0+阅读 · 6月9日

Fundamental Limitation in Explaining AI

Arxiv

0+阅读 · 5月31日

ReasonOps: A Unified Operational Paradigm for Trustworthy Verified LLM Reasoning

Arxiv

0+阅读 · 5月26日

On the Epistemic Uncertainty of Overparametrized Neural Networks

Arxiv

0+阅读 · 5月24日

The Reasoning Trap: An Information-Theoretic Bound on Closed-System Multi-Step LLM Reasoning

Arxiv

0+阅读 · 5月5日

The Computational Boundary of Inference: Capability Internalization, Training, and the Turing Jump

Arxiv

0+阅读 · 4月9日

相关基金

正则双极值模糊推理的理论与方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于格值逻辑的语言真值α-群锁语义归结自动推理研究

国家自然科学基金

0+阅读 · 2015年12月31日

Choquet期望下极限定理及其收敛速度的刻画

国家自然科学基金

0+阅读 · 2015年12月31日

考虑不确定性的结构动力学响应模型可信度确认方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于信息密度的广义不确定直觉模糊集成算子及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

对偶三角模-余模逻辑的语义理论与应用

国家自然科学基金

0+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

因果推断及不完全数据的统计分析

国家自然科学基金

23+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员