Nothing from Something: Can a Language Model Discover 0? - 专知论文

会员服务 ·

0

数学 · 泛化 · 语言模型 · AI · 系统 ·

Nothing from Something: Can a Language Model Discover 0?

翻译：无中生有：语言模型能否发现“0”？

Phoebe Zeng,Thomas L. Griffiths,Brenden M. Lake

AI systems based on artificial neural networks are being developed with aspirations of pushing the boundary of human mathematical knowledge. A key question for these systems is how much they can reach beyond their training data. Mathematical discovery requires a strong form of out of distribution generalization; the ability to hypothesize genuinely new - and potentially logically more powerful - mathematical structures. It has been hypothesized that language abilities support such generalizations in human cognition. In this work, we use simple arithmetic as a case study for examining how modern AI models could expand their mathematical horizons, evaluating whether these models can independently discover the concept of "zero". We show that We show that (1) language models of a GPT-2 size are unable to perform this generalization at test time regardless of language pretraining, but (2) models can improve substantially after training on tens or hundreds of examples of zero. Additionally, we find that language pretraining reduces the number of required examples by approximately $50\%$, showing that language abilities can scaffold mathematical discovery in neural models.

翻译：基于人工神经网络的AI系统正朝着突破人类数学知识边界的目标发展。这些系统的核心问题在于其超越训练数据的程度。数学发现需要强大的分布外泛化能力——即能够提出真正新颖的、在逻辑上可能更具威力的数学结构。已有假说认为语言能力支撑了人类认知中的这类泛化能力。本研究以简单算术为案例，考察现代AI模型如何拓展数学视野，评估这些模型能否独立发现"零"的概念。研究表明：(1) GPT-2规模的语言模型无论是否经过语言预训练，在测试阶段均无法实现该泛化；(2) 但在经过数十至数百个零示例训练后，模型表现显著提升。此外，我们发现语言预训练可将所需示例数量减少约50%，这表明语言能力能够支撑神经模型的数学发现。

0

相关内容

数学是关于数量、结构、变化等主题的探索。

【牛津博士论文】机器学习模型的知识编码机制及其对模型可解释性的启示

【牛津博士论文】机器学习模型的知识编码机制及其对模型可解释性的启示

专知会员服务

23+阅读 · 1月5日

【牛津博士论文】零样本元强化学习中的表示方法询问 ChatGPT

【牛津博士论文】零样本元强化学习中的表示方法询问 ChatGPT

专知会员服务

17+阅读 · 2025年7月28日

【博士论文】《用于可验证数学自动化的语言模型：交互、集成与自动形式化》

【博士论文】《用于可验证数学自动化的语言模型：交互、集成与自动形式化》

专知会员服务

19+阅读 · 2025年3月14日

【新书】实践大型语言模型：语言理解与生成

【新书】实践大型语言模型：语言理解与生成

专知会员服务

69+阅读 · 2024年10月1日

【博士论文】深度学习时代的概率机器学习：高斯过程、贝叶斯优化以及更多新视角

【博士论文】深度学习时代的概率机器学习：高斯过程、贝叶斯优化以及更多新视角

专知会员服务

62+阅读 · 2024年1月24日

大模型如何做个性化？中科大等最新《当大型语言模型遇到个性化》综述，详述大模型与个性化的挑战与机遇

大模型如何做个性化？中科大等最新《当大型语言模型遇到个性化》综述，详述大模型与个性化的挑战与机遇

专知会员服务

84+阅读 · 2023年8月8日

【蒙特利尔大学博士论文】可微世界程序，Differentiable World Programs，161页pdf

【蒙特利尔大学博士论文】可微世界程序，Differentiable World Programs，161页pdf

专知会员服务

30+阅读 · 2022年6月7日

《将机器中的语言与大脑中的语言联系起来》150页博士论文，卡耐基梅隆大学

《将机器中的语言与大脑中的语言联系起来》150页博士论文，卡耐基梅隆大学

专知会员服务

48+阅读 · 2022年5月12日

【斯坦福Kevin Chen博士论文】视觉、语言和具身AI的多模态表示， Multimodal representations for vision, language, and embodied AI

【斯坦福Kevin Chen博士论文】视觉、语言和具身AI的多模态表示， Multimodal representations for vision, language, and embodied AI

专知会员服务

64+阅读 · 2022年3月6日

【Google大脑】AutoML-Zero: 从无到有演化机器学习算法，Evolving Machine Learning

专知会员服务

26+阅读 · 2020年3月11日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

云头条

18+阅读 · 2019年4月23日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

NLP通用模型诞生？一个模型搞定十大自然语言常见任务

NLP通用模型诞生？一个模型搞定十大自然语言常见任务

人工智能头条

10+阅读 · 2018年6月29日

从0到1，这篇深度学习综述送给你！

从0到1，这篇深度学习综述送给你！

机器学习算法与Python学习

27+阅读 · 2018年6月13日

尽早跑通深度学习的实践代码，是入门深度学习的最快途径

尽早跑通深度学习的实践代码，是入门深度学习的最快途径

算法与数据结构

22+阅读 · 2017年12月13日

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

机器人圈

35+阅读 · 2017年7月18日

超大规模约束优化问题算法及其应用天元数学交流项目

国家自然科学基金

2+阅读 · 2017年12月31日

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

中文句子语义概念图自动构建方法及应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

无界区域椭圆型和抛物型偏微分方程的人工边界条件数值方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

高维混合数据异常知识发现的粒计算模型关键问题研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

Inverse Turing Bench: Evaluating Language Models as Judges of Human vs. AI Dialogue

Arxiv

0+阅读 · 6月20日

Nothing from Something: Can a Language Model Discover 0?

Arxiv

0+阅读 · 6月18日

Anything Goes? A Crosslinguistic Study of (Im)possible Language Learning in LMs

Arxiv

0+阅读 · 6月13日

When Large Language Models Meet UAV Projects: An Empirical Study from Developers' Perspective

Arxiv

0+阅读 · 6月1日

The AI Cognitive Trojan Horse: How Large Language Models May Bypass Human Epistemic Vigilance

Arxiv

0+阅读 · 5月26日

Large Language Models Meet NLP: A Survey

Arxiv

14+阅读 · 2024年5月21日

The Rise and Potential of Large Language Model Based Agents: A Survey

Arxiv

50+阅读 · 2023年9月14日

When Large Language Models Meet Personalization: Perspectives of Challenges and Opportunities

Arxiv

19+阅读 · 2023年7月31日

Towards Expert-Level Medical Question Answering with Large Language Models

Arxiv

26+阅读 · 2023年5月16日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

501+阅读 · 2023年3月31日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

1+阅读 · 今天14:45

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

1+阅读 · 今天14:43

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

3+阅读 · 今天14:31

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 今天14:20

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

2+阅读 · 今天14:11

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

3+阅读 · 今天14:07

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 今天14:03

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 今天13:59

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

【牛津博士论文】机器学习模型的知识编码机制及其对模型可解释性的启示

【牛津博士论文】机器学习模型的知识编码机制及其对模型可解释性的启示

专知会员服务

23+阅读 · 1月5日

【牛津博士论文】零样本元强化学习中的表示方法询问 ChatGPT

【牛津博士论文】零样本元强化学习中的表示方法询问 ChatGPT

专知会员服务

17+阅读 · 2025年7月28日

【博士论文】《用于可验证数学自动化的语言模型：交互、集成与自动形式化》

【博士论文】《用于可验证数学自动化的语言模型：交互、集成与自动形式化》

专知会员服务

19+阅读 · 2025年3月14日

【新书】实践大型语言模型：语言理解与生成

【新书】实践大型语言模型：语言理解与生成

专知会员服务

69+阅读 · 2024年10月1日

【博士论文】深度学习时代的概率机器学习：高斯过程、贝叶斯优化以及更多新视角

【博士论文】深度学习时代的概率机器学习：高斯过程、贝叶斯优化以及更多新视角

专知会员服务

62+阅读 · 2024年1月24日

大模型如何做个性化？中科大等最新《当大型语言模型遇到个性化》综述，详述大模型与个性化的挑战与机遇

大模型如何做个性化？中科大等最新《当大型语言模型遇到个性化》综述，详述大模型与个性化的挑战与机遇

专知会员服务

84+阅读 · 2023年8月8日

【蒙特利尔大学博士论文】可微世界程序，Differentiable World Programs，161页pdf

【蒙特利尔大学博士论文】可微世界程序，Differentiable World Programs，161页pdf

专知会员服务

30+阅读 · 2022年6月7日

《将机器中的语言与大脑中的语言联系起来》150页博士论文，卡耐基梅隆大学

《将机器中的语言与大脑中的语言联系起来》150页博士论文，卡耐基梅隆大学

专知会员服务

48+阅读 · 2022年5月12日

【斯坦福Kevin Chen博士论文】视觉、语言和具身AI的多模态表示， Multimodal representations for vision, language, and embodied AI

【斯坦福Kevin Chen博士论文】视觉、语言和具身AI的多模态表示， Multimodal representations for vision, language, and embodied AI

专知会员服务

64+阅读 · 2022年3月6日

【Google大脑】AutoML-Zero: 从无到有演化机器学习算法，Evolving Machine Learning

专知会员服务

26+阅读 · 2020年3月11日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

云头条

18+阅读 · 2019年4月23日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

NLP通用模型诞生？一个模型搞定十大自然语言常见任务

NLP通用模型诞生？一个模型搞定十大自然语言常见任务

人工智能头条

10+阅读 · 2018年6月29日

从0到1，这篇深度学习综述送给你！

从0到1，这篇深度学习综述送给你！

机器学习算法与Python学习

27+阅读 · 2018年6月13日

尽早跑通深度学习的实践代码，是入门深度学习的最快途径

尽早跑通深度学习的实践代码，是入门深度学习的最快途径

算法与数据结构

22+阅读 · 2017年12月13日

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

机器人圈

35+阅读 · 2017年7月18日

相关论文

Inverse Turing Bench: Evaluating Language Models as Judges of Human vs. AI Dialogue

Arxiv

0+阅读 · 6月20日

Nothing from Something: Can a Language Model Discover 0?

Arxiv

0+阅读 · 6月18日

Anything Goes? A Crosslinguistic Study of (Im)possible Language Learning in LMs

Arxiv

0+阅读 · 6月13日

When Large Language Models Meet UAV Projects: An Empirical Study from Developers' Perspective

Arxiv

0+阅读 · 6月1日

The AI Cognitive Trojan Horse: How Large Language Models May Bypass Human Epistemic Vigilance

Arxiv

0+阅读 · 5月26日

Large Language Models Meet NLP: A Survey

Arxiv

14+阅读 · 2024年5月21日

The Rise and Potential of Large Language Model Based Agents: A Survey

Arxiv

50+阅读 · 2023年9月14日

When Large Language Models Meet Personalization: Perspectives of Challenges and Opportunities

Arxiv

19+阅读 · 2023年7月31日

Towards Expert-Level Medical Question Answering with Large Language Models

Arxiv

26+阅读 · 2023年5月16日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

501+阅读 · 2023年3月31日

相关基金

超大规模约束优化问题算法及其应用天元数学交流项目

国家自然科学基金

2+阅读 · 2017年12月31日

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

中文句子语义概念图自动构建方法及应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

无界区域椭圆型和抛物型偏微分方程的人工边界条件数值方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

高维混合数据异常知识发现的粒计算模型关键问题研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员