大型语言模型(LLMs)在生成连贯文本方面展现了非凡的能力,然而,为什么它们能够如此工作的理论理解仍然难以捉摸。

理解语言生成的问题并不新鲜。几十年来,计算机科学家一直对人类和某些机器生成自然语言的能力着迷,这可以追溯到香农的早期工作。这里,有一项重要的工作由Gold(1967年)发起,他引入了语言识别的正式模型,并在学习理论(例如,Angluin(1980年))和语言学领域得到了广泛的研究。 本教程介绍了最近提出的语言生成的正式框架;这是对语言识别经典工作的现代解读。具体而言,我们探讨了Kleinberg和Mullainathan(2024年)最近提出的“极限语言生成”模型,该模型提供了一个令人惊讶的积极结果:即使在最小的要求下,经过有限样本的观察后,也能够生成连贯的语言——这一发现与Gold(1967年)和Angluin(1980年)在语言识别方面的负面发现形成鲜明对比。

我们的教程旨在向更广泛的计算学习理论社区介绍这一新兴的理论框架,激发新的研究,架起形式理论与实际语言模型之间的桥梁。无需具备语言生成模型的先验知识;具备基础数学素养即可理解。

成为VIP会员查看完整内容
16

相关内容

【斯坦福大学Xiang Lisa Li博士论文】控制语言模型
专知会员服务
21+阅读 · 2025年6月11日
【干货书】机器学习优化,509页pdf
专知会员服务
150+阅读 · 2021年2月26日
【关系抽取】详聊如何用BERT实现关系抽取
深度学习自然语言处理
32+阅读 · 2020年3月21日
【CVPR2019教程】视频理解中的图表示学习
专知
43+阅读 · 2019年6月20日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Arxiv
174+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
497+阅读 · 2023年3月31日
Arxiv
180+阅读 · 2023年3月24日
Arxiv
25+阅读 · 2023年3月17日
VIP会员
相关VIP内容
【斯坦福大学Xiang Lisa Li博士论文】控制语言模型
专知会员服务
21+阅读 · 2025年6月11日
【干货书】机器学习优化,509页pdf
专知会员服务
150+阅读 · 2021年2月26日
相关资讯
相关基金
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
相关论文
Arxiv
174+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
497+阅读 · 2023年3月31日
Arxiv
180+阅读 · 2023年3月24日
Arxiv
25+阅读 · 2023年3月17日
微信扫码咨询专知VIP会员