大语言模型在标准基准测试中已取得了卓越的性能。然而,现实世界的应用需求远超出了单纯的回答问题或在全定义环境中执行动作——它要求模型具备与人类进行交互的能力,而人类往往带有各自独特的背景(Context)、目标和偏好。本论文旨在解决一个核心问题:如何设计能够与人类进行高效协作的模型?

我通过三个互补的视角来应对这一挑战:评估、架构以及学习目标。 * 首先,我提出了 DialOp,这是一个用于评估语言模型智能体与人类如何共同做出复杂日常决策的基准测试,为衡量系统的协同能力提供了严谨的框架。 * 其次,我证明了通过为语言模型架构增加记忆层(Memory Layers),可以实现高效的知识更新,从而为跨交互过程中的持续学习(Continual Learning)奠定了基础。 * 最后,我将这些理念从文本领域扩展到了具身多模态智能体(Embodied, Multimodal Agents)。研究表明,将语言学习与**世界建模目标(World Modeling Objectives)**相结合,能够使智能体理解多样化的人类交流形式(包括人类反馈)。

综上所述,这些研究成果推动了 AI 系统向更高阶段发展:使其不仅能在数字环境中,并最终能在物理世界中实现与人类的深度协作。

成为VIP会员查看完整内容
21

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【伯克利博士论文】超越人类监督的视觉智能
专知会员服务
28+阅读 · 2025年8月12日
【斯坦福博士论文】为大型语言模型构建交互学习管道
专知会员服务
19+阅读 · 2025年7月12日
【EPFL博士论文】大型语言模型时代的协作式智能体
专知会员服务
32+阅读 · 2025年5月16日
大语言模型与小语言模型协同机制综述
专知会员服务
38+阅读 · 2025年5月15日
一文读懂智能对话系统
数据派THU
16+阅读 · 2018年1月27日
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
20+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
48+阅读 · 2009年12月31日
VIP会员
相关基金
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
20+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
48+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员