【伯克利博士论文】协同语言智能体 - 专知VIP

会员服务 ·

10

博士论文 · 语言智能体 · 持续学习 ·

【伯克利博士论文】协同语言智能体

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

大语言模型在标准基准测试中已取得了卓越的性能。然而，现实世界的应用需求远超出了单纯的回答问题或在全定义环境中执行动作——它要求模型具备与人类进行交互的能力，而人类往往带有各自独特的背景（Context）、目标和偏好。本论文旨在解决一个核心问题：如何设计能够与人类进行高效协作的模型？

我通过三个互补的视角来应对这一挑战：评估、架构以及学习目标。 * 首先，我提出了 DialOp，这是一个用于评估语言模型智能体与人类如何共同做出复杂日常决策的基准测试，为衡量系统的协同能力提供了严谨的框架。 * 其次，我证明了通过为语言模型架构增加记忆层（Memory Layers），可以实现高效的知识更新，从而为跨交互过程中的持续学习（Continual Learning）奠定了基础。 * 最后，我将这些理念从文本领域扩展到了具身多模态智能体（Embodied, Multimodal Agents）。研究表明，将语言学习与**世界建模目标（World Modeling Objectives）**相结合，能够使智能体理解多样化的人类交流形式（包括人类反馈）。

综上所述，这些研究成果推动了 AI 系统向更高阶段发展：使其不仅能在数字环境中，并最终能在物理世界中实现与人类的深度协作。

成为VIP会员查看完整内容

21

相关内容

博士论文

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下，选择自己能够把握和驾驭的潜在的研究方向，开辟新的研究领域。由此可见，这就对作者提出了较高要求，它要求作者必须在本学科的专业领域具备大量的理论知识，并对所学专业的理论知识有相当深入的理解和思考，同时还要具有相当水平的独立科学研究能力，能够为在学科领域提出独创性的见解和有价值的科研成果。因而，较之学士论文、硕士论文，博士论文具有更高的学术价值，对学科的发展具有重要的推动作用。

【伯克利博士论文】从推理服务到模型训练：面向大规模 LLM 智能体的高效系统构建

【伯克利博士论文】从推理服务到模型训练：面向大规模 LLM 智能体的高效系统构建

专知会员服务

19+阅读 · 1月2日

【伯克利博士论文】从推理服务到训练：面向大规模 LLM 智能体的高效系统

【伯克利博士论文】从推理服务到训练：面向大规模 LLM 智能体的高效系统

专知会员服务

25+阅读 · 2025年12月18日

【伯克利博士论文】超越人类监督的视觉智能

【伯克利博士论文】超越人类监督的视觉智能

专知会员服务

28+阅读 · 2025年8月12日

【斯坦福博士论文】为大型语言模型构建交互学习管道

【斯坦福博士论文】为大型语言模型构建交互学习管道

专知会员服务

19+阅读 · 2025年7月12日

【EPFL博士论文】大型语言模型时代的协作式智能体

【EPFL博士论文】大型语言模型时代的协作式智能体

专知会员服务

34+阅读 · 2025年5月16日

大语言模型与小语言模型协同机制综述

大语言模型与小语言模型协同机制综述

专知会员服务

38+阅读 · 2025年5月15日

【伯克利博士论文】迈向能够理解丰富交流的智能体，219页pdf

【伯克利博士论文】迈向能够理解丰富交流的智能体，219页pdf

专知会员服务

37+阅读 · 2024年9月13日

【伯克利博士论文】《通过高效和自动化系统赋能大型语言模型》，154页pdf

【伯克利博士论文】《通过高效和自动化系统赋能大型语言模型》，154页pdf

专知会员服务

20+阅读 · 2024年9月3日

【普林斯顿博士论文】语言智能体: 从下一词元预测到数字自动化

【普林斯顿博士论文】语言智能体: 从下一词元预测到数字自动化

专知会员服务

40+阅读 · 2024年5月14日

【伯克利博士论文】通过生成式模型实现视觉与语言理解，109页pdf

【伯克利博士论文】通过生成式模型实现视觉与语言理解，109页pdf

专知会员服务

41+阅读 · 2024年1月20日

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【伯克利博士论文】硬件感知的高效深度学习，154页pdf

【伯克利博士论文】硬件感知的高效深度学习，154页pdf

专知

10+阅读 · 2022年10月20日

阿尔伯塔大学博士毕业论文：基于图结构的自然语言处理

阿尔伯塔大学博士毕业论文：基于图结构的自然语言处理

机器之心

15+阅读 · 2020年3月25日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

78+阅读 · 2019年10月20日

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

专知

36+阅读 · 2019年9月29日

【伯克利《人工智能导论》(2018)课程视频+资料】

【伯克利《人工智能导论》(2018)课程视频+资料】

专知

18+阅读 · 2018年12月31日

论文浅尝 | 面向跨语言实体对齐的知识图谱与实体描述协同嵌入方法

论文浅尝 | 面向跨语言实体对齐的知识图谱与实体描述协同嵌入方法

开放知识图谱

11+阅读 · 2018年10月4日

一文读懂智能对话系统

一文读懂智能对话系统

数据派THU

16+阅读 · 2018年1月27日

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

面向聋儿言语康复的多模态人机交互模型及技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于神经网络的跨语言实体链指研究

国家自然科学基金

5+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

49+阅读 · 2009年12月31日

Reinforcement World Model Learning for LLM-based Agents

Arxiv

0+阅读 · 2月5日

Asynchronous Reasoning: Training-Free Interactive Thinking LLMs

Arxiv

0+阅读 · 2月4日

Language Steering for Multilingual In-Context Learning

Arxiv

0+阅读 · 2月2日

Towards Scientific Intelligence: A Survey of LLM-based Scientific Agents

Arxiv

0+阅读 · 2月2日

Collaborative Belief Reasoning with LLMs for Efficient Multi-Agent Collaboration

Arxiv

0+阅读 · 1月30日

Towards Real-time Adaptation of Embodied Agent in Human-Robot Collaboration

Arxiv

0+阅读 · 1月26日

Collaborative Belief Reasoning with LLMs for Efficient Multi-Agent Collaboration

Arxiv

0+阅读 · 1月24日

Trapped in the past? Disentangling fluid and crystallized intelligence of large language models using chess

Arxiv

0+阅读 · 1月23日

AutoContext: Instance-Level Context Learning for LLM Agents

Arxiv

0+阅读 · 1月13日

AgentOrchestra: Orchestrating Multi-Agent Intelligence with the Tool-Environment-Agent(TEA) Protocol

Arxiv

0+阅读 · 1月11日

VIP会员

相关主题

语言智能体

最新内容

美国对伊朗军事行动：弹药与反导

美国对伊朗军事行动：弹药与反导

专知会员服务

0+阅读 · 5分钟前

超越技术：伊朗冲突中的“战争方式”

超越技术：伊朗冲突中的“战争方式”

专知会员服务

11+阅读 · 4月1日

军事决策大语言模型综合评价基准

军事决策大语言模型综合评价基准

专知会员服务

8+阅读 · 4月1日

利用核国家战略互动博弈（SIGNAL）进行实验性兵棋推演

利用核国家战略互动博弈（SIGNAL）进行实验性兵棋推演

专知会员服务

9+阅读 · 4月1日

《美军混合航空器军用适航认证路线图》84页

《美军混合航空器军用适航认证路线图》84页

专知会员服务

7+阅读 · 4月1日

《ClaudeCode源码深度研究报告（增强完整版）》，下载链接

《ClaudeCode源码深度研究报告（增强完整版）》，下载链接

专知会员服务

17+阅读 · 4月1日

量子无人机与未来军事战争

量子无人机与未来军事战争

专知会员服务

12+阅读 · 4月1日

迈向医学人工智能科学家

迈向医学人工智能科学家

专知会员服务

12+阅读 · 4月1日

《美国陆军材料科学与工程创新与领导力发展：250年（从1775年到2025年）视角》

《美国陆军材料科学与工程创新与领导力发展：250年（从1775年到2025年）视角》

专知会员服务

10+阅读 · 4月1日

无人机尚未在乌克兰赢得战斗：西方考量

无人机尚未在乌克兰赢得战斗：西方考量

专知会员服务

12+阅读 · 3月31日

兵力设计流程需要五类兵棋推演：问题识别、应对概念、缺口识别、能力识别、潜在方案

兵力设计流程需要五类兵棋推演：问题识别、应对概念、缺口识别、能力识别、潜在方案

专知会员服务

14+阅读 · 3月31日

《北约信息征询书 2026网络空间作战发展与实验活动》

《北约信息征询书 2026网络空间作战发展与实验活动》

专知会员服务

8+阅读 · 3月31日

《海上反无人机：用于特种作战部队行动的多传感器融合框架》200页

《海上反无人机：用于特种作战部队行动的多传感器融合框架》200页

专知会员服务

17+阅读 · 3月31日

《用于持久电磁区域拒止与不可见空中雷场的综合技术框架》

《用于持久电磁区域拒止与不可见空中雷场的综合技术框架》

专知会员服务

11+阅读 · 3月31日

《军事网络数据包拦截技术研究》

《军事网络数据包拦截技术研究》

专知会员服务

12+阅读 · 3月31日

相关VIP内容

【伯克利博士论文】从推理服务到模型训练：面向大规模 LLM 智能体的高效系统构建

【伯克利博士论文】从推理服务到模型训练：面向大规模 LLM 智能体的高效系统构建

专知会员服务

19+阅读 · 1月2日

【伯克利博士论文】从推理服务到训练：面向大规模 LLM 智能体的高效系统

【伯克利博士论文】从推理服务到训练：面向大规模 LLM 智能体的高效系统

专知会员服务

25+阅读 · 2025年12月18日

【伯克利博士论文】超越人类监督的视觉智能

【伯克利博士论文】超越人类监督的视觉智能

专知会员服务

28+阅读 · 2025年8月12日

【斯坦福博士论文】为大型语言模型构建交互学习管道

【斯坦福博士论文】为大型语言模型构建交互学习管道

专知会员服务

19+阅读 · 2025年7月12日

【EPFL博士论文】大型语言模型时代的协作式智能体

【EPFL博士论文】大型语言模型时代的协作式智能体

专知会员服务

34+阅读 · 2025年5月16日

大语言模型与小语言模型协同机制综述

大语言模型与小语言模型协同机制综述

专知会员服务

38+阅读 · 2025年5月15日

【伯克利博士论文】迈向能够理解丰富交流的智能体，219页pdf

【伯克利博士论文】迈向能够理解丰富交流的智能体，219页pdf

专知会员服务

37+阅读 · 2024年9月13日

【伯克利博士论文】《通过高效和自动化系统赋能大型语言模型》，154页pdf

【伯克利博士论文】《通过高效和自动化系统赋能大型语言模型》，154页pdf

专知会员服务

20+阅读 · 2024年9月3日

【普林斯顿博士论文】语言智能体: 从下一词元预测到数字自动化

【普林斯顿博士论文】语言智能体: 从下一词元预测到数字自动化

专知会员服务

40+阅读 · 2024年5月14日

【伯克利博士论文】通过生成式模型实现视觉与语言理解，109页pdf

【伯克利博士论文】通过生成式模型实现视觉与语言理解，109页pdf

专知会员服务

41+阅读 · 2024年1月20日

热门VIP内容

开通专知VIP会员享更多权益服务

军事决策大语言模型综合评价基准

《美军混合航空器军用适航认证路线图》84页

超越技术：伊朗冲突中的“战争方式”

利用核国家战略互动博弈（SIGNAL）进行实验性兵棋推演

相关资讯

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【伯克利博士论文】硬件感知的高效深度学习，154页pdf

【伯克利博士论文】硬件感知的高效深度学习，154页pdf

专知

10+阅读 · 2022年10月20日

阿尔伯塔大学博士毕业论文：基于图结构的自然语言处理

阿尔伯塔大学博士毕业论文：基于图结构的自然语言处理

机器之心

15+阅读 · 2020年3月25日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

78+阅读 · 2019年10月20日

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

专知

36+阅读 · 2019年9月29日

【伯克利《人工智能导论》(2018)课程视频+资料】

【伯克利《人工智能导论》(2018)课程视频+资料】

专知

18+阅读 · 2018年12月31日

论文浅尝 | 面向跨语言实体对齐的知识图谱与实体描述协同嵌入方法

论文浅尝 | 面向跨语言实体对齐的知识图谱与实体描述协同嵌入方法

开放知识图谱

11+阅读 · 2018年10月4日

一文读懂智能对话系统

一文读懂智能对话系统

数据派THU

16+阅读 · 2018年1月27日

相关基金

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

面向聋儿言语康复的多模态人机交互模型及技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于神经网络的跨语言实体链指研究

国家自然科学基金

5+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

49+阅读 · 2009年12月31日

相关论文

Reinforcement World Model Learning for LLM-based Agents

Arxiv

0+阅读 · 2月5日

Asynchronous Reasoning: Training-Free Interactive Thinking LLMs

Arxiv

0+阅读 · 2月4日

Language Steering for Multilingual In-Context Learning

Arxiv

0+阅读 · 2月2日

Towards Scientific Intelligence: A Survey of LLM-based Scientific Agents

Arxiv

0+阅读 · 2月2日

Collaborative Belief Reasoning with LLMs for Efficient Multi-Agent Collaboration

Arxiv

0+阅读 · 1月30日

Towards Real-time Adaptation of Embodied Agent in Human-Robot Collaboration

Arxiv

0+阅读 · 1月26日

Collaborative Belief Reasoning with LLMs for Efficient Multi-Agent Collaboration

Arxiv

0+阅读 · 1月24日

Trapped in the past? Disentangling fluid and crystallized intelligence of large language models using chess

Arxiv

0+阅读 · 1月23日

AutoContext: Instance-Level Context Learning for LLM Agents

Arxiv

0+阅读 · 1月13日

AgentOrchestra: Orchestrating Multi-Agent Intelligence with the Tool-Environment-Agent(TEA) Protocol

Arxiv

0+阅读 · 1月11日

微信扫码咨询专知VIP会员