【直播】清华 ACL 2020 长文：多智能体对话策略学习 - 专知

会员服务 ·

0

【直播】清华 ACL 2020 长文：多智能体对话策略学习

2020 年 5 月 6 日 AI科技评论

五一结束，系列直播再次开启！

近年来，许多研究已经应用强化学习来训练对话策略并显示出巨大的希望。一种常见的方法是采用用户模拟器来获得大量的模拟用户体验，以满足强化学习算法在对话策略中的训练。

但，建模一个逼真的用户模拟器是具有挑战性的。

基于规则的模拟器需要复杂领域的专业知识，而数据驱动的模拟器则需要大量数据，甚至不清楚如何评估模拟器。

为了避免事先明确地构建用户模拟器，清华大学黄民烈团队（CoAI课题组）在发表于ACL 2020 上的长文《Multi-Agent Task-Oriented Dialog Policy Learning with Role-Aware Reward Decomposition》中提出了多智能体对话策略学习法，该系统将系统和用户都视为对话代理。

两个主体相互交互，并且同时联合学习。该方法使用行为者批判框架来促进预训练并提高可伸缩性。

作者还提出了混合价值网络，用于角色感知奖励分解，以在面向任务的对话中整合每个代理的角色特定的领域知识。

结果表明，该方法可以成功地同时建立系统策略和用户策略，并且两个代理可以通过会话交互获得较高的任务成功率。

论文链接： https://arxiv.org/pdf/2004.03809.pdf

AI 科技评论邀请论文一作高信龙一来给我们详细讲解其研究过程及细节。

主题：多智能体对话策略学习

主讲人： 高信龙一

清华大学计算机系2019级硕士生，交互式人工智能组（CoAI）成员，师从黄民烈教授。主要研究方向为对话系统、推荐系统与强化学习。已在ACL、EMNLP、WWW等顶级会议上发表数篇论文。

时间： 2020年5月6日（周三）晚20:00整

分享提纲：

1．对话策略学习的任务背景

2．对话策略研究的最新进展与挑战

3．基于多智能体强化学习的对话策略学习与奖励分解

更多直播：

ACL 2020原定于2020年7月5日至10日在美国华盛顿西雅图举行，因新冠肺炎疫情改为线上会议。为促进学术交流，方便国内师生提早了解自然语言处理（NLP）前沿研究，AI 科技评论将推出「ACL 实验室系列论文解读」内容，同时欢迎更多实验室参与分享，敬请期待！

点击"阅读原文"，直达“ACL 交流小组”了解更多会议信息。

登录查看更多

1

相关内容

对话策略学习

对话策略学习

近期必读五篇顶会 ACL 2020【知识图谱表示学习 (KGR) 】相关论文

近期必读五篇顶会 ACL 2020【知识图谱表示学习 (KGR) 】相关论文

专知会员服务

85+阅读 · 2020年6月16日

近期必读的五篇顶会 ACL 2020【图神经网络 (GNN) 】相关论文

近期必读的五篇顶会 ACL 2020【图神经网络 (GNN) 】相关论文

专知会员服务

105+阅读 · 2020年6月9日

近期必读的六篇SIGIR 2020【图神经网络 +推荐(GNN+RS) 】相关论文

近期必读的六篇SIGIR 2020【图神经网络 +推荐(GNN+RS) 】相关论文

专知会员服务

162+阅读 · 2020年6月2日

ACL2020接受论文列表公布，571篇长文208篇短文

ACL2020接受论文列表公布，571篇长文208篇短文

专知会员服务

67+阅读 · 2020年5月19日

近期必读的5篇顶会WWW 2020【知识图谱+图神经网络（KG+GNN）】相关论文

近期必读的5篇顶会WWW 2020【知识图谱+图神经网络（KG+GNN）】相关论文

专知会员服务

151+阅读 · 2020年4月21日

【清华大学博士论文】富信息网络表示学习及典型应用问题研究, 杨成

【清华大学博士论文】富信息网络表示学习及典型应用问题研究, 杨成

专知会员服务

68+阅读 · 2019年11月7日

知识指导的自然语言处理 [微信模式识别中心林衍凯] CCKS ATT 16-2019

知识指导的自然语言处理 [微信模式识别中心林衍凯] CCKS ATT 16-2019

专知会员服务

48+阅读 · 2019年10月25日

问答与对话-技术与系统之人工智能在人机对话系统中的技术现状与挑战【严睿】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第14期

问答与对话-技术与系统之人工智能在人机对话系统中的技术现状与挑战【严睿】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第14期

专知会员服务

33+阅读 · 2019年10月23日

社交机器人的挑战性问题，清华大学计算机系黄民烈副教授，SMP 2019 前沿技术讲习班第十五期（CIPS ATT 15）

社交机器人的挑战性问题，清华大学计算机系黄民烈副教授，SMP 2019 前沿技术讲习班第十五期（CIPS ATT 15）

专知会员服务

21+阅读 · 2019年10月23日

【IJCAI 2019】人工智能在交通中的应用（Artificial Intelligence in Transportation），滴滴AI实验室研究员王征博士，秦志伟博士

【IJCAI 2019】人工智能在交通中的应用（Artificial Intelligence in Transportation），滴滴AI实验室研究员王征博士，秦志伟博士

专知会员服务

63+阅读 · 2019年8月10日

干货 | ACL 2019 知识图谱的全方位总结

干货 | ACL 2019 知识图谱的全方位总结

THU数据派

15+阅读 · 2019年8月17日

论文浅尝 | 基于知识库的自然语言理解 02#

论文浅尝 | 基于知识库的自然语言理解 02#

开放知识图谱

8+阅读 · 2019年2月24日

大讲堂 | 深度强化学习在电商推荐中的应用

大讲堂 | 深度强化学习在电商推荐中的应用

AI研习社

9+阅读 · 2018年11月8日

深度强化学习在NLP怎么用？看清华黄民烈老师这一份120页《自然语言处理和搜索中的深度强化学习应用》讲义

深度强化学习在NLP怎么用？看清华黄民烈老师这一份120页《自然语言处理和搜索中的深度强化学习应用》讲义

专知

31+阅读 · 2018年9月1日

【论文笔记】强化学习+对抗，面向任务的神经对话模型新思路

【论文笔记】强化学习+对抗，面向任务的神经对话模型新思路

专知

6+阅读 · 2018年6月4日

大会 | 清华对话式人工智能课题组六篇长文被ACL、IJCAI-ECAI录用

大会 | 清华对话式人工智能课题组六篇长文被ACL、IJCAI-ECAI录用

AI科技评论

10+阅读 · 2018年4月25日

我中心3篇长文被ACL 2018录用

我中心3篇长文被ACL 2018录用

哈工大SCIR

5+阅读 · 2018年4月24日

多轮对话之对话管理：Dialog Management

多轮对话之对话管理：Dialog Management

PaperWeekly

18+阅读 · 2018年1月15日

清华大学冯珺：基于强化学习的关系抽取和文本分类 | 实录·PhD Talk

清华大学冯珺：基于强化学习的关系抽取和文本分类 | 实录·PhD Talk

PaperWeekly

11+阅读 · 2017年11月23日

让聊天机器人同你聊得更带劲 - 对话策略学习 | 论文访谈间 #21

让聊天机器人同你聊得更带劲 - 对话策略学习 | 论文访谈间 #21

PaperWeekly

7+阅读 · 2017年9月28日

Hierarchical Human Parsing with Typed Part-Relation Reasoning

Hierarchical Human Parsing with Typed Part-Relation Reasoning

Arxiv

6+阅读 · 2020年3月10日

Seeing What a GAN Cannot Generate

Seeing What a GAN Cannot Generate

Arxiv

8+阅读 · 2019年10月24日

Domain Representation for Knowledge Graph Embedding

Domain Representation for Knowledge Graph Embedding

Arxiv

14+阅读 · 2019年9月11日

Signed Graph Attention Networks

Signed Graph Attention Networks

Arxiv

7+阅读 · 2019年9月5日

Latent Relation Language Models

Arxiv

21+阅读 · 2019年8月21日

Dynamic Graph Representation Learning via Self-Attention Networks

Arxiv

52+阅读 · 2019年6月15日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

CoQA: A Conversational Question Answering Challenge

CoQA: A Conversational Question Answering Challenge

Arxiv

7+阅读 · 2018年8月21日

Hierarchical Pointer Memory Network for Task Oriented Dialogue

Arxiv

3+阅读 · 2018年5月3日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

VIP会员

相关主题

对话策略学习

最新内容

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

0+阅读 · 5分钟前

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

1+阅读 · 35分钟前

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

1+阅读 · 今天14:05

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

1+阅读 · 今天13:55

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

1+阅读 · 今天13:51

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

2+阅读 · 今天13:48

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

7+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

20+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

13+阅读 · 6月18日

相关VIP内容

近期必读五篇顶会 ACL 2020【知识图谱表示学习 (KGR) 】相关论文

近期必读五篇顶会 ACL 2020【知识图谱表示学习 (KGR) 】相关论文

专知会员服务

85+阅读 · 2020年6月16日

近期必读的五篇顶会 ACL 2020【图神经网络 (GNN) 】相关论文

近期必读的五篇顶会 ACL 2020【图神经网络 (GNN) 】相关论文

专知会员服务

105+阅读 · 2020年6月9日

近期必读的六篇SIGIR 2020【图神经网络 +推荐(GNN+RS) 】相关论文

近期必读的六篇SIGIR 2020【图神经网络 +推荐(GNN+RS) 】相关论文

专知会员服务

162+阅读 · 2020年6月2日

ACL2020接受论文列表公布，571篇长文208篇短文

ACL2020接受论文列表公布，571篇长文208篇短文

专知会员服务

67+阅读 · 2020年5月19日

近期必读的5篇顶会WWW 2020【知识图谱+图神经网络（KG+GNN）】相关论文

近期必读的5篇顶会WWW 2020【知识图谱+图神经网络（KG+GNN）】相关论文

专知会员服务

151+阅读 · 2020年4月21日

【清华大学博士论文】富信息网络表示学习及典型应用问题研究, 杨成

【清华大学博士论文】富信息网络表示学习及典型应用问题研究, 杨成

专知会员服务

68+阅读 · 2019年11月7日

知识指导的自然语言处理 [微信模式识别中心林衍凯] CCKS ATT 16-2019

知识指导的自然语言处理 [微信模式识别中心林衍凯] CCKS ATT 16-2019

专知会员服务

48+阅读 · 2019年10月25日

问答与对话-技术与系统之人工智能在人机对话系统中的技术现状与挑战【严睿】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第14期

问答与对话-技术与系统之人工智能在人机对话系统中的技术现状与挑战【严睿】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第14期

专知会员服务

33+阅读 · 2019年10月23日

社交机器人的挑战性问题，清华大学计算机系黄民烈副教授，SMP 2019 前沿技术讲习班第十五期（CIPS ATT 15）

社交机器人的挑战性问题，清华大学计算机系黄民烈副教授，SMP 2019 前沿技术讲习班第十五期（CIPS ATT 15）

专知会员服务

21+阅读 · 2019年10月23日

【IJCAI 2019】人工智能在交通中的应用（Artificial Intelligence in Transportation），滴滴AI实验室研究员王征博士，秦志伟博士

【IJCAI 2019】人工智能在交通中的应用（Artificial Intelligence in Transportation），滴滴AI实验室研究员王征博士，秦志伟博士

专知会员服务

63+阅读 · 2019年8月10日

热门VIP内容

开通专知VIP会员享更多权益服务

21世纪的无人机战争

《量子技术的军事任务技术适配与利用》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《伊朗与以色列-美国热战及其对数字技术的影响》

相关资讯

干货 | ACL 2019 知识图谱的全方位总结

干货 | ACL 2019 知识图谱的全方位总结

THU数据派

15+阅读 · 2019年8月17日

论文浅尝 | 基于知识库的自然语言理解 02#

论文浅尝 | 基于知识库的自然语言理解 02#

开放知识图谱

8+阅读 · 2019年2月24日

大讲堂 | 深度强化学习在电商推荐中的应用

大讲堂 | 深度强化学习在电商推荐中的应用

AI研习社

9+阅读 · 2018年11月8日

深度强化学习在NLP怎么用？看清华黄民烈老师这一份120页《自然语言处理和搜索中的深度强化学习应用》讲义

深度强化学习在NLP怎么用？看清华黄民烈老师这一份120页《自然语言处理和搜索中的深度强化学习应用》讲义

专知

31+阅读 · 2018年9月1日

【论文笔记】强化学习+对抗，面向任务的神经对话模型新思路

【论文笔记】强化学习+对抗，面向任务的神经对话模型新思路

专知

6+阅读 · 2018年6月4日

大会 | 清华对话式人工智能课题组六篇长文被ACL、IJCAI-ECAI录用

大会 | 清华对话式人工智能课题组六篇长文被ACL、IJCAI-ECAI录用

AI科技评论

10+阅读 · 2018年4月25日

我中心3篇长文被ACL 2018录用

我中心3篇长文被ACL 2018录用

哈工大SCIR

5+阅读 · 2018年4月24日

多轮对话之对话管理：Dialog Management

多轮对话之对话管理：Dialog Management

PaperWeekly

18+阅读 · 2018年1月15日

清华大学冯珺：基于强化学习的关系抽取和文本分类 | 实录·PhD Talk

清华大学冯珺：基于强化学习的关系抽取和文本分类 | 实录·PhD Talk

PaperWeekly

11+阅读 · 2017年11月23日

让聊天机器人同你聊得更带劲 - 对话策略学习 | 论文访谈间 #21

让聊天机器人同你聊得更带劲 - 对话策略学习 | 论文访谈间 #21

PaperWeekly

7+阅读 · 2017年9月28日

相关论文

Hierarchical Human Parsing with Typed Part-Relation Reasoning

Hierarchical Human Parsing with Typed Part-Relation Reasoning

Arxiv

6+阅读 · 2020年3月10日

Seeing What a GAN Cannot Generate

Seeing What a GAN Cannot Generate

Arxiv

8+阅读 · 2019年10月24日

Domain Representation for Knowledge Graph Embedding

Domain Representation for Knowledge Graph Embedding

Arxiv

14+阅读 · 2019年9月11日

Signed Graph Attention Networks

Signed Graph Attention Networks

Arxiv

7+阅读 · 2019年9月5日

Latent Relation Language Models

Arxiv

21+阅读 · 2019年8月21日

Dynamic Graph Representation Learning via Self-Attention Networks

Arxiv

52+阅读 · 2019年6月15日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

CoQA: A Conversational Question Answering Challenge

CoQA: A Conversational Question Answering Challenge

Arxiv

7+阅读 · 2018年8月21日

Hierarchical Pointer Memory Network for Task Oriented Dialogue

Arxiv

3+阅读 · 2018年5月3日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

大家都在搜

无人机战争

无人机系统

对抗特征转移

GitHub上已超过

微信扫码咨询专知VIP会员