Persona-based dialogue systems aim to generate consistent responses based on historical context and predefined persona. Unlike conventional dialogue generation, the persona-based dialogue needs to consider both dialogue context and persona, posing a challenge for coherent training. Specifically, this requires a delicate weight balance between context and persona. To achieve that, in this paper, we propose an effective framework with Persona-Adaptive Attention (PAA), which adaptively integrates the weights from the persona and context information via our designed attention. In addition, a dynamic masking mechanism is applied to the PAA to not only drop redundant information in context and persona but also serve as a regularization mechanism to avoid overfitting. Experimental results demonstrate the superiority of the proposed PAA framework compared to the strong baselines in both automatic and human evaluation. Moreover, the proposed PAA approach can perform equivalently well in a low-resource regime compared to models trained in a full-data setting, which achieve a similar result with only 20% to 30% of data compared to the larger models trained in the full-data setting. To fully exploit the effectiveness of our design, we designed several variants for handling the weighted information in different ways, showing the necessity and sufficiency of our weighting and masking designs.


翻译:人物驱动的对话系统旨在基于历史上下文和预设人物生成一致的回复。与传统对话生成不同,人物驱动对话需同时考虑对话上下文和人物特征,这对模型的一致性训练提出了挑战。具体而言,这要求模型在上下文与人物特征之间实现精细的权重平衡。为此,本文提出了一种基于人物自适应注意力(PAA)的高效框架,该框架通过我们设计的注意力机制自适应整合人物特征与上下文信息的权重。此外,我们在PAA中应用了动态掩码机制,不仅能丢弃上下文和人物特征中的冗余信息,还能作为正则化手段防止过拟合。实验结果表明,在自动评估和人工评估中,所提出的PAA框架相较于强基线方法均展现出显著优势。值得注意的是,该PAA方法在低资源场景下的性能与全数据训练模型相当——仅需全数据训练大模型所用数据的20%至30%即可达到相似结果。为充分验证设计的有效性,我们设计了多种以不同方式处理加权信息的变体模型,证明了加权与掩码设计的必要性和充分性。

0
下载
关闭预览

相关内容

模式分析与应用(Pattern Analysis and Applications)杂志介绍了新模式分析技术以及工业和医学应用的原始研究。它详细介绍了模式识别和分析在应用领域的新技术和方法,包括计算机视觉和图像处理、语音分析、机器人技术、多媒体、文档分析、字符识别、模式识别知识工程、分形分析和智能控制。模式分析与应用(PAA)也检查了高级方法的使用,包括统计技术、神经网络、遗传算法、模糊模式识别、机器学习和硬件实现,这些都与模式分析作为一个研究领域的发展或新的模式分析应用的细节相关。 官网地址:http://dblp.uni-trier.de/db/journals/paa/
【AAAI2022】知识图谱表示模型是如何进行外推的?
专知会员服务
23+阅读 · 2022年2月2日
专知会员服务
43+阅读 · 2021年4月23日
【文本生成现代方法】Modern Methods for Text Generation
专知会员服务
44+阅读 · 2020年9月11日
【ICML2020】统一预训练伪掩码语言模型
专知会员服务
27+阅读 · 2020年7月23日
六篇 EMNLP 2019【图神经网络(GNN)+NLP】相关论文
专知会员服务
72+阅读 · 2019年11月3日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
自然语言处理常见数据集、论文最全整理分享
深度学习与NLP
11+阅读 · 2019年1月26日
从Seq2seq到Attention模型到Self Attention(二)
量化投资与机器学习
23+阅读 · 2018年10月9日
跨越注意力:Cross-Attention
我爱读PAMI
172+阅读 · 2018年6月2日
自适应注意力机制在Image Caption中的应用
PaperWeekly
10+阅读 · 2018年5月10日
赛尔原创 | 教聊天机器人进行多轮对话
哈工大SCIR
18+阅读 · 2017年9月18日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
21+阅读 · 2019年8月21日
Arxiv
19+阅读 · 2018年3月28日
VIP会员
最新内容
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
0+阅读 · 19分钟前
《通过小型无人机系统将情报能力“作战化”》
消耗优势:美军的“精确规模化”概念
专知会员服务
8+阅读 · 6月15日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员