This paper presents the PALI team's winning system for SemEval-2021 Task 2: Multilingual and Cross-lingual Word-in-Context Disambiguation. We fine-tune XLM-RoBERTa model to solve the task of word in context disambiguation, i.e., to determine whether the target word in the two contexts contains the same meaning or not. In the implementation, we first specifically design an input tag to emphasize the target word in the contexts. Second, we construct a new vector on the fine-tuned embeddings from XLM-RoBERTa and feed it to a fully-connected network to output the probability of whether the target word in the context has the same meaning or not. The new vector is attained by concatenating the embedding of the [CLS] token and the embeddings of the target word in the contexts. In training, we explore several tricks, such as the Ranger optimizer, data augmentation, and adversarial training, to improve the model prediction. Consequently, we attain first place in all four cross-lingual tasks.


翻译:本文展示了 PALI 团队在 SemEval 2021 任务2: 多语种和跨语言 Word- in-Context Disfendation 2: 我们微调 XLM- ROBERTA 模式, 以在背景脱节中解决单词任务, 即确定两个背景下的目标单词是否包含相同的含义。 在执行过程中, 我们首先专门设计一个输入标签, 以强调目标字。 其次, 我们在 XLM- ROBERTA 的精细调整嵌入上安装一个新的矢量, 并将其输入一个完全连接的网络, 以输出上下文中的目标单词是否具有相同含义的概率。 新的矢量是通过将[ CLS] 符号和目标单词嵌入到背景中来实现的。 在培训中, 我们探索了几个技巧, 如 游侠优化器、 数据增强和对抗性训练, 来改进模型预测。 因此, 我们在所有四种跨语言任务中获得了第一位 。

0
下载
关闭预览

相关内容

Transformer文本分类代码
专知会员服务
118+阅读 · 2020年2月3日
BERT进展2019四篇必读论文
专知会员服务
70+阅读 · 2020年1月2日
ExBert — 可视化分析Transformer学到的表示
专知会员服务
32+阅读 · 2019年10月16日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
53+阅读 · 2019年9月29日
RoBERTa中文预训练模型:RoBERTa for Chinese
PaperWeekly
57+阅读 · 2019年9月16日
BERT/Transformer/迁移学习NLP资源大列表
专知
19+阅读 · 2019年6月9日
NLP - 基于 BERT 的中文命名实体识别(NER)
AINLP
466+阅读 · 2019年2月10日
如何用最强模型BERT做NLP迁移学习?
AI100
3+阅读 · 2019年2月3日
BERT大火却不懂Transformer?读这一篇就够了
大数据文摘
12+阅读 · 2019年1月8日
NLP预训练模型大集合!
全球人工智能
31+阅读 · 2018年12月29日
Arxiv
0+阅读 · 2021年4月17日
Arxiv
4+阅读 · 2020年5月25日
Arxiv
4+阅读 · 2019年9月5日
Conditional BERT Contextual Augmentation
Arxiv
8+阅读 · 2018年12月17日
Arxiv
4+阅读 · 2018年9月6日
VIP会员
最新内容
超越网格:作战环境对炮兵的影响
专知会员服务
2+阅读 · 5月31日
BES:让语言模型通过双向进化搜索自我改进
专知会员服务
6+阅读 · 5月30日
以色列-美国-伊朗战争中的无人机:关键要点
专知会员服务
7+阅读 · 5月30日
《Palantir任务保障性软件安全标准(MA-S2)》
专知会员服务
19+阅读 · 5月30日
基于声学的无人机检测技术综述
专知会员服务
11+阅读 · 5月30日
《当代混合战争分析框架:俄乌战争经验教训》
专知会员服务
10+阅读 · 5月30日
相关资讯
Top
微信扫码咨询专知VIP会员