A key module in neural transformer-based deep architectures is positional encoding. This module enables a suitable way to encode positional information as input for transformer neural layers. This success has been rooted in the use of sinusoidal functions of various frequencies, in order to capture recurrent patterns of differing typical periods. In this work, an alternative set of periodic functions is proposed for positional encoding. These functions preserve some key properties of sinusoidal ones, while they depart from them in fundamental ways. Some tentative experiments are reported, where the original sinusoidal version is substantially outperformed. This strongly suggests that the alternative functions may have a wider use in other transformer architectures.


翻译:在基于神经Transformer的深度架构中,位置编码模块是关键组件。该模块能够将位置信息编码为Transformer神经层的合适输入形式。现有方法的成功源于采用不同频率的正弦函数,以捕捉具有不同典型周期的重复模式。本研究提出了一组用于位置编码的替代性周期函数。这些函数在保留正弦函数关键性质的同时,在本质上与其存在显著差异。初步实验结果表明,所提出的替代函数在性能上显著优于原始正弦函数版本。这强烈表明替代函数在其他Transformer架构中可能具有更广泛的应用前景。

0
下载
关闭预览

相关内容

【KDD2024】面向课程图稀疏化的轻量级图神经网络搜索
专知会员服务
19+阅读 · 2024年6月25日
【牛津博士论文】图神经网络网络分析,302页pdf
专知会员服务
46+阅读 · 2024年6月13日
【NeurIPS2023】神经预测与对齐的谱理论
专知会员服务
18+阅读 · 2023年9月28日
AAAI 2022 | ProtGNN:自解释图神经网络
专知会员服务
40+阅读 · 2022年2月28日
【TPAMI2022】双曲深度神经网络研究综述
专知会员服务
66+阅读 · 2021年12月29日
专知会员服务
37+阅读 · 2021年7月17日
【WSDM2021】拓扑去噪的鲁棒图神经网络
专知会员服务
27+阅读 · 2020年11月14日
专知会员服务
18+阅读 · 2020年10月18日
AAAI 2022 | ProtGNN:自解释图神经网络
专知
10+阅读 · 2022年2月28日
【ETH博士论文】贝叶斯深度学习,241页pdf
专知
10+阅读 · 2022年1月16日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
【KDD2020】图神经网络:基础与应用,322页ppt
直白介绍卷积神经网络(CNN)
算法与数学之美
13+阅读 · 2019年1月23日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关VIP内容
【KDD2024】面向课程图稀疏化的轻量级图神经网络搜索
专知会员服务
19+阅读 · 2024年6月25日
【牛津博士论文】图神经网络网络分析,302页pdf
专知会员服务
46+阅读 · 2024年6月13日
【NeurIPS2023】神经预测与对齐的谱理论
专知会员服务
18+阅读 · 2023年9月28日
AAAI 2022 | ProtGNN:自解释图神经网络
专知会员服务
40+阅读 · 2022年2月28日
【TPAMI2022】双曲深度神经网络研究综述
专知会员服务
66+阅读 · 2021年12月29日
专知会员服务
37+阅读 · 2021年7月17日
【WSDM2021】拓扑去噪的鲁棒图神经网络
专知会员服务
27+阅读 · 2020年11月14日
专知会员服务
18+阅读 · 2020年10月18日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员