We present a High-Resolution Transformer (HRFormer) that learns high-resolution representations for dense prediction tasks, in contrast to the original Vision Transformer that produces low-resolution representations and has high memory and computational cost. We take advantage of the multi-resolution parallel design introduced in high-resolution convolutional networks (HRNet), along with local-window self-attention that performs self-attention over small non-overlapping image windows, for improving the memory and computation efficiency. In addition, we introduce a convolution into the FFN to exchange information across the disconnected image windows. We demonstrate the effectiveness of the High-Resolution Transformer on both human pose estimation and semantic segmentation tasks, e.g., HRFormer outperforms Swin transformer by $1.3$ AP on COCO pose estimation with $50\%$ fewer parameters and $30\%$ fewer FLOPs. Code is available at: https://github.com/HRNet/HRFormer.


翻译:我们推出高分辨率变压器(HRFormer),该变压器在密集的预测任务中学习高清晰度表示,而原先的愿景变压器则产生低清晰度表示,并具有很高的内存和计算成本。我们利用高分辨率变压网络(HRNet)引入的多分辨率平行设计,同时利用对小型非重叠图像窗口进行自控的本地窗口自控,以提高记忆和计算效率。此外,我们还引入了向新生力量的演进,以在断开的图像窗口之间交流信息。我们展示了高分辨率变压器在人类面貌估计和语义分解任务上的有效性,例如,HRFormer公司在COCOCO上以1.3美元取代Swin变压器,其估计值减少50美元,FLOPs则减少30美元。代码见:https://github.com/HRNet/HRFormer。

0
下载
关闭预览

相关内容

【Tutorial】计算机视觉中的Transformer,98页ppt
专知会员服务
157+阅读 · 2021年10月25日
专知会员服务
57+阅读 · 2021年1月26日
最新《Transformers模型》教程,64页ppt
专知会员服务
326+阅读 · 2020年11月26日
Transformer模型-深度学习自然语言处理,17页ppt
专知会员服务
108+阅读 · 2020年8月30日
计算机视觉最佳实践、代码示例和相关文档
专知会员服务
20+阅读 · 2019年10月9日
已删除
将门创投
3+阅读 · 2019年10月18日
BERT/Transformer/迁移学习NLP资源大列表
专知
19+阅读 · 2019年6月9日
语义分割+视频分割开源代码集合
极市平台
35+阅读 · 2018年3月5日
【推荐】全卷积语义分割综述
机器学习研究会
19+阅读 · 2017年8月31日
Arxiv
1+阅读 · 2022年1月10日
Arxiv
4+阅读 · 2021年11月29日
Swin Transformer V2: Scaling Up Capacity and Resolution
Arxiv
11+阅读 · 2021年10月26日
Arxiv
5+阅读 · 2019年8月22日
VIP会员
最新内容
《美国战争部2027财年军事人员预算》
专知会员服务
0+阅读 · 32分钟前
伊朗战争中的电子战
专知会员服务
3+阅读 · 今天7:04
大语言模型平台在国防情报应用中的对比
专知会员服务
5+阅读 · 今天3:12
美海军“超配项目”
专知会员服务
6+阅读 · 今天2:13
《美陆军条例:陆军指挥政策(2026版)》
专知会员服务
10+阅读 · 4月21日
《军用自主人工智能系统的治理与安全》
专知会员服务
7+阅读 · 4月21日
相关VIP内容
相关资讯
已删除
将门创投
3+阅读 · 2019年10月18日
BERT/Transformer/迁移学习NLP资源大列表
专知
19+阅读 · 2019年6月9日
语义分割+视频分割开源代码集合
极市平台
35+阅读 · 2018年3月5日
【推荐】全卷积语义分割综述
机器学习研究会
19+阅读 · 2017年8月31日
Top
微信扫码咨询专知VIP会员