【Tutorial】计算机视觉中的Transformer，98页ppt - 专知VIP

会员服务 ·

41

Transformer · 计算机视觉 · 论文 ·

2021 年 10 月 25 日

【Tutorial】计算机视觉中的Transformer，98页ppt

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

在2017年谷歌设计了Transformer，并在NLP社区显示出了效果之后，有大量的工作专注于将其应用到计算机视觉社区。本文首先简要介绍了计算机视觉中的Transformer。然后，介绍了Transformer模型在低/高级视觉任务、模型压缩和主干设计方面的一些代表性工作。

曹越，现任微软亚洲研究院视觉计算组主管研究员，分别于2014年和2019年在清华大学软件学院获得本科和博士学位，曾于2017年获微软学者奖学金、2018年获清华大学特等奖学金。至今在CVPR、ICCV、ICLR、ICML、NeurIPS等国际会议和期刊中发表论文20余篇，其中有三篇入围PaperDigest Most Influential Papers榜单，谷歌引用五千余次。目前主要的研究兴趣是自监督学习、多模态学习以及自注意力建模。

http://yue-cao.me

成为VIP会员查看完整内容

相关内容

Transformer

Transformer是谷歌发表的论文《Attention Is All You Need》提出一种完全基于Attention的翻译架构

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【ICML2021】计算机视觉中的自注意力机制，谷歌伯克利166页ppt教程

专知会员服务

136+阅读 · 2021年7月22日

【NAACL2021】长序列自然语言处理, 250页ppt

【NAACL2021】长序列自然语言处理, 250页ppt

专知会员服务

62+阅读 · 2021年6月7日

计算机视觉中的自监督学习与注意力建模

专知会员服务

60+阅读 · 2021年4月11日

【邱锡鹏老师CIPSATT2020教程】自然语言处理中的预训练模型，149页ppt

专知会员服务

105+阅读 · 2020年11月10日

【邱锡鹏老师SMP2020教程】自然语言处理中的预训练模型，90页ppt

【邱锡鹏老师SMP2020教程】自然语言处理中的预训练模型，90页ppt

专知会员服务

124+阅读 · 2020年9月11日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知会员服务

108+阅读 · 2020年8月30日

【MLSS2020】最新《深度学习基础》视频讲解，42页ppt

【MLSS2020】最新《深度学习基础》视频讲解，42页ppt

专知会员服务

47+阅读 · 2020年8月5日

迁移学习简明教程，11页ppt

迁移学习简明教程，11页ppt

专知会员服务

109+阅读 · 2020年8月4日

预训练语言模型BERT，Jacob Devlin斯坦福演讲PPT：BERT介绍与答疑，35页ppt

预训练语言模型BERT，Jacob Devlin斯坦福演讲PPT：BERT介绍与答疑，35页ppt

专知会员服务

115+阅读 · 2020年1月7日

【EMNLP 2019】Discreteness in Neural Natural Language Processing，神经自然语言处理中的离散性，附303页PPT免费下载

【EMNLP 2019】Discreteness in Neural Natural Language Processing，神经自然语言处理中的离散性，附303页PPT免费下载

专知会员服务

26+阅读 · 2019年11月7日

综述｜计算机视觉中的注意力机制

综述｜计算机视觉中的注意力机制

极市平台

8+阅读 · 2020年8月30日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

14+阅读 · 2020年8月30日

【CIKM2019教程】新加坡国立大学：基于图学习与推理的推荐系统，附133页ppt

【CIKM2019教程】新加坡国立大学：基于图学习与推理的推荐系统，附133页ppt

专知

62+阅读 · 2019年11月4日

ICCV 2019教程《面向计算机视觉的可解释机器学习》，附280页PPT下载

ICCV 2019教程《面向计算机视觉的可解释机器学习》，附280页PPT下载

专知

33+阅读 · 2019年11月1日

【复旦大学邱锡鹏老师】面向自然语言处理的深度学习基础，199页ppt

【复旦大学邱锡鹏老师】面向自然语言处理的深度学习基础，199页ppt

专知

159+阅读 · 2019年9月8日

计算机视觉中深度迁移学习，165页PPT

计算机视觉中深度迁移学习，165页PPT

专知

23+阅读 · 2019年8月18日

自注意力机制在计算机视觉中的应用

自注意力机制在计算机视觉中的应用

GAN生成式对抗网络

19+阅读 · 2018年12月20日

自注意力机制在计算机视觉中的应用【附PPT与视频资料】

自注意力机制在计算机视觉中的应用【附PPT与视频资料】

人工智能前沿讲习班

17+阅读 · 2018年12月20日

实录分享 | 计算未来轻沙龙：计算机视觉与图形学（PPT下载）

实录分享 | 计算未来轻沙龙：计算机视觉与图形学（PPT下载）

PaperWeekly

8+阅读 · 2018年12月4日

【学科发展报告】计算机视觉

【学科发展报告】计算机视觉

中国自动化学会

43+阅读 · 2018年10月12日

Efficient Visual Tracking with Exemplar Transformers

Arxiv

0+阅读 · 2021年12月17日

MST: Masked Self-Supervised Transformer for Visual Representation

Arxiv

4+阅读 · 2021年6月10日

Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspective with Transformers

Arxiv

10+阅读 · 2020年12月31日

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

Arxiv

19+阅读 · 2020年11月18日

LXMERT: Learning Cross-Modality Encoder Representations from Transformers

LXMERT: Learning Cross-Modality Encoder Representations from Transformers

Arxiv

4+阅读 · 2019年12月3日

Learning Deep Transformer Models for Machine Translation

Learning Deep Transformer Models for Machine Translation

Arxiv

3+阅读 · 2019年6月5日

Temporal Deformable Convolutional Encoder-Decoder Networks for Video Captioning

Temporal Deformable Convolutional Encoder-Decoder Networks for Video Captioning

Arxiv

6+阅读 · 2019年5月3日

Conditional BERT Contextual Augmentation

Conditional BERT Contextual Augmentation

Arxiv

8+阅读 · 2018年12月17日

You May Not Need Attention

Arxiv

4+阅读 · 2018年10月31日

End-to-End Dense Video Captioning with Masked Transformer

Arxiv

14+阅读 · 2018年4月3日

VIP会员

相关主题

计算机视觉

最新内容

对抗环境下超视距目标打击的情报支援

对抗环境下超视距目标打击的情报支援

专知会员服务

3+阅读 · 今天14:49

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

专知会员服务

1+阅读 · 今天14:25

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

专知会员服务

2+阅读 · 今天13:57

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

专知会员服务

2+阅读 · 今天13:27

《无人机对海面作战影响评估》

《无人机对海面作战影响评估》

专知会员服务

11+阅读 · 7月21日

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

专知会员服务

10+阅读 · 7月21日

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

专知会员服务

4+阅读 · 7月21日

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

专知会员服务

6+阅读 · 7月21日

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

专知会员服务

8+阅读 · 7月21日

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

6+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

8+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

6+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

9+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

8+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

10+阅读 · 7月20日

相关VIP内容

【ICML2021】计算机视觉中的自注意力机制，谷歌伯克利166页ppt教程

专知会员服务

136+阅读 · 2021年7月22日

【NAACL2021】长序列自然语言处理, 250页ppt

【NAACL2021】长序列自然语言处理, 250页ppt

专知会员服务

62+阅读 · 2021年6月7日

计算机视觉中的自监督学习与注意力建模

专知会员服务

60+阅读 · 2021年4月11日

【邱锡鹏老师CIPSATT2020教程】自然语言处理中的预训练模型，149页ppt

专知会员服务

105+阅读 · 2020年11月10日

【邱锡鹏老师SMP2020教程】自然语言处理中的预训练模型，90页ppt

【邱锡鹏老师SMP2020教程】自然语言处理中的预训练模型，90页ppt

专知会员服务

124+阅读 · 2020年9月11日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知会员服务

108+阅读 · 2020年8月30日

【MLSS2020】最新《深度学习基础》视频讲解，42页ppt

【MLSS2020】最新《深度学习基础》视频讲解，42页ppt

专知会员服务

47+阅读 · 2020年8月5日

迁移学习简明教程，11页ppt

迁移学习简明教程，11页ppt

专知会员服务

109+阅读 · 2020年8月4日

预训练语言模型BERT，Jacob Devlin斯坦福演讲PPT：BERT介绍与答疑，35页ppt

预训练语言模型BERT，Jacob Devlin斯坦福演讲PPT：BERT介绍与答疑，35页ppt

专知会员服务

115+阅读 · 2020年1月7日

【EMNLP 2019】Discreteness in Neural Natural Language Processing，神经自然语言处理中的离散性，附303页PPT免费下载

【EMNLP 2019】Discreteness in Neural Natural Language Processing，神经自然语言处理中的离散性，附303页PPT免费下载

专知会员服务

26+阅读 · 2019年11月7日

热门VIP内容

开通专知VIP会员享更多权益服务

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

对抗环境下超视距目标打击的情报支援

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

相关资讯

综述｜计算机视觉中的注意力机制

综述｜计算机视觉中的注意力机制

极市平台

8+阅读 · 2020年8月30日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

14+阅读 · 2020年8月30日

【CIKM2019教程】新加坡国立大学：基于图学习与推理的推荐系统，附133页ppt

【CIKM2019教程】新加坡国立大学：基于图学习与推理的推荐系统，附133页ppt

专知

62+阅读 · 2019年11月4日

ICCV 2019教程《面向计算机视觉的可解释机器学习》，附280页PPT下载

ICCV 2019教程《面向计算机视觉的可解释机器学习》，附280页PPT下载

专知

33+阅读 · 2019年11月1日

【复旦大学邱锡鹏老师】面向自然语言处理的深度学习基础，199页ppt

【复旦大学邱锡鹏老师】面向自然语言处理的深度学习基础，199页ppt

专知

159+阅读 · 2019年9月8日

计算机视觉中深度迁移学习，165页PPT

计算机视觉中深度迁移学习，165页PPT

专知

23+阅读 · 2019年8月18日

自注意力机制在计算机视觉中的应用

自注意力机制在计算机视觉中的应用

GAN生成式对抗网络

19+阅读 · 2018年12月20日

自注意力机制在计算机视觉中的应用【附PPT与视频资料】

自注意力机制在计算机视觉中的应用【附PPT与视频资料】

人工智能前沿讲习班

17+阅读 · 2018年12月20日

实录分享 | 计算未来轻沙龙：计算机视觉与图形学（PPT下载）

实录分享 | 计算未来轻沙龙：计算机视觉与图形学（PPT下载）

PaperWeekly

8+阅读 · 2018年12月4日

【学科发展报告】计算机视觉

【学科发展报告】计算机视觉

中国自动化学会

43+阅读 · 2018年10月12日

相关论文

Efficient Visual Tracking with Exemplar Transformers

Arxiv

0+阅读 · 2021年12月17日

MST: Masked Self-Supervised Transformer for Visual Representation

Arxiv

4+阅读 · 2021年6月10日

Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspective with Transformers

Arxiv

10+阅读 · 2020年12月31日

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

Arxiv

19+阅读 · 2020年11月18日

LXMERT: Learning Cross-Modality Encoder Representations from Transformers

LXMERT: Learning Cross-Modality Encoder Representations from Transformers

Arxiv

4+阅读 · 2019年12月3日

Learning Deep Transformer Models for Machine Translation

Learning Deep Transformer Models for Machine Translation

Arxiv

3+阅读 · 2019年6月5日

Temporal Deformable Convolutional Encoder-Decoder Networks for Video Captioning

Temporal Deformable Convolutional Encoder-Decoder Networks for Video Captioning

Arxiv

6+阅读 · 2019年5月3日

Conditional BERT Contextual Augmentation

Conditional BERT Contextual Augmentation

Arxiv

8+阅读 · 2018年12月17日

You May Not Need Attention

Arxiv

4+阅读 · 2018年10月31日

End-to-End Dense Video Captioning with Masked Transformer

Arxiv

14+阅读 · 2018年4月3日

微信扫码咨询专知VIP会员