成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
Transformer
关注
244
Transformer是谷歌发表的论文《Attention Is All You Need》提出一种完全基于Attention的翻译架构
综合
百科
荟萃
VIP
热门
动态
论文
精华
知识荟萃
论文列表
原文:
《Attention is all you need》:
https://papers.nips.cc/paper/7181-attention-is-all-you-need.pdf
相关论文
《Reformer: The Efficient Transformer》:
https://arxiv.org/abs/2001.04451
开源代码
Kyubyong/transformer
(TF)
huggingface/transformers
(PyTorch)
前往荟萃
精品内容
【博士论文】论视觉 Transformer (Vision Transformers) 中的归纳偏置
专知会员服务
9+阅读 · 2月13日
【博士论文】用于搜索的 Transformer 模型:检索、鲁棒性与拒绝机制
专知会员服务
9+阅读 · 2月8日
【AAAI2026】URaG:面向高效长文档理解的多模态大语言模型统一检索与生成框架
专知会员服务
14+阅读 · 2025年11月14日
大语言模型幻觉:系统综述
专知会员服务
39+阅读 · 2025年10月10日
面向无人机应用的 Transformer 与大语言模型最新进展
专知会员服务
32+阅读 · 2025年9月14日
【ICCV2025】通过 Token 解耦与合成数据实现可扩展的基于 Transformer 的新视角合成模型
专知会员服务
11+阅读 · 2025年9月9日
【ICCV2025】Lay2Story:扩展扩散 Transformer 以实现可切换布局的故事生成
专知会员服务
13+阅读 · 2025年8月13日
【博士论文】推进数据高效的深度学习:非参数 Transformer、主动测试与上下文学习
专知会员服务
25+阅读 · 2025年8月7日
基于 Transformer 的脑电解码综述询问 ChatGPT
专知会员服务
12+阅读 · 2025年7月6日
扩散模型中的 Transformer:图像生成及其延展应用询问 ChatGPT
专知会员服务
11+阅读 · 2025年7月5日
扩散模型量化综述
专知会员服务
18+阅读 · 2025年5月11日
CVPR2025最新《扩散Transformers》论文,概述最新图像视频生成方法
专知会员服务
12+阅读 · 2025年4月20日
DS系列专题:DeepSeek技术溯源及前沿探索,50页ppt
专知会员服务
51+阅读 · 2025年3月26日
CVPR2025最新《Transformer模型》论文速读
专知会员服务
26+阅读 · 2025年3月17日
何恺明&Lecun新论文CVPR2025《无需归一化的 Transformer》
专知会员服务
18+阅读 · 2025年3月15日
参考链接
荟萃目录
论文列表
原文:
相关论文
开源代码
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top