成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
Softmax
关注
0
综合
百科
VIP
热门
动态
论文
精华
Inverse classification with logistic and softmax classifiers: efficient optimization
Arxiv
0+阅读 · 3月19日
Screening Is Enough
Arxiv
0+阅读 · 4月1日
Screening Is Enough
Arxiv
0+阅读 · 4月6日
Similarity-Distance-Magnitude Activations
Arxiv
0+阅读 · 4月16日
Gradient Boosting within a Single Attention Layer
Arxiv
0+阅读 · 4月3日
K-Way Energy Probes for Metacognition Reduce to Softmax in Discriminative Predictive Coding Networks
Arxiv
0+阅读 · 4月13日
On Bayesian Softmax-Gated Mixture-of-Experts Models
Arxiv
0+阅读 · 4月22日
Taming the Exponential: A Fast Softmax Surrogate for Integer-Native Edge Inference
Arxiv
0+阅读 · 4月2日
Winner-Take-All Spiking Transformer for Language Modeling
Arxiv
0+阅读 · 4月13日
Linearizing Vision Transformer with Test-Time Training
Arxiv
0+阅读 · 5月4日
On the Expressive Power of Contextual Relations in Transformers
Arxiv
0+阅读 · 5月1日
Why Softmax Attention Outperforms Linear Attention
Arxiv
0+阅读 · 3月13日
Rethinking Attention: Polynomial Alternatives to Softmax in Transformers
Arxiv
0+阅读 · 3月13日
The Counting Power of Transformers
Arxiv
0+阅读 · 3月2日
HyTRec: A Hybrid Temporal-Aware Attention Architecture for Long Behavior Sequential Recommendation
Arxiv
0+阅读 · 2月20日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top