Transformer模型论文 - 专知

会员服务 ·

Transformer模型

Transformer模型

Enhancing Mental Health Classification with Layer-Attentive Residuals and Contrastive Feature Learning

Enhancing Mental Health Classification with Layer-Attentive Residuals and Contrastive Feature Learning

Arxiv

0+阅读 · 3月14日

Interpreto: An Explainability Library for Transformers

Arxiv

0+阅读 · 2月22日

TrainDeeploy: Hardware-Accelerated Parameter-Efficient Fine-Tuning of Small Transformer Models at the Extreme Edge

Arxiv

0+阅读 · 3月10日

NOBLE: Accelerating Transformers with Nonlinear Low-Rank Branches

Arxiv

0+阅读 · 3月6日

Standard Transformers Achieve the Minimax Rate in Nonparametric Regression with $C^{s,λ}$ Targets

Arxiv

0+阅读 · 2月24日

A statistical perspective on transformers for small longitudinal cohort data

Arxiv

0+阅读 · 2月18日

Monaural Multi-Speaker Speech Separation Using Efficient Transformer Model

Arxiv

0+阅读 · 2月17日

Scaling Recommender Transformers to One Billion Parameters

Arxiv

0+阅读 · 2月18日

Explainable AI: Context-Aware Layer-Wise Integrated Gradients for Explaining Transformer Models

Arxiv

0+阅读 · 2月18日

Noise Stability of Transformer Models

Arxiv

0+阅读 · 2月9日

Data Kernel Perspective Space Performance Guarantees for Synthetic Data from Transformer Models

Arxiv

0+阅读 · 2月4日

Greedy-Gnorm: A Gradient Matrix Norm-Based Alternative to Attention Entropy for Head Pruning

Arxiv

0+阅读 · 2月4日

Learnable Permutation for Structured Sparsity on Transformer Models

Arxiv

0+阅读 · 1月30日

Spatio-Temporal Transformers for Long-Term NDVI Forecasting

Arxiv

0+阅读 · 2月2日

YuriiFormer: A Suite of Nesterov-Accelerated Transformers

Arxiv

0+阅读 · 1月30日

参考链接

微信扫码咨询专知VIP会员