成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
衰减
关注
0
综合
百科
VIP
热门
动态
论文
精华
StereoAdapter-2: Globally Structure-Consistent Underwater Stereo Depth Estimation
Arxiv
0+阅读 · 2月18日
On Sharpened Convergence Rate of Generalized Sliced Inverse Regression for Nonlinear Sufficient Dimension Reduction
Arxiv
0+阅读 · 2月18日
Logarithmic-time Schedules for Scaling Language Models with Momentum
Arxiv
0+阅读 · 2月18日
Optimizer choice matters for the emergence of Neural Collapse
Arxiv
0+阅读 · 2月18日
DARB-Splatting: Generalizing Splatting with Decaying Anisotropic Radial Basis Functions
Arxiv
0+阅读 · 2月17日
Local Dense Logit Relations for Enhanced Knowledge Distillation
Arxiv
0+阅读 · 2月10日
Functional Scaling Laws in Kernel Regression: Loss Dynamics and Learning Rate Schedules
Arxiv
0+阅读 · 2月15日
Spectral Graph Analysis for Predicting QoE Fairness Sensitivity in Wireless Communication Networks
Arxiv
0+阅读 · 2月8日
Near-Constant Strong Violation and Last-Iterate Convergence for Online CMDPs via Decaying Safety Margins
Arxiv
0+阅读 · 2月11日
Key and Value Weights Are Probably All You Need: On the Necessity of the Query, Key, Value weight Triplet in Encoder-Only and Decoder-Only Transformers
Arxiv
0+阅读 · 2月6日
PACE: Prefix-Protected and Difficulty-Aware Compression for Efficient Reasoning
Arxiv
0+阅读 · 2月12日
Step by Step: Adaptive Gradient Descent for Training L-Lipschitz Neural Networks
Arxiv
0+阅读 · 2月6日
Flexible Entropy Control in RLVR with Gradient-Preserving Perspective
Arxiv
0+阅读 · 2月10日
Weight Decay may matter more than muP for Learning Rate Transfer in Practice
Arxiv
0+阅读 · 2月13日
S2D: Selective Spectral Decay for Quantization-Friendly Conditioning of Neural Activations
Arxiv
0+阅读 · 2月16日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top