成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
蒸馏
关注
5
综合
百科
VIP
热门
动态
论文
精华
Private Speech Classification without Collapse: Stabilized DP Training and Offline Distillation
Arxiv
0+阅读 · 5月4日
Reliability Gated Multi-Teacher Distillation for Low Resource Abstractive Summarization
Arxiv
0+阅读 · 4月3日
Self-Distilled Reasoner: On-Policy Self-Distillation for Large Language Models
Arxiv
0+阅读 · 3月20日
Gumbel Distillation for Parallel Text Generation
Arxiv
0+阅读 · 3月23日
Demystifying OPD: Length Inflation and Stabilization Strategies for Large Language Models
Arxiv
0+阅读 · 4月9日
Distilling Photon-Counting CT into Routine Chest CT through Clinically Validated Degradation Modeling
Arxiv
0+阅读 · 4月8日
Short Data, Long Context: Distilling Positional Knowledge in Transformers
Arxiv
0+阅读 · 4月7日
DuoTeach: Dual Role Self-Teaching for Coarse-to-Fine Decision Coordination in Vision--Language Models
Arxiv
0+阅读 · 3月18日
Hán Dān Xué Bù (Mimicry) or Qīng Chū Yú Lán (Mastery)? A Cognitive Perspective on Reasoning Distillation in Large Language Models
Arxiv
0+阅读 · 4月23日
TuneShift-KD: Knowledge Distillation and Transfer for Fine-tuned Models
Arxiv
0+阅读 · 3月25日
World2VLM: Distilling World Model Imagination into VLMs for Dynamic Spatial Reasoning
Arxiv
0+阅读 · 4月29日
Membership Inference Attack against Large Language Model-based Recommendation Systems: A New Distillation-based Paradigm
Arxiv
0+阅读 · 3月19日
Salt: Self-Consistent Distribution Matching with Cache-Aware Training for Fast Video Generation
Arxiv
0+阅读 · 4月3日
Revisiting On-Policy Distillation: Empirical Failure Modes and Simple Fixes
Arxiv
0+阅读 · 3月26日
Uni-DAD: Unified Distillation and Adaptation of Diffusion Models for Few-step Few-shot Image Generation
Arxiv
0+阅读 · 3月25日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top