成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
困惑度
关注
0
综合
百科
VIP
热门
动态
论文
精华
Only relative ranks matter in weight-clustered large language models
Arxiv
0+阅读 · 3月18日
HubRouter: A Pluggable Sub-Quadratic Routing Primitive for Hybrid Sequence Models
Arxiv
0+阅读 · 4月24日
TuneShift-KD: Knowledge Distillation and Transfer for Fine-tuned Models
Arxiv
0+阅读 · 3月25日
PolyKV: A Shared Asymmetrically-Compressed KV Cache Pool for Multi-Agent LLM Inference
Arxiv
0+阅读 · 4月27日
RAMP: Reinforcement Adaptive Mixed Precision Quantization for Efficient On Device LLM Inference
Arxiv
0+阅读 · 3月18日
Aligning Dense Retrievers with LLM Utility via DistillationAligning Dense Retrievers with LLM Utility via Distillation
Arxiv
0+阅读 · 4月24日
Luminol-AIDetect: Fast Zero-shot Machine-Generated Text Detection based on Perplexity under Text Shuffling
Arxiv
0+阅读 · 4月28日
Detecting the Machine: A Comprehensive Benchmark of AI-Generated Text Detectors Across Architectures, Domains, and Adversarial Conditions
Arxiv
0+阅读 · 3月18日
Capability-Guided Compression: Toward Interpretability-Aware Budget Allocation for Large Language Models
Arxiv
0+阅读 · 3月17日
Directional Routing in Transformers
Arxiv
0+阅读 · 3月16日
SPQ: An Ensemble Technique for Large Language Model Compression
Arxiv
0+阅读 · 2月20日
DUEL: Exact Likelihood for Masked Diffusion via Deterministic Unmasking
Arxiv
0+阅读 · 3月10日
Negative Pre-activations Differentiate Syntax
Arxiv
0+阅读 · 3月1日
Reconstructing KV Caches with Cross-layer Fusion For Enhanced Transformers
Arxiv
0+阅读 · 2月19日
Context-level Language Modeling by Learning Predictive Context Embeddings
Arxiv
0+阅读 · 2月11日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top