词元分析器论文 - 专知

会员服务 ·

词元分析器

词元分析器

Navigating User Behavior toward Personalized Multimodal Generation

Arxiv

0+阅读 · 6月23日

Keep The Essentials: Efficient Reference Conditioned Generation via Token Dropping

Arxiv

0+阅读 · 6月22日

Token-to-Token Alignment of Text Embeddings for Semantic Blending

Arxiv

0+阅读 · 6月22日

DriveStack-VLA: Render-Teacher Alignment for BEV-Based DeepStack Vision-Language-Action Model

Arxiv

0+阅读 · 6月23日

Forget Without Compromise: Nexus Sampling for Streaming KV-Cache Eviction Under Fixed Budgets

Arxiv

0+阅读 · 6月22日

IMAGIN-4D: Image-Guided Controllable Interaction Generation

Arxiv

0+阅读 · 6月22日

ParallelBench: Understanding the Trade-offs of Parallel Decoding in Diffusion LLMs

Arxiv

0+阅读 · 6月23日

Light-weight Pronunciation Assessment via Discrete Speech Token Surprisal

Light-weight Pronunciation Assessment via Discrete Speech Token Surprisal

Arxiv

0+阅读 · 6月23日

Accelerating Multimodal Large Language Models with Prior-Corrected Token Reduction

Arxiv

0+阅读 · 6月23日

CompressKV: Semantic-Retrieval-Guided KV-Cache Compression for Resource-Efficient Long-Context LLM Inference

CompressKV: Semantic-Retrieval-Guided KV-Cache Compression for Resource-Efficient Long-Context LLM Inference

Arxiv

0+阅读 · 6月23日

Spectral Evolution-Guided Token Pruning in Multimodal Large Language Models

Arxiv

0+阅读 · 6月23日

NeuroSonic: Conditional Flow Matching for EEG-to-Speech Reconstruction

Arxiv

0+阅读 · 6月23日

HAFM: Hierarchical Autoregressive Foundation Model for Music Accompaniment Generation

Arxiv

0+阅读 · 6月23日

LiveServe: Interaction-Aware Serving for Real-Time Omni-Modal LLMs

Arxiv

0+阅读 · 6月22日

SAFARI: Scaling Long Horizon Agentic Fault Attribution via Active Investigation

SAFARI: Scaling Long Horizon Agentic Fault Attribution via Active Investigation

Arxiv

0+阅读 · 6月23日

参考链接

微信扫码咨询专知VIP会员