统一模型论文 - 专知

会员服务 ·

统一模型

DDTNet: Degradation Disentanglement and Transfer Network for Test-Time All-in-One De-weathering Adaptation

Arxiv

0+阅读 · 6月15日

UniT: Unified Multimodal Chain-of-Thought Test-time Scaling

Arxiv

0+阅读 · 6月12日

Dasheng AudioGen: A Unified Model for Generating Coherent Audio Scenes from Text

Arxiv

0+阅读 · 5月27日

UniVoice: A Unified Model for Speech and Singing Voice Generation

Arxiv

0+阅读 · 6月4日

Lighting-aware Unified Model for Instance Segmentation

Arxiv

0+阅读 · 6月9日

OneVoice: One Model, Triple Scenarios-Towards Unified Zero-shot Voice Conversion

Arxiv

0+阅读 · 5月21日

ATLAS: Agentic or Latent Visual Reasoning? One Word is Enough for Both

Arxiv

0+阅读 · 5月14日

Lumos-Nexus: Efficient Frequency Bridging with Homogeneous Latent Space for Video Unified Models

Arxiv

0+阅读 · 5月29日

Lumos-1: On Autoregressive Video Generation with Discrete Diffusion from a Unified Model Perspective

Arxiv

0+阅读 · 3月15日

Living Databases: A Unified Model for Continuous Schema Evolution, Versioning, and Transformations

Arxiv

0+阅读 · 5月1日

LatentUM: Unleashing the Potential of Interleaved Cross-Modal Reasoning via a Latent-Space Unified Model

Arxiv

0+阅读 · 4月2日

Fillerbuster: Unified Generative Scene Completion Model for Casual Captures

Arxiv

0+阅读 · 3月16日

RS-WorldModel: a Unified Model for Remote Sensing Understanding and Future Sense Forecasting

Arxiv

0+阅读 · 3月16日

OneRanker: Unified Generation and Ranking with One Model in Industrial Advertising Recommendation

Arxiv

0+阅读 · 3月12日

UniG2U-Bench: Do Unified Models Advance Multimodal Understanding?

Arxiv

0+阅读 · 3月3日

参考链接

微信扫码咨询专知VIP会员