成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
统一模型
关注
0
综合
百科
VIP
热门
动态
论文
精华
Fillerbuster: Unified Generative Scene Completion Model for Casual Captures
Arxiv
0+阅读 · 3月16日
RS-WorldModel: a Unified Model for Remote Sensing Understanding and Future Sense Forecasting
Arxiv
0+阅读 · 3月16日
OneRanker: Unified Generation and Ranking with One Model in Industrial Advertising Recommendation
Arxiv
0+阅读 · 3月12日
UniG2U-Bench: Do Unified Models Advance Multimodal Understanding?
Arxiv
0+阅读 · 3月3日
One Model, Many Budgets: Elastic Latent Interfaces for Diffusion Transformers
Arxiv
0+阅读 · 3月12日
Utonia: Toward One Encoder for All Point Clouds
Arxiv
0+阅读 · 3月3日
UniTAF: A Modular Framework for Joint Text-to-Speech and Audio-to-Face Modeling
Arxiv
0+阅读 · 2月17日
UReason: Benchmarking the Reasoning Paradox in Unified Multimodal Models
Arxiv
0+阅读 · 2月9日
Polytope Scheduling with Groups: Unified Models and Optimal Guarantees
Arxiv
0+阅读 · 2月11日
Can We Build a Monolithic Model for Fake Image Detection? SICA: Semantic-Induced Constrained Adaptation for Unified-Yet-Discriminative Artifact Feature Space Reconstruction
Arxiv
0+阅读 · 2月6日
UniT: Unified Multimodal Chain-of-Thought Test-time Scaling
Arxiv
0+阅读 · 2月12日
SNAP: Towards Segmenting Anything in Any Point Cloud
Arxiv
0+阅读 · 2月10日
BagelVLA: Enhancing Long-Horizon Manipulation via Interleaved Vision-Language-Action Generation
Arxiv
0+阅读 · 2月10日
ChatUMM: Robust Context Tracking for Conversational Interleaved Generation
Arxiv
0+阅读 · 2月6日
UM-Text: A Unified Multimodal Model for Image Understanding
Arxiv
0+阅读 · 1月13日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top