成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
单模
关注
0
综合
百科
VIP
热门
动态
论文
精华
Multimodal Classification via Total Correlation Maximization
Arxiv
0+阅读 · 2月13日
The Interspeech 2026 Audio Reasoning Challenge: Evaluating Reasoning Process Quality for Audio Reasoning Models and Agents
Arxiv
0+阅读 · 2月15日
GPR: Towards a Generative Pre-trained One-Model Paradigm for Large-Scale Advertising Recommendation
Arxiv
0+阅读 · 2月12日
Gesturing Toward Abstraction: Multimodal Convention Formation in Collaborative Physical Tasks
Arxiv
0+阅读 · 2月9日
AutoLL: Automatic Linear Layout of Graphs based on Deep Neural Network
Arxiv
0+阅读 · 2月13日
ExplainReduce: Generating global explanations from many local explanations
Arxiv
0+阅读 · 2月5日
Beyond Unimodal Shortcuts: MLLMs as Cross-Modal Reasoners for Grounded Named Entity Recognition
Arxiv
0+阅读 · 2月4日
When Routing Collapses: On the Degenerate Convergence of LLM Routers
Arxiv
0+阅读 · 2月3日
Real-World Evaluation of two Cooperative Intersection Management Approaches
Arxiv
0+阅读 · 2月1日
OneFlowSBI: One Model, Many Queries for Simulation-Based Inference
Arxiv
0+阅读 · 1月30日
Embracing Aleatoric Uncertainty in Medical Multimodal Learning with Missing Modalities
Arxiv
0+阅读 · 1月29日
Apollo: Unified Multi-Task Audio-Video Joint Generation
Arxiv
0+阅读 · 1月13日
Read as You See: Guiding Unimodal LLMs for Low-Resource Explainable Harmful Meme Detection
Arxiv
0+阅读 · 1月28日
The Geometric Mechanics of Contrastive Representation Learning: Alignment Potentials, Entropic Dispersion, and Cross-Modal Divergence
Arxiv
0+阅读 · 1月27日
Extending Audio Context for Long-Form Understanding in Large Audio-Language Models
Arxiv
0+阅读 · 1月21日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top