成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
跨模态
关注
2
综合
百科
VIP
热门
动态
论文
精华
Towards Unbiased Cross-Modal Representation Learning for Food Image-to-Recipe Retrieval
Arxiv
0+阅读 · 1月6日
BusterX++: Towards Unified Cross-Modal AI-Generated Content Detection and Explanation with MLLM
Arxiv
0+阅读 · 1月6日
VisRet: Visualization Improves Knowledge-Intensive Text-to-Image Retrieval
Arxiv
0+阅读 · 1月6日
Achieving Fine-grained Cross-modal Understanding through Brain-inspired Hierarchical Representation Learning
Arxiv
0+阅读 · 1月4日
Cross-modal Retrieval Models for Stripped Binary Analysis
Arxiv
0+阅读 · 1月5日
Modality Dominance-Aware Optimization for Embodied RGB-Infrared Perception
Arxiv
0+阅读 · 1月2日
Video and Language Alignment in 2D Systems for 3D Multi-object Scenes with Multi-Information Derivative-Free Control
Arxiv
0+阅读 · 2025年12月31日
Guiding Cross-Modal Representations with MLLM Priors via Preference Alignment
Arxiv
0+阅读 · 2025年12月31日
Neighbor-aware Instance Refining with Noisy Labels for Cross-Modal Retrieval
Arxiv
0+阅读 · 2025年12月30日
APT-CGLP: Advanced Persistent Threat Hunting via Contrastive Graph-Language Pre-Training
Arxiv
0+阅读 · 2025年12月31日
Multimodal Interpretation of Remote Sensing Images: Dynamic Resolution Input Strategy and Multi-scale Vision-Language Alignment Mechanism
Arxiv
0+阅读 · 2025年12月29日
Cross-modal Full-mode Fine-grained Alignment for Text-to-Image Person Retrieval
Arxiv
0+阅读 · 2025年12月28日
Emotion-Director: Bridging Affective Shortcut in Emotion-Oriented Image Generation
Arxiv
0+阅读 · 2025年12月22日
Beyond Weight Adaptation: Feature-Space Domain Injection for Cross-Modal Ship Re-Identification
Arxiv
0+阅读 · 2025年12月24日
Beyond CLIP: Knowledge-Enhanced Multimodal Transformers for Cross-Modal Alignment in Diabetic Retinopathy Diagnosis
Arxiv
0+阅读 · 2025年12月22日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top