成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
跨模态
关注
2
综合
百科
VIP
热门
动态
论文
精华
Art2Mus: Artwork-to-Music Generation via Visual Conditioning and Large-Scale Cross-Modal Alignment
Arxiv
0+阅读 · 2月19日
SpectralGCD: Spectral Concept Selection and Cross-modal Representation Learning for Generalized Category Discovery
Arxiv
0+阅读 · 2月19日
Cross-Modal Purification and Fusion for Small-Object RGB-D Transmission-Line Defect Detection
Arxiv
0+阅读 · 2月17日
MLDocRAG: Multimodal Long-Context Document Retrieval Augmented Generation
Arxiv
0+阅读 · 2月13日
Cross-Modal Retrieval for Motion and Text via DropTriple Loss
Arxiv
0+阅读 · 2月9日
Cross-Modal Purification and Fusion for Small-Object RGB-D Transmission-Line Defect Detection
Arxiv
0+阅读 · 2月15日
SciClaimEval: Cross-modal Claim Verification in Scientific Papers
Arxiv
0+阅读 · 2月13日
SciClaimEval: Cross-modal Claim Verification in Scientific Papers
Arxiv
0+阅读 · 2月7日
Cross-Modal Mapping: Mitigating the Modality Gap for Few-Shot Image Classification
Arxiv
0+阅读 · 2月15日
RMPL: Relation-aware Multi-task Progressive Learning with Stage-wise Training for Multimedia Event Extraction
Arxiv
0+阅读 · 2月14日
Omni-Safety under Cross-Modality Conflict: Vulnerabilities, Dynamics Mechanisms and Efficient Alignment
Arxiv
0+阅读 · 2月10日
Cross-Modal Robustness Transfer (CMRT): Training Robust Speech Translation Models Using Adversarial Text
Arxiv
0+阅读 · 2月12日
CAF-Mamba: Mamba-Based Cross-Modal Adaptive Attention Fusion for Multimodal Depression Detection
Arxiv
0+阅读 · 2月9日
VENOMREC: Cross-Modal Interactive Poisoning for Targeted Promotion in Multimodal LLM Recommender Systems
Arxiv
0+阅读 · 2月6日
Risk Awareness Injection: Calibrating Vision-Language Models for Safety without Compromising Utility
Arxiv
0+阅读 · 2月11日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top