成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
跨模态
关注
2
综合
百科
VIP
热门
动态
论文
精华
A quantitative analysis of semantic information in deep representations of text and images
Arxiv
0+阅读 · 3月18日
Attention-guided Evidence Grounding for Spoken Question Answering
Arxiv
0+阅读 · 3月17日
LAMB: LLM-based Audio Captioning with Modality Gap Bridging via Cauchy-Schwarz Divergence
Arxiv
0+阅读 · 3月16日
Learning Image-Text Matching with Optimal Partial Transport
Arxiv
0+阅读 · 3月15日
Efficient endometrial carcinoma screening via cross-modal synthesis and gradient distillation
Arxiv
0+阅读 · 2月23日
Closing the Gap Between Text and Speech Understanding in LLMs
Arxiv
0+阅读 · 2月23日
MoD-DPO: Towards Mitigating Cross-modal Hallucinations in Omni LLMs using Modality Decoupled Preference Optimization
Arxiv
0+阅读 · 3月3日
Continual Learning with Vision-Language Models via Semantic-Geometry Preservation
Arxiv
0+阅读 · 3月12日
BioX-Bridge: Model Bridging for Unsupervised Cross-Modal Knowledge Transfer across Biosignals
Arxiv
0+阅读 · 2月24日
Brewing Stronger Features: Dual-Teacher Distillation for Multispectral Earth Observation
Arxiv
0+阅读 · 2月23日
A Survey on Cross-Modal Interaction Between Music and Multimodal Data
Arxiv
0+阅读 · 2月21日
CLEAR: Null-Space Projection for Cross-Modal De-Redundancy in Multimodal Recommendation
Arxiv
0+阅读 · 3月2日
PolyJailbreak: Cross-Modal Jailbreaking Attacks on Black-Box Multimodal LLMs
Arxiv
0+阅读 · 3月7日
Editable-DeepSC: Reliable Cross-Modal Semantic Communications for Facial Editing
Arxiv
0+阅读 · 2月21日
SpecBridge: Bridging Mass Spectrometry and Molecular Representations via Cross-Modal Alignment
Arxiv
0+阅读 · 3月3日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top