跨模态论文 - 专知

会员服务 ·

跨模态

Discovering Functionally Selective Brain Regions with a Deep Topographic Multimodal Model

Arxiv

0+阅读 · 6月16日

The Slop Paradox: How Synthetic Standardization Erodes Clinical Uncertainty and Cross-Modal Alignment in AI-Rewritten Radiology Reports

Arxiv

0+阅读 · 6月16日

BusterX++: Towards Unified Cross-Modal AI-Generated Content Detection and Explanation with MLLM

Arxiv

0+阅读 · 6月15日

Plug-and-Adapt: Multimodal Coreference Resolution at First Sight with a Pretrained Alignment Model

Arxiv

0+阅读 · 6月16日

RLPR: Radar-to-LiDAR Place Recognition via Two-Stage Asymmetric Cross-Modal Alignment for Autonomous Driving

Arxiv

0+阅读 · 6月15日

Multimodal Evaluator Preference Collapse: Cross-Modal Contagion in Self-Evolving Agents

Arxiv

0+阅读 · 6月15日

G2IA: Geometry-Guided Instance-Aware Retrieval and Refinement for Cross-Modal Place Recognition

Arxiv

0+阅读 · 6月13日

Cross-modal Identity Mapping: Minimizing Information Loss in Modality Conversion via Reinforcement Learning

Arxiv

0+阅读 · 6月13日

Cross-Modal Registration Between 3D and 2D Fingerprints via Pose-Aware Unwrapping and Point-Cloud Fusion

Arxiv

0+阅读 · 6月14日

Understanding Cross-Modal Contributions in Continual Vision-Language Models: A Theoretical Perspective

Arxiv

0+阅读 · 6月12日

EyeMVP: OCT-Informed Fundus Representation Learning via Paired CFP--OCT Pretraining

Arxiv

0+阅读 · 6月13日

SkillMutator: Benchmarking and Defending Language-and-Code Cross-modal Attacks on LLM Agent Skills

Arxiv

0+阅读 · 6月12日

Multi-View Speech Representation Learning for Parkinson's Disease Detection Using Context-guided Cross-modal Attention

Arxiv

0+阅读 · 6月8日

The Alignment Curse: Modality Alignment Supercharges Audio Attacks via Text Transfer

Arxiv

0+阅读 · 5月29日

GaMi: Geometry-Agnostic Material Identification via Cross-Modal Subtractive Disentanglement

Arxiv

0+阅读 · 5月29日

参考链接

微信扫码咨询专知VIP会员