多模态大语言模型论文 - 专知

会员服务 ·

多模态大语言模型

多模态大语言模型

Deep Residual Injection for Full-Spectrum Forensic Signal Perception in Multimodal Large Language Models

Arxiv

0+阅读 · 6月14日

Distilling Neuro-Symbolic Programs into 3D Multi-modal LLMs

Arxiv

0+阅读 · 5月31日

COGNITION: From Evaluation to Defense against Multimodal LLM CAPTCHA Solvers

Arxiv

0+阅读 · 6月11日

ChartFI: Benchmarking Faithfulness and Insightfulness of Chart Descriptions from Multimodal Large Language Models

Arxiv

0+阅读 · 6月10日

ASRU: Activation Steering Meets Reinforcement Unlearning for Multimodal Large Language Models

Arxiv

0+阅读 · 6月10日

DeceptionX: Explainable Deception Detection with Multimodal Large Language Models

Arxiv

0+阅读 · 6月9日

Beyond the Cartesian Illusion: Testing Two-Stage Multi-Modal Theory of Mind under Perceptual Bottlenecks

Arxiv

0+阅读 · 5月18日

Beyond Localization: A Comprehensive Diagnosis of Perspective-Conditioned Spatial Reasoning in MLLMs from Omnidirectional Images

Arxiv

0+阅读 · 5月12日

Seeing Candidates at Scale: Multimodal LLMs for Visual Political Communication on Instagram

Arxiv

0+阅读 · 4月21日

Relationship-Aware Safety Unlearning for Multimodal LLMs

Arxiv

0+阅读 · 3月25日

SpecEyes: Accelerating Agentic Multimodal LLMs via Speculative Perception and Planning

Arxiv

0+阅读 · 3月24日

Beam Prediction Based on Multimodal Large Language Models

Arxiv

0+阅读 · 3月16日

LoC-Path: Learning to Compress for Pathology Multimodal Large Language Models

Arxiv

0+阅读 · 3月12日

MathScape: Benchmarking Multimodal Large Language Models in Real-World Mathematical Contexts

Arxiv

0+阅读 · 2月23日

Not All Attention is Needed: Parameter and Computation Efficient Transfer Learning for Multi-modal Large Language Models

Arxiv

0+阅读 · 2月26日

参考链接

微信扫码咨询专知VIP会员