成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
视觉语言模型
关注
5
综合
百科
VIP
热门
动态
论文
精华
DarkEQA: Benchmarking Vision-Language Models for Embodied Question Answering in Low-Light Indoor Environments
Arxiv
0+阅读 · 1月6日
Thinking with Blueprints: Assisting Vision-Language Models in Spatial Reasoning via Structured Object Representation
Arxiv
0+阅读 · 1月5日
DatBench: Discriminative, Faithful, and Efficient VLM Evaluations
Arxiv
0+阅读 · 1月5日
Foundation models on the bridge: Semantic hazard detection and safety maneuvers for maritime autonomy with vision-language models
Arxiv
0+阅读 · 1月5日
AFTER: Mitigating the Object Hallucination of LVLM via Adaptive Factual-Guided Activation Editing
Arxiv
0+阅读 · 1月5日
BiPrompt: Bilateral Prompt Optimization for Visual and Textual Debiasing in Vision-Language Models
Arxiv
0+阅读 · 1月5日
VerLM: Explaining Face Verification Using Natural Language
Arxiv
0+阅读 · 1月5日
Unified Generation and Self-Verification for Vision-Language Models via Advantage Decoupled Preference Optimization
Arxiv
0+阅读 · 1月4日
LSRE: Latent Semantic Rule Encoding for Real-Time Semantic Risk Detection in Autonomous Driving
Arxiv
0+阅读 · 1月4日
VisualActBench: Can VLMs See and Act like a Human?
Arxiv
0+阅读 · 1月4日
CRoPS: A Training-Free Hallucination Mitigation Framework for Vision-Language Models
Arxiv
0+阅读 · 1月2日
AutoTrust: Benchmarking Trustworthiness in Large Vision Language Models for Autonomous Driving
Arxiv
0+阅读 · 1月1日
DarkEQA: Benchmarking Vision-Language Models for Embodied Question Answering in Low-Light Indoor Environments
Arxiv
0+阅读 · 2025年12月31日
UniHetero: Could Generation Enhance Understanding for Vision-Language-Model at Large Data Scale?
Arxiv
0+阅读 · 2025年12月29日
Embodied Learning of Reward for Musculoskeletal Control with Vision Language Models
Arxiv
0+阅读 · 2025年12月28日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top