成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
视觉语言模型
关注
5
综合
百科
VIP
热门
动态
论文
精华
AgriPath: A Systematic Exploration of Architectural Trade-offs for Crop Disease Classification
Arxiv
0+阅读 · 3月17日
Anatomy of a Lie: A Multi-Stage Diagnostic Framework for Tracing Hallucinations in Vision-Language Models
Arxiv
0+阅读 · 3月16日
ViX-Ray: A Vietnamese Chest X-Ray Dataset for Vision-Language Models
Arxiv
0+阅读 · 3月16日
DriveMind: A Dual Visual Language Model-based Reinforcement Learning Framework for Autonomous Driving
Arxiv
0+阅读 · 3月13日
Evaluating VLMs' Spatial Reasoning Over Robot Motion: A Step Towards Robot Planning with Motion Preferences
Arxiv
0+阅读 · 3月13日
RobotArena $\infty$: Scalable Robot Benchmarking via Real-to-Sim Translation
Arxiv
0+阅读 · 3月13日
HomeSafe-Bench: Evaluating Vision-Language Models on Unsafe Action Detection for Embodied Agents in Household Scenarios
Arxiv
0+阅读 · 3月13日
Ego: Embedding-Guided Personalization of Vision-Language Models
Arxiv
0+阅读 · 3月11日
Beyond Dominant Patches: Spatial Credit Redistribution For Grounded Vision-Language Models
Arxiv
0+阅读 · 3月4日
TokenCom: Vision-Language Model for Multimodal and Multitask Token Communications
Arxiv
0+阅读 · 2月28日
NoLan: Mitigating Object Hallucinations in Large Vision-Language Models via Dynamic Suppression of Language Priors
Arxiv
0+阅读 · 2月25日
Inducing Dyslexia in Vision Language Models
Arxiv
0+阅读 · 2月26日
Continual Learning with Vision-Language Models via Semantic-Geometry Preservation
Arxiv
0+阅读 · 3月12日
WebAccessVL: Violation-Aware VLM for Web Accessibility
Arxiv
0+阅读 · 3月9日
FVG-PT: Adaptive Foreground View-Guided Prompt Tuning for Vision-Language Models
Arxiv
0+阅读 · 3月9日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top