成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
视觉感知
关注
2
综合
百科
VIP
热门
动态
论文
精华
Persistent Visual Memory: Sustaining Perception for Deep Generation in LVLMs
Arxiv
0+阅读 · 5月1日
VAUQ: Vision-Aware Uncertainty Quantification for LVLM Self-Evaluation
Arxiv
0+阅读 · 2月24日
ShadAR: LLM-driven shader generation to transform visual perception in Augmented Reality
Arxiv
0+阅读 · 2月19日
Visual Self-Refine: A Pixel-Guided Paradigm for Accurate Chart Parsing
Arxiv
0+阅读 · 2月18日
Agentic Jigsaw Interaction Learning for Enhancing Visual Perception and Reasoning in Vision-Language Models
Arxiv
0+阅读 · 2月11日
Agentic Jigsaw Interaction Learning for Enhancing Visual Perception and Reasoning in Vision-Language Models
Arxiv
0+阅读 · 2月10日
Attention to details, logits to truth: visual-aware attention and logits enhancement to mitigate hallucinations in LVLMs
Arxiv
0+阅读 · 2月10日
Simultaneous Tactile-Visual Perception for Learning Multimodal Robot Manipulation
Arxiv
0+阅读 · 2月9日
Focus-Scan-Refine: From Human Visual Perception to Efficient Visual Token Pruning
Arxiv
0+阅读 · 2月9日
AR as an Evaluation Playground: Bridging Metrics and Visual Perception of Computer Vision Models
Arxiv
0+阅读 · 2月6日
Uncertainty-Aware Counterfactual Traffic Signal Control with Predictive Safety and Starvation-Avoidance Constraints Using Vision-Based Sensing
Arxiv
0+阅读 · 2月8日
Focus-Scan-Refine: From Human Visual Perception to Efficient Visual Token Pruning
Arxiv
0+阅读 · 2月5日
Delving Deeper: Hierarchical Visual Perception for Robust Video-Text Retrieval
Arxiv
0+阅读 · 1月19日
MooneyMaker: A Python package to create ambiguous two-tone images
Arxiv
0+阅读 · 1月20日
Do VLMs Perceive or Recall? Probing Visual Perception vs. Memory with Classic Visual Illusions
Arxiv
0+阅读 · 1月29日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top