成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
多模态智能
关注
0
综合
百科
VIP
热门
动态
论文
精华
Think3D: Thinking with Space for Spatial Reasoning
Arxiv
0+阅读 · 2月4日
Making Videos Accessible for Blind and Low Vision Users Using a Multimodal Agent Video Player
Arxiv
0+阅读 · 2月4日
VisGym: Diverse, Customizable, Scalable Environments for Multimodal Agents
Arxiv
0+阅读 · 1月23日
FOCAL: A Novel Benchmarking Technique for Multi-modal Agents
Arxiv
0+阅读 · 1月12日
ChartAgent: A Multimodal Agent for Visually Grounded Reasoning in Complex Chart Question Answering
Arxiv
0+阅读 · 1月7日
See, Explain, and Intervene: A Few-Shot Multimodal Agent Framework for Hateful Meme Moderation
Arxiv
0+阅读 · 1月8日
ImAgent: A Unified Multimodal Agent Framework for Test-Time Scalable Image Generation
Arxiv
0+阅读 · 2025年11月14日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top