成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
多模态智能体
关注
6
综合
百科
VIP
热门
动态
论文
精华
See, Think, Act: Teaching Multimodal Agents to Effectively Interact with GUI by Identifying Toggles
Arxiv
0+阅读 · 3月18日
XSkill: Continual Learning from Experience and Skills in Multimodal Agents
Arxiv
0+阅读 · 3月12日
See, Think, Act: Teaching Multimodal Agents to Effectively Interact with GUI by Identifying Toggles
Arxiv
0+阅读 · 2月28日
See, Think, Act: Teaching Multimodal Agents to Effectively Interact with GUI by Identifying Toggles
Arxiv
0+阅读 · 3月3日
See, Think, Act: Teaching Multimodal Agents to Effectively Interact with GUI by Identifying Toggles
Arxiv
0+阅读 · 3月4日
Making Videos Accessible for Blind and Low Vision Users Using a Multimodal Agent Video Player
Arxiv
0+阅读 · 2月4日
FOCAL: A Novel Benchmarking Technique for Multi-modal Agents
Arxiv
0+阅读 · 1月12日
ImAgent: A Unified Multimodal Agent Framework for Test-Time Scalable Image Generation
Arxiv
0+阅读 · 2025年11月14日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top