【ICCV2025教程】《迈向视觉语言模型的全面推理》 - 专知VIP

会员服务 ·

11

ICCV 2025 · 视觉语言模型 · 图像描述 ·

2025 年 10 月 23 日

【ICCV2025教程】《迈向视觉语言模型的全面推理》

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

计算机视觉顶会ICCV 2025于10月19日至25日在美国夏威夷举行，今年论文投稿数11239篇，录用 2701篇，录用率为 24%，首次突破1w+的投稿量。Orals : 64篇（在总稿中占比0.6%，在录用稿中占比2.4%）、Highlights : 263篇、Posters 2374篇。

视觉语言模型（Vision-Language Models, VLMs）在图像描述（image captioning）和视觉问答（visual question answering）等任务中取得了显著进展，但如何发展出真正的推理能力仍然是一个尚未解决的开放性挑战。与近年来在推理导向的大语言模型（reasoning-focused LLMs）中取得的突破不同，许多现有的 VLM 仍主要依赖于模式识别，对组合逻辑（compositional logic）的处理能力不足。本教程将系统综述视觉语言模型的推理能力，重点探讨从基础感知到复杂推理的演化过程。内容涵盖多模态语境下的推理导向提示与训练方法、推理能力评估基准，以及视觉—文本融合的结构创新。通过讲座与实践演示相结合的形式，参与者将深入理解当前视觉语言模型的推理能力现状、在组合泛化与可解释性方面的持续挑战，并获得关于推理机制实现的实用指导。本教程的独特之处在于，它将大语言模型推理领域的最新进展延伸至视觉领域，聚焦空间信息处理的独特挑战，并为构建具备更高认知能力的视觉语言系统提供系统化的研究路线图。目录内容：

成为VIP会员查看完整内容

18

相关内容

ICCV 2025

【ACMMM2025教程】打击网络虚假信息视频：特征分析、检测与防范，170页ppt

【ACMMM2025教程】打击网络虚假信息视频：特征分析、检测与防范，170页ppt

专知会员服务

14+阅读 · 2025年11月1日

CVPR2025开会了！《视觉基础模型》最新进展教程

CVPR2025开会了！《视觉基础模型》最新进展教程

专知会员服务

23+阅读 · 2025年6月13日

【AAAI2024教程】多目标学习 - 基础与应用，197页ppt

【AAAI2024教程】多目标学习 - 基础与应用，197页ppt

专知会员服务

60+阅读 · 2024年3月2日

【AAAI2024教程】大模型知识编辑，192页ppt

【AAAI2024教程】大模型知识编辑，192页ppt

专知会员服务

84+阅读 · 2024年2月29日

【AAAI2024教程】图反事实可解释性：全面的景观，100页ppt

【AAAI2024教程】图反事实可解释性：全面的景观，100页ppt

专知会员服务

33+阅读 · 2024年2月28日

【AAAI2024教程】神经网络鲁棒性的形式化：可解释性、不确定性和可干预性

【AAAI2024教程】神经网络鲁棒性的形式化：可解释性、不确定性和可干预性

专知会员服务

54+阅读 · 2024年2月25日

【AAAI2024教程】语言模型遇见世界模型（及智能体模型），187页ppt

【AAAI2024教程】语言模型遇见世界模型（及智能体模型），187页ppt

专知会员服务

95+阅读 · 2024年2月21日

Transformer最新研究有哪些？AAAI2023最新《Transformer:架构、优化、应用和解释》教程，附Slides

Transformer最新研究有哪些？AAAI2023最新《Transformer:架构、优化、应用和解释》教程，附Slides

专知会员服务

82+阅读 · 2023年2月15日

【AAAI2023教程】大规模深度学习优化技术，109页ppt

【AAAI2023教程】大规模深度学习优化技术，109页ppt

专知会员服务

63+阅读 · 2023年2月10日

AAAI2023开会了！UIUC等《知识驱动视觉语言预训练》教程，200+Slides全面阐述多模态知识预训练技术

AAAI2023开会了！UIUC等《知识驱动视觉语言预训练》教程，200+Slides全面阐述多模态知识预训练技术

专知会员服务

61+阅读 · 2023年2月9日

硬核课程全网首发！高级人工智能：多模态大模型LLM与AIGC前沿技术实战

硬核课程全网首发！高级人工智能：多模态大模型LLM与AIGC前沿技术实战

PaperWeekly

19+阅读 · 2023年4月13日

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

专知

45+阅读 · 2020年12月9日

知识图谱表示学习@ACL2020最新进展概述,9篇必看论文!

知识图谱表示学习@ACL2020最新进展概述,9篇必看论文!

专知

34+阅读 · 2020年7月12日

贝叶斯与深度学习如何结合？看这份《贝叶斯深度学习: DL与Bayesian原理》NeurIPS2019硬核教程

贝叶斯与深度学习如何结合？看这份《贝叶斯深度学习: DL与Bayesian原理》NeurIPS2019硬核教程

专知

53+阅读 · 2019年12月22日

【CVPR2019最新图结构教程】基于图结构网络的表征学习（附下载）

【CVPR2019最新图结构教程】基于图结构网络的表征学习（附下载）

专知

38+阅读 · 2019年6月18日

论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法

论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法

开放知识图谱

30+阅读 · 2019年3月26日

AAAI2019教程抢先看！《深度贝叶斯与序列学习》，279页PPT带你知晓深度贝叶斯序列模型在NLP最新进展

AAAI2019教程抢先看！《深度贝叶斯与序列学习》，279页PPT带你知晓深度贝叶斯序列模型在NLP最新进展

专知

28+阅读 · 2019年1月27日

【ECCV2018教程】220页深度神经网络训练归一化: 数学基础与理论、挑战(附pdf下载)

【ECCV2018教程】220页深度神经网络训练归一化: 数学基础与理论、挑战(附pdf下载)

专知

10+阅读 · 2018年9月8日

【伯克利大学ICML2018强化学习80页教程】【附下载】

【伯克利大学ICML2018强化学习80页教程】【附下载】

专知

10+阅读 · 2018年7月21日

课程 | 从零开始精通深度学习

课程 | 从零开始精通深度学习

机器之心

10+阅读 · 2017年10月24日

时滞微分差分系统的最小周期问题--天元数学交流项目

国家自然科学基金

0+阅读 · 2017年12月31日

天元数学东北地区青年教师培训项目

国家自然科学基金

2+阅读 · 2016年12月31日

第九届海峡两岸图论与组合学研讨会

国家自然科学基金

1+阅读 · 2016年12月31日

拓扑非线性分析专题讲习班

国家自然科学基金

15+阅读 · 2016年12月31日

第七届全国数学文化论坛

国家自然科学基金

3+阅读 · 2016年12月31日

中国数学会2015学术年会暨中国数学会成立八十周年纪念会

国家自然科学基金

0+阅读 · 2015年4月20日

面向复杂情报的大数据分析方法与决策支持

国家自然科学基金

44+阅读 · 2014年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

基于模型驱动的并发建模语言Apla+设计及其可靠性研究

国家自然科学基金

3+阅读 · 2014年12月31日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

501+阅读 · 2023年3月31日

Vision-Language Pre-training: Basics, Recent Advances, and Future Trends

Arxiv

28+阅读 · 2022年10月17日

Deep Meta-learning in Recommendation Systems: A Survey

Arxiv

13+阅读 · 2022年6月9日

Forecasting: theory and practice

Arxiv

57+阅读 · 2022年1月5日

Improving evidential deep learning via multi-task learning

Arxiv

11+阅读 · 2021年12月17日

ResMLP: Feedforward networks for image classification with data-efficient training

Arxiv

12+阅读 · 2021年5月7日

Contrastive Clustering

Arxiv

31+阅读 · 2020年9月21日

Augmentation for small object detection

Augmentation for small object detection

Arxiv

13+阅读 · 2019年2月19日

Self-Attention with Relative Position Representations

Arxiv

27+阅读 · 2018年4月12日

Matching Networks for One Shot Learning

Arxiv

10+阅读 · 2017年12月29日

VIP会员

相关主题

视觉语言模型

最新内容

《反无人机蜂群：有人-无人协同防御场景下的编队重构分析》

《反无人机蜂群：有人-无人协同防御场景下的编队重构分析》

专知会员服务

6+阅读 · 7月24日

《史诗怒火/咆哮雄狮行动：针对伊朗空中战役的战略分析》68页智库报告

《史诗怒火/咆哮雄狮行动：针对伊朗空中战役的战略分析》68页智库报告

专知会员服务

4+阅读 · 7月24日

“愈演愈烈的欺骗与干扰博弈”：无人机与人工智能背景下俄乌强化以无人机为核心的电子战

“愈演愈烈的欺骗与干扰博弈”：无人机与人工智能背景下俄乌强化以无人机为核心的电子战

专知会员服务

3+阅读 · 7月24日

乌克兰纵深打击如何重塑俄罗斯的战略选择

乌克兰纵深打击如何重塑俄罗斯的战略选择

专知会员服务

2+阅读 · 7月24日

《分布式太空任务对比分析与综合建模及仿真环境》120页

《分布式太空任务对比分析与综合建模及仿真环境》120页

专知会员服务

2+阅读 · 7月24日

俄乌战争中关于中程打击无人机部署的经验启示

俄乌战争中关于中程打击无人机部署的经验启示

专知会员服务

1+阅读 · 7月24日

《远程自主系统可扩展态势感知的解决方案》32页2026最新报告

《远程自主系统可扩展态势感知的解决方案》32页2026最新报告

专知会员服务

5+阅读 · 7月23日

《基于强化学习的自动化红队测试》

《基于强化学习的自动化红队测试》

专知会员服务

4+阅读 · 7月23日

《下一代无人机-卫星通信：人工智能创新与未来展望》32页长综述

《下一代无人机-卫星通信：人工智能创新与未来展望》32页长综述

专知会员服务

6+阅读 · 7月23日

“天降毒雾”：无人机如何使化学战重返乌克兰战场

“天降毒雾”：无人机如何使化学战重返乌克兰战场

专知会员服务

2+阅读 · 7月23日

伊朗不对称防空战略的演进

伊朗不对称防空战略的演进

专知会员服务

4+阅读 · 7月23日

对抗环境下超视距目标打击的情报支援

对抗环境下超视距目标打击的情报支援

专知会员服务

10+阅读 · 7月22日

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

专知会员服务

4+阅读 · 7月22日

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

专知会员服务

8+阅读 · 7月22日

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

专知会员服务

11+阅读 · 7月22日

相关VIP内容

【ACMMM2025教程】打击网络虚假信息视频：特征分析、检测与防范，170页ppt

【ACMMM2025教程】打击网络虚假信息视频：特征分析、检测与防范，170页ppt

专知会员服务

14+阅读 · 2025年11月1日

CVPR2025开会了！《视觉基础模型》最新进展教程

CVPR2025开会了！《视觉基础模型》最新进展教程

专知会员服务

23+阅读 · 2025年6月13日

【AAAI2024教程】多目标学习 - 基础与应用，197页ppt

【AAAI2024教程】多目标学习 - 基础与应用，197页ppt

专知会员服务

60+阅读 · 2024年3月2日

【AAAI2024教程】大模型知识编辑，192页ppt

【AAAI2024教程】大模型知识编辑，192页ppt

专知会员服务

84+阅读 · 2024年2月29日

【AAAI2024教程】图反事实可解释性：全面的景观，100页ppt

【AAAI2024教程】图反事实可解释性：全面的景观，100页ppt

专知会员服务

33+阅读 · 2024年2月28日

【AAAI2024教程】神经网络鲁棒性的形式化：可解释性、不确定性和可干预性

【AAAI2024教程】神经网络鲁棒性的形式化：可解释性、不确定性和可干预性

专知会员服务

54+阅读 · 2024年2月25日

【AAAI2024教程】语言模型遇见世界模型（及智能体模型），187页ppt

【AAAI2024教程】语言模型遇见世界模型（及智能体模型），187页ppt

专知会员服务

95+阅读 · 2024年2月21日

Transformer最新研究有哪些？AAAI2023最新《Transformer:架构、优化、应用和解释》教程，附Slides

Transformer最新研究有哪些？AAAI2023最新《Transformer:架构、优化、应用和解释》教程，附Slides

专知会员服务

82+阅读 · 2023年2月15日

【AAAI2023教程】大规模深度学习优化技术，109页ppt

【AAAI2023教程】大规模深度学习优化技术，109页ppt

专知会员服务

63+阅读 · 2023年2月10日

AAAI2023开会了！UIUC等《知识驱动视觉语言预训练》教程，200+Slides全面阐述多模态知识预训练技术

AAAI2023开会了！UIUC等《知识驱动视觉语言预训练》教程，200+Slides全面阐述多模态知识预训练技术

专知会员服务

61+阅读 · 2023年2月9日

热门VIP内容

开通专知VIP会员享更多权益服务

《史诗怒火/咆哮雄狮行动：针对伊朗空中战役的战略分析》68页智库报告

乌克兰纵深打击如何重塑俄罗斯的战略选择

《反无人机蜂群：有人-无人协同防御场景下的编队重构分析》

“愈演愈烈的欺骗与干扰博弈”：无人机与人工智能背景下俄乌强化以无人机为核心的电子战

相关资讯

硬核课程全网首发！高级人工智能：多模态大模型LLM与AIGC前沿技术实战

硬核课程全网首发！高级人工智能：多模态大模型LLM与AIGC前沿技术实战

PaperWeekly

19+阅读 · 2023年4月13日

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

专知

45+阅读 · 2020年12月9日

知识图谱表示学习@ACL2020最新进展概述,9篇必看论文!

知识图谱表示学习@ACL2020最新进展概述,9篇必看论文!

专知

34+阅读 · 2020年7月12日

贝叶斯与深度学习如何结合？看这份《贝叶斯深度学习: DL与Bayesian原理》NeurIPS2019硬核教程

贝叶斯与深度学习如何结合？看这份《贝叶斯深度学习: DL与Bayesian原理》NeurIPS2019硬核教程

专知

53+阅读 · 2019年12月22日

【CVPR2019最新图结构教程】基于图结构网络的表征学习（附下载）

【CVPR2019最新图结构教程】基于图结构网络的表征学习（附下载）

专知

38+阅读 · 2019年6月18日

论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法

论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法

开放知识图谱

30+阅读 · 2019年3月26日

AAAI2019教程抢先看！《深度贝叶斯与序列学习》，279页PPT带你知晓深度贝叶斯序列模型在NLP最新进展

AAAI2019教程抢先看！《深度贝叶斯与序列学习》，279页PPT带你知晓深度贝叶斯序列模型在NLP最新进展

专知

28+阅读 · 2019年1月27日

【ECCV2018教程】220页深度神经网络训练归一化: 数学基础与理论、挑战(附pdf下载)

【ECCV2018教程】220页深度神经网络训练归一化: 数学基础与理论、挑战(附pdf下载)

专知

10+阅读 · 2018年9月8日

【伯克利大学ICML2018强化学习80页教程】【附下载】

【伯克利大学ICML2018强化学习80页教程】【附下载】

专知

10+阅读 · 2018年7月21日

课程 | 从零开始精通深度学习

课程 | 从零开始精通深度学习

机器之心

10+阅读 · 2017年10月24日

相关基金

时滞微分差分系统的最小周期问题--天元数学交流项目

国家自然科学基金

0+阅读 · 2017年12月31日

天元数学东北地区青年教师培训项目

国家自然科学基金

2+阅读 · 2016年12月31日

第九届海峡两岸图论与组合学研讨会

国家自然科学基金

1+阅读 · 2016年12月31日

拓扑非线性分析专题讲习班

国家自然科学基金

15+阅读 · 2016年12月31日

第七届全国数学文化论坛

国家自然科学基金

3+阅读 · 2016年12月31日

中国数学会2015学术年会暨中国数学会成立八十周年纪念会

国家自然科学基金

0+阅读 · 2015年4月20日

面向复杂情报的大数据分析方法与决策支持

国家自然科学基金

44+阅读 · 2014年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

基于模型驱动的并发建模语言Apla+设计及其可靠性研究

国家自然科学基金

3+阅读 · 2014年12月31日

相关论文

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

501+阅读 · 2023年3月31日

Vision-Language Pre-training: Basics, Recent Advances, and Future Trends

Arxiv

28+阅读 · 2022年10月17日

Deep Meta-learning in Recommendation Systems: A Survey

Arxiv

13+阅读 · 2022年6月9日

Forecasting: theory and practice

Arxiv

57+阅读 · 2022年1月5日

Improving evidential deep learning via multi-task learning

Arxiv

11+阅读 · 2021年12月17日

ResMLP: Feedforward networks for image classification with data-efficient training

Arxiv

12+阅读 · 2021年5月7日

Contrastive Clustering

Arxiv

31+阅读 · 2020年9月21日

Augmentation for small object detection

Augmentation for small object detection

Arxiv

13+阅读 · 2019年2月19日

Self-Attention with Relative Position Representations

Arxiv

27+阅读 · 2018年4月12日

Matching Networks for One Shot Learning

Arxiv

10+阅读 · 2017年12月29日

微信扫码咨询专知VIP会员