【博士论文】面向城市环境的可解释计算机视觉 - 专知VIP

会员服务 ·

10

可解释计算机视觉 · 博士论文 ·

【博士论文】面向城市环境的可解释计算机视觉

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本学位论文研究了如何利用计算机视觉技术结合街景图像，对城市内部的社会经济视觉关系进行建模。其核心研究问题为：若要将基于计算机视觉的社会经济城市动态模型演进为鲁棒且可解释的系统，并由市政部门投入业务化运行以构建更公平的城市，必须解决哪些挑战？

首先，我们将现有的“感知型视觉城市分析（Perceptive Visual Urban Analytics）”范式与可解释性方法相结合，旨在探究街景图像中的视觉要素与房价之间的关联。随后，我们通过专家用户调研，对所生成解释的可解释性与可信度进行了评估。基于上述研究结果，本文进一步聚焦于识别街景场景中的“可行动要素（Actionable elements）”，即市政部门能够干预并改变的视觉要素。为此，我们开发了一种自监督训练方法用于检测城市变迁，并在城市尺度上实现了大规模的变化检测。

针对城市内部街景图像数据源是否存在偏倚的问题，本研究评估了全球街景数据库在城市范围内是否提供了均匀的覆盖。最后，通过分析典型的店面美学特征，我们探讨了单纯依靠视觉数据是否足以有效建模社会经济城市动态。研究结论表明，图像或元数据均无法独立完成精准建模，唯有将二者结合，才是刻画城市动态细微差异的关键。

成为VIP会员查看完整内容

15

相关内容

可解释计算机视觉

可解释计算机视觉

视觉识别中的可解释性综述

视觉识别中的可解释性综述

专知会员服务

23+阅读 · 2025年7月17日

面向复杂城市系统的物理引导人工智能综述

面向复杂城市系统的物理引导人工智能综述

专知会员服务

24+阅读 · 2025年6月18日

【博士论文】学习视觉-语言表示以实现多模态理解

【博士论文】学习视觉-语言表示以实现多模态理解

专知会员服务

28+阅读 · 2025年2月8日

【博士论文】解释大型视觉模型方面的进展

【博士论文】解释大型视觉模型方面的进展

专知会员服务

27+阅读 · 2025年2月7日

【牛津大学博士论文】多模态深度学习在计算机视觉及其应用，138页pdf

【牛津大学博士论文】多模态深度学习在计算机视觉及其应用，138页pdf

专知会员服务

64+阅读 · 2023年11月7日

【普林斯顿博士论文】解决缺陷数据来构建现实世界的计算机视觉系统，118页pdf

【普林斯顿博士论文】解决缺陷数据来构建现实世界的计算机视觉系统，118页pdf

专知会员服务

26+阅读 · 2023年3月13日

【博士论文】城市环境下的移动数据分析与行为建模研究

专知会员服务

53+阅读 · 2020年12月19日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知会员服务

149+阅读 · 2020年7月26日

【斯坦福大学】场景图谱表示在计算机视觉中的应用，41页ppt

【斯坦福大学】场景图谱表示在计算机视觉中的应用，41页ppt

专知会员服务

52+阅读 · 2020年1月8日

城市大脑与边缘计算，特邀嘉宾中国工程院院士高文，第八届全国社会媒体处理大会SMP2019

城市大脑与边缘计算，特邀嘉宾中国工程院院士高文，第八届全国社会媒体处理大会SMP2019

专知会员服务

57+阅读 · 2019年10月22日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

27+阅读 · 2020年7月26日

【资源】2019年计算机视觉综述论文汇聚

【资源】2019年计算机视觉综述论文汇聚

专知

36+阅读 · 2019年11月26日

计算机视觉方向简介 | 多视角立体视觉MVS

计算机视觉方向简介 | 多视角立体视觉MVS

计算机视觉life

15+阅读 · 2019年10月10日

本周精选共读论文《计算机视觉图像分割》六篇

本周精选共读论文《计算机视觉图像分割》六篇

人工智能前沿讲习班

10+阅读 · 2019年4月1日

【学科发展报告】智慧城市

【学科发展报告】智慧城市

中国自动化学会

10+阅读 · 2019年1月14日

【学科发展报告】计算机视觉

【学科发展报告】计算机视觉

中国自动化学会

43+阅读 · 2018年10月12日

【优青论文】视觉问答技术研究

【优青论文】视觉问答技术研究

计算机研究与发展

13+阅读 · 2018年9月21日

【综述】计算机视觉简介：历史、现状和发展趋势【可下载】

【综述】计算机视觉简介：历史、现状和发展趋势【可下载】

机器学习算法与Python学习

15+阅读 · 2018年9月21日

计算机视觉简介：历史、现状和发展趋势

计算机视觉简介：历史、现状和发展趋势

机器学习研究会

22+阅读 · 2017年11月21日

【观点】计算机视觉：历史、现状和发展趋势|胡占义研究员

【观点】计算机视觉：历史、现状和发展趋势|胡占义研究员

中国科学院自动化研究所

14+阅读 · 2017年11月21日

面向计算机视觉问题的图匹配算法研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

面向城市环境的车载机会网络关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于环境异质信息的机器觉察与仿生知觉方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

深度学习框架下基于情境线索的视觉注意研究

国家自然科学基金

2+阅读 · 2015年12月31日

移动与可穿戴计算中Eyes-Free交互界面研究

国家自然科学基金

0+阅读 · 2014年12月31日

多特征融合与集成学习的城市高分辨率遥感影像变化检测

国家自然科学基金

4+阅读 · 2014年12月31日

城市知识流的表征及其结构演化的复杂性研究

国家自然科学基金

0+阅读 · 2014年12月31日

城市群空间交互情景分析与多尺度协同模拟

国家自然科学基金

0+阅读 · 2014年12月31日

基于主题图的城市空间信息关联与知识整合研究

国家自然科学基金

3+阅读 · 2014年12月31日

策略性城市网络：形成、演化与城市经济增长

国家自然科学基金

1+阅读 · 2014年12月31日

Modeling Subjective Urban Perception with Human Gaze

Arxiv

0+阅读 · 5月1日

Autark: A Serverless Toolkit for Prototyping Urban Visual Analytics Systems

Arxiv

0+阅读 · 4月22日

UrbanClipAtlas: A Visual Analytics Framework for Event and Scene Retrieval in Urban Videos

Arxiv

0+阅读 · 4月16日

City-Scale Visibility Graph Analysis via GPU-Accelerated HyperBall

Arxiv

0+阅读 · 4月9日

A Unified Architecture for N-Dimensional Visualization and Simulation: 4D Implementation and Evaluation including Boolean Operations

Arxiv

0+阅读 · 4月4日

Steerable Visual Representations

Arxiv

0+阅读 · 4月2日

3DCity-LLM: Empowering Multi-modality Large Language Models for 3D City-scale Perception and Understanding

Arxiv

0+阅读 · 3月24日

Towards Urban General Intelligence: A Review and Outlook of Urban Foundation Models

Arxiv

0+阅读 · 3月22日

A visual introduction to information theory

Arxiv

0+阅读 · 3月6日

A Case Study in Responsible AI-Assisted Video Solutions: Multi-Metric Behavioral Insights in a Public Market Setting

Arxiv

0+阅读 · 3月4日

VIP会员

相关主题

可解释计算机视觉

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

2+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

2+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

3+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

3+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

3+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

3+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

4+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

21+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

视觉识别中的可解释性综述

视觉识别中的可解释性综述

专知会员服务

23+阅读 · 2025年7月17日

面向复杂城市系统的物理引导人工智能综述

面向复杂城市系统的物理引导人工智能综述

专知会员服务

24+阅读 · 2025年6月18日

【博士论文】学习视觉-语言表示以实现多模态理解

【博士论文】学习视觉-语言表示以实现多模态理解

专知会员服务

28+阅读 · 2025年2月8日

【博士论文】解释大型视觉模型方面的进展

【博士论文】解释大型视觉模型方面的进展

专知会员服务

27+阅读 · 2025年2月7日

【牛津大学博士论文】多模态深度学习在计算机视觉及其应用，138页pdf

【牛津大学博士论文】多模态深度学习在计算机视觉及其应用，138页pdf

专知会员服务

64+阅读 · 2023年11月7日

【普林斯顿博士论文】解决缺陷数据来构建现实世界的计算机视觉系统，118页pdf

【普林斯顿博士论文】解决缺陷数据来构建现实世界的计算机视觉系统，118页pdf

专知会员服务

26+阅读 · 2023年3月13日

【博士论文】城市环境下的移动数据分析与行为建模研究

专知会员服务

53+阅读 · 2020年12月19日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知会员服务

149+阅读 · 2020年7月26日

【斯坦福大学】场景图谱表示在计算机视觉中的应用，41页ppt

【斯坦福大学】场景图谱表示在计算机视觉中的应用，41页ppt

专知会员服务

52+阅读 · 2020年1月8日

城市大脑与边缘计算，特邀嘉宾中国工程院院士高文，第八届全国社会媒体处理大会SMP2019

城市大脑与边缘计算，特邀嘉宾中国工程院院士高文，第八届全国社会媒体处理大会SMP2019

专知会员服务

57+阅读 · 2019年10月22日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

27+阅读 · 2020年7月26日

【资源】2019年计算机视觉综述论文汇聚

【资源】2019年计算机视觉综述论文汇聚

专知

36+阅读 · 2019年11月26日

计算机视觉方向简介 | 多视角立体视觉MVS

计算机视觉方向简介 | 多视角立体视觉MVS

计算机视觉life

15+阅读 · 2019年10月10日

本周精选共读论文《计算机视觉图像分割》六篇

本周精选共读论文《计算机视觉图像分割》六篇

人工智能前沿讲习班

10+阅读 · 2019年4月1日

【学科发展报告】智慧城市

【学科发展报告】智慧城市

中国自动化学会

10+阅读 · 2019年1月14日

【学科发展报告】计算机视觉

【学科发展报告】计算机视觉

中国自动化学会

43+阅读 · 2018年10月12日

【优青论文】视觉问答技术研究

【优青论文】视觉问答技术研究

计算机研究与发展

13+阅读 · 2018年9月21日

【综述】计算机视觉简介：历史、现状和发展趋势【可下载】

【综述】计算机视觉简介：历史、现状和发展趋势【可下载】

机器学习算法与Python学习

15+阅读 · 2018年9月21日

计算机视觉简介：历史、现状和发展趋势

计算机视觉简介：历史、现状和发展趋势

机器学习研究会

22+阅读 · 2017年11月21日

【观点】计算机视觉：历史、现状和发展趋势|胡占义研究员

【观点】计算机视觉：历史、现状和发展趋势|胡占义研究员

中国科学院自动化研究所

14+阅读 · 2017年11月21日

相关基金

面向计算机视觉问题的图匹配算法研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

面向城市环境的车载机会网络关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于环境异质信息的机器觉察与仿生知觉方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

深度学习框架下基于情境线索的视觉注意研究

国家自然科学基金

2+阅读 · 2015年12月31日

移动与可穿戴计算中Eyes-Free交互界面研究

国家自然科学基金

0+阅读 · 2014年12月31日

多特征融合与集成学习的城市高分辨率遥感影像变化检测

国家自然科学基金

4+阅读 · 2014年12月31日

城市知识流的表征及其结构演化的复杂性研究

国家自然科学基金

0+阅读 · 2014年12月31日

城市群空间交互情景分析与多尺度协同模拟

国家自然科学基金

0+阅读 · 2014年12月31日

基于主题图的城市空间信息关联与知识整合研究

国家自然科学基金

3+阅读 · 2014年12月31日

策略性城市网络：形成、演化与城市经济增长

国家自然科学基金

1+阅读 · 2014年12月31日

相关论文

Modeling Subjective Urban Perception with Human Gaze

Arxiv

0+阅读 · 5月1日

Autark: A Serverless Toolkit for Prototyping Urban Visual Analytics Systems

Arxiv

0+阅读 · 4月22日

UrbanClipAtlas: A Visual Analytics Framework for Event and Scene Retrieval in Urban Videos

Arxiv

0+阅读 · 4月16日

City-Scale Visibility Graph Analysis via GPU-Accelerated HyperBall

Arxiv

0+阅读 · 4月9日

A Unified Architecture for N-Dimensional Visualization and Simulation: 4D Implementation and Evaluation including Boolean Operations

Arxiv

0+阅读 · 4月4日

Steerable Visual Representations

Arxiv

0+阅读 · 4月2日

3DCity-LLM: Empowering Multi-modality Large Language Models for 3D City-scale Perception and Understanding

Arxiv

0+阅读 · 3月24日

Towards Urban General Intelligence: A Review and Outlook of Urban Foundation Models

Arxiv

0+阅读 · 3月22日

A visual introduction to information theory

Arxiv

0+阅读 · 3月6日

A Case Study in Responsible AI-Assisted Video Solutions: Multi-Metric Behavioral Insights in a Public Market Setting

Arxiv

0+阅读 · 3月4日

微信扫码咨询专知VIP会员