Visibility analysis is one of the fundamental analytics methods in urban planning and landscape research, traditionally conducted through computational simulations based on the Line-of-Sight (LoS) principle. However, when assessing the visibility of named urban objects such as landmarks, geometric intersection alone fails to capture the contextual and perceptual dimensions of visibility as experienced in the real world. The study challenges the traditional LoS-based approaches by introducing a new, image-based visibility analysis method. Specifically, a Vision Language Model (VLM) is applied to detect the target object within a direction-zoomed Street View Image (SVI). Successful detection represents the object's visibility at the corresponding SVI location. Further, a heterogeneous visibility graph is constructed to address the complex interaction between observers and target objects. In the first case study, the method proves its reliability in detecting the visibility of six tall landmark constructions in global cities, with an overall accuracy of 87%. Furthermore, it reveals broader contextual differences when the landmarks are perceived and experienced. In the second case, the proposed visibility graph uncovers the form and strength of connections for multiple landmarks along the River Thames in London, as well as the places where these connections occur. Notably, bridges on the River Thames account for approximately 30% of total connections. Our method complements and enhances traditional LoS-based visibility analysis, and showcases the possibility of revealing the prevalent connection of any visual objects in the urban environment. It opens up new research perspectives for urban planning, heritage conservation, and computational social science.


翻译:可视性分析是城市规划和景观研究中的基本分析方法之一,传统上基于视线原理通过计算模拟进行。然而,在评估地标等具名城市物体的可视性时,仅依靠几何相交无法捕捉现实世界中体验到的可视性的语境与感知维度。本研究通过引入一种新型的基于图像的可视性分析方法,对传统基于视线的方法提出了挑战。具体而言,我们应用视觉语言模型在方向放大的街景图像中检测目标物体。成功检测即代表该物体在相应街景位置的可视性。进一步地,我们构建了一个异质可视性图以处理观察者与目标物体之间的复杂交互。在第一个案例研究中,该方法在检测全球城市六座高层地标建筑的可视性方面证明了其可靠性,总体准确率达到87%。此外,该方法还揭示了这些地标在被感知和体验时更广泛的语境差异。在第二个案例中,所提出的可视性图揭示了伦敦泰晤士河沿岸多个地标连接的形式与强度,以及这些连接发生的位置。值得注意的是,泰晤士河上的桥梁约占总连接数的30%。我们的方法补充并增强了传统基于视线的可视性分析,展示了揭示城市环境中任意视觉物体普遍连接的可能性,为城市规划、遗产保护和计算社会科学开辟了新的研究视角。

0
下载
关闭预览

相关内容

视觉识别中的可解释性综述
专知会员服务
23+阅读 · 2025年7月17日
视觉语言建模遇见遥感:模型、数据集与前景展望
专知会员服务
17+阅读 · 2025年5月21日
《遥感时序视觉语言模型》全面综述
专知会员服务
30+阅读 · 2024年12月4日
时间序列复杂网络分析中的可视图方法研究综述
专知会员服务
31+阅读 · 2024年3月9日
【博士论文】结构化数据自动可视化关键技术研究
专知会员服务
47+阅读 · 2023年12月6日
《军事场景中的视觉分析探索》2023最新124页技术报告
专知会员服务
82+阅读 · 2023年3月2日
基于关系网络的视觉建模:有望替代卷积神经网络
微软研究院AI头条
10+阅读 · 2019年7月12日
【学科发展报告】智慧城市
中国自动化学会
10+阅读 · 2019年1月14日
交互设计理论:视觉感知、认知摩擦、认知负荷和情境认知
人人都是产品经理
20+阅读 · 2018年5月10日
【深度】Deep Visualization:可视化并理解CNN
专知
12+阅读 · 2017年9月30日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关VIP内容
视觉识别中的可解释性综述
专知会员服务
23+阅读 · 2025年7月17日
视觉语言建模遇见遥感:模型、数据集与前景展望
专知会员服务
17+阅读 · 2025年5月21日
《遥感时序视觉语言模型》全面综述
专知会员服务
30+阅读 · 2024年12月4日
时间序列复杂网络分析中的可视图方法研究综述
专知会员服务
31+阅读 · 2024年3月9日
【博士论文】结构化数据自动可视化关键技术研究
专知会员服务
47+阅读 · 2023年12月6日
《军事场景中的视觉分析探索》2023最新124页技术报告
专知会员服务
82+阅读 · 2023年3月2日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员