Modeling Subjective Urban Perception with Human Gaze - 专知论文

会员服务 ·

0

城市感知 · 数据集 · 感知建模 · 融合 · 评价 ·

Modeling Subjective Urban Perception with Human Gaze

翻译：基于人类目光的城市主观感知建模

Lin Che,Xi Wang,Marc Pollefeys,Konrad Schindler,Martin Raubal,Peter Kiefer

Urban perception describes how people subjectively evaluate urban environments, shaping how cities are experienced and understood. Existing computational approaches primarily model urban perception directly from street view images, but largely ignore the human perceptual process through which such judgments are formed. In this paper, we introduce Place Pulse-Gaze, an urban perception dataset that augments street view images with synchronized eye-tracking recordings and individual perception labels. Based on this dataset, we propose a Gaze-Guided Urban Perception Framework to study how gaze behavior contributes to the modeling of subjective urban perception. The framework systematically investigates three complementary settings: gaze-only modeling, gaze fusion with explicit semantic scene representations, and gaze fusion with implicit richer visual representations. Experiments show that gaze alone already carries useful predictive signals for subjective urban perception, and that integrating gaze with scene representations further improves prediction under both semantic and richer visual representations. Overall, our findings highlight the importance of incorporating human perceptual processes into urban scene understanding and open a direction for gaze-guided multimodal urban computing.

翻译：城市感知描述了人们如何主观评价城市环境，塑造了人们对城市的体验与理解。现有计算方法主要从街景图像直接建模城市感知，却基本忽略了形成这类判断的人类感知过程。本文提出Place Pulse-Gaze数据集，该数据集通过同步的眼动追踪记录与个体感知标签对街景图像进行增强。基于该数据集，我们提出目光引导的城市感知框架，研究目光行为如何促进主观城市感知的建模。该框架系统性地探索三种互补设置：纯目光建模、目光与显式语义场景表征融合、目光与隐式丰富视觉表征融合。实验表明，仅凭目光已包含主观城市感知的有效预测信号，且将目光与场景表征结合可进一步改善语义及丰富视觉表征下的预测性能。总体而言，我们的研究结果凸显了将人类感知过程纳入城市场景理解的重要性，并为目光引导的多模态城市计算开辟了新方向。

0

相关内容

城市感知

【博士论文】面向城市环境的可解释计算机视觉

【博士论文】面向城市环境的可解释计算机视觉

专知会员服务

16+阅读 · 4月18日

《基于人工智能与多模态系统的态势感知：架构、挑战与应用》最新41页综述

《基于人工智能与多模态系统的态势感知：架构、挑战与应用》最新41页综述

专知会员服务

61+阅读 · 2025年7月23日

AI CITY发展研究报告：“人工智能+”时代的智慧城市发展范式创新（2025年）

AI CITY发展研究报告：“人工智能+”时代的智慧城市发展范式创新（2025年）

专知会员服务

20+阅读 · 2025年6月27日

面向复杂城市系统的物理引导人工智能综述

面向复杂城市系统的物理引导人工智能综述

专知会员服务

25+阅读 · 2025年6月18日

城市大数据认知计算研究与应用进展

城市大数据认知计算研究与应用进展

专知会员服务

29+阅读 · 2024年7月18日

华为发布《城市感知体系白皮书》：总结智慧灯杆等十大典型应用（附下载）

华为发布《城市感知体系白皮书》：总结智慧灯杆等十大典型应用（附下载）

专知会员服务

29+阅读 · 2022年11月28日

城市大脑知识图谱构建及应用研究

城市大脑知识图谱构建及应用研究

专知会员服务

75+阅读 · 2022年6月28日

《智慧城市知识图谱模型与本体构建方法》拓尔思知识图谱研究院等

《智慧城市知识图谱模型与本体构建方法》拓尔思知识图谱研究院等

专知会员服务

50+阅读 · 2022年3月27日

【博士论文】城市环境下的移动数据分析与行为建模研究

专知会员服务

53+阅读 · 2020年12月19日

城市大脑与边缘计算，特邀嘉宾中国工程院院士高文，第八届全国社会媒体处理大会SMP2019

城市大脑与边缘计算，特邀嘉宾中国工程院院士高文，第八届全国社会媒体处理大会SMP2019

专知会员服务

57+阅读 · 2019年10月22日

数据驱动的态势认知技术及发展思考

数据驱动的态势认知技术及发展思考

专知

19+阅读 · 2022年7月12日

最新！《智慧城市人工智能技术应用场景》国家标准意见稿发布，24页pdf

最新！《智慧城市人工智能技术应用场景》国家标准意见稿发布，24页pdf

专知

17+阅读 · 2022年3月19日

3D Human相关研究总结：人体、姿态估计、人体重建等

3D Human相关研究总结：人体、姿态估计、人体重建等

PaperWeekly

27+阅读 · 2021年3月1日

DARPA的“疯狂”概念，就要实现！美国无人集群城市作战应用发展综述

DARPA的“疯狂”概念，就要实现！美国无人集群城市作战应用发展综述

THU数据派

38+阅读 · 2020年10月1日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

27+阅读 · 2020年7月26日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

【学科发展报告】智慧城市

【学科发展报告】智慧城市

中国自动化学会

10+阅读 · 2019年1月14日

具身认知学习环境设计：特征、要素、应用及发展趋势

具身认知学习环境设计：特征、要素、应用及发展趋势

MOOC

10+阅读 · 2018年10月30日

交互设计理论：视觉感知、认知摩擦、认知负荷和情境认知

交互设计理论：视觉感知、认知摩擦、认知负荷和情境认知

人人都是产品经理

20+阅读 · 2018年5月10日

报名 | 让机器读懂你的意图——人体姿态估计入门

报名 | 让机器读懂你的意图——人体姿态估计入门

人工智能头条

10+阅读 · 2017年9月19日

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

新媒体语境下旅游形象量化投射模型构建与评估研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于语义网络的街区场景相似性研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于人类视觉仿生的高分辨率遥感影像建筑物提取方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

多特征融合与集成学习的城市高分辨率遥感影像变化检测

国家自然科学基金

4+阅读 · 2014年12月31日

基于视觉注意与眼动跟踪的地图认知计算模型与方法研究

国家自然科学基金

6+阅读 · 2014年12月31日

不同人为热环境下城市景观格局气温调节功能的动态研究

国家自然科学基金

0+阅读 · 2014年12月31日

城市群空间交互情景分析与多尺度协同模拟

国家自然科学基金

0+阅读 · 2014年12月31日

城市建筑群空间分布模式的识别方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于主题图的城市空间信息关联与知识整合研究

国家自然科学基金

3+阅读 · 2014年12月31日

Urban-ImageNet: A Large-Scale Multi-Modal Dataset and Evaluation Framework for Urban Space Perception

Arxiv

0+阅读 · 5月11日

UIGaze: How Closely Can VLMs Approximate Human Visual Attention on User Interfaces?

Arxiv

0+阅读 · 4月29日

Seeing Without Eyes: 4D Human-Scene Understanding from Wearable IMUs

Arxiv

0+阅读 · 4月23日

Empowering NPC Dialogue with Environmental Context Using LLMs and Panoramic Images

Arxiv

0+阅读 · 4月23日

Empowering NPC Dialogue with Environmental Context Using LLMs and Panoramic Images

Arxiv

0+阅读 · 4月21日

UrbanClipAtlas: A Visual Analytics Framework for Event and Scene Retrieval in Urban Videos

Arxiv

0+阅读 · 4月16日

Conditional Distribution Estimation of Building Characteristics with Diffusion Models for Urban Energy Modeling

Arxiv

0+阅读 · 4月2日

Vision-Language Models vs Human: Perceptual Image Quality Assessment

Arxiv

0+阅读 · 3月25日

The People's Gaze: Co-Designing and Refining Gaze Gestures with General Users and Gaze Interaction Experts

Arxiv

0+阅读 · 3月24日

GraphiContact: Pose-aware Human-Scene Robust Contact Perception for Interactive Systems

Arxiv

0+阅读 · 3月19日

VIP会员

文章信息

相关主题

最新内容

无人机自主控制与人工智能：系统性综述

无人机自主控制与人工智能：系统性综述

专知会员服务

5+阅读 · 今天7:25

巡飞弹与反无人机系统——现代战场的两大支柱

巡飞弹与反无人机系统——现代战场的两大支柱

专知会员服务

2+阅读 · 今天6:54

《打造“黄金舰队”》57页报告

《打造“黄金舰队”》57页报告

专知会员服务

1+阅读 · 今天6:52

《北约数字教官网络发展路径》128页报告

《北约数字教官网络发展路径》128页报告

专知会员服务

1+阅读 · 今天6:33

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

6+阅读 · 6月25日

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

5+阅读 · 6月25日

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

8+阅读 · 6月25日

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

7+阅读 · 6月25日

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

8+阅读 · 6月25日

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

8+阅读 · 6月25日

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

9+阅读 · 6月25日

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

9+阅读 · 6月25日

《国防领域敏感性分析白皮书》

《国防领域敏感性分析白皮书》

专知会员服务

9+阅读 · 6月25日

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

9+阅读 · 6月24日

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

10+阅读 · 6月24日

相关VIP内容

【博士论文】面向城市环境的可解释计算机视觉

【博士论文】面向城市环境的可解释计算机视觉

专知会员服务

16+阅读 · 4月18日

《基于人工智能与多模态系统的态势感知：架构、挑战与应用》最新41页综述

《基于人工智能与多模态系统的态势感知：架构、挑战与应用》最新41页综述

专知会员服务

61+阅读 · 2025年7月23日

AI CITY发展研究报告：“人工智能+”时代的智慧城市发展范式创新（2025年）

AI CITY发展研究报告：“人工智能+”时代的智慧城市发展范式创新（2025年）

专知会员服务

20+阅读 · 2025年6月27日

面向复杂城市系统的物理引导人工智能综述

面向复杂城市系统的物理引导人工智能综述

专知会员服务

25+阅读 · 2025年6月18日

城市大数据认知计算研究与应用进展

城市大数据认知计算研究与应用进展

专知会员服务

29+阅读 · 2024年7月18日

华为发布《城市感知体系白皮书》：总结智慧灯杆等十大典型应用（附下载）

华为发布《城市感知体系白皮书》：总结智慧灯杆等十大典型应用（附下载）

专知会员服务

29+阅读 · 2022年11月28日

城市大脑知识图谱构建及应用研究

城市大脑知识图谱构建及应用研究

专知会员服务

75+阅读 · 2022年6月28日

《智慧城市知识图谱模型与本体构建方法》拓尔思知识图谱研究院等

《智慧城市知识图谱模型与本体构建方法》拓尔思知识图谱研究院等

专知会员服务

50+阅读 · 2022年3月27日

【博士论文】城市环境下的移动数据分析与行为建模研究

专知会员服务

53+阅读 · 2020年12月19日

城市大脑与边缘计算，特邀嘉宾中国工程院院士高文，第八届全国社会媒体处理大会SMP2019

城市大脑与边缘计算，特邀嘉宾中国工程院院士高文，第八届全国社会媒体处理大会SMP2019

专知会员服务

57+阅读 · 2019年10月22日

热门VIP内容

开通专知VIP会员享更多权益服务

巡飞弹与反无人机系统——现代战场的两大支柱

《北约数字教官网络发展路径》128页报告

无人机自主控制与人工智能：系统性综述

《打造“黄金舰队”》57页报告

相关资讯

数据驱动的态势认知技术及发展思考

数据驱动的态势认知技术及发展思考

专知

19+阅读 · 2022年7月12日

最新！《智慧城市人工智能技术应用场景》国家标准意见稿发布，24页pdf

最新！《智慧城市人工智能技术应用场景》国家标准意见稿发布，24页pdf

专知

17+阅读 · 2022年3月19日

3D Human相关研究总结：人体、姿态估计、人体重建等

3D Human相关研究总结：人体、姿态估计、人体重建等

PaperWeekly

27+阅读 · 2021年3月1日

DARPA的“疯狂”概念，就要实现！美国无人集群城市作战应用发展综述

DARPA的“疯狂”概念，就要实现！美国无人集群城市作战应用发展综述

THU数据派

38+阅读 · 2020年10月1日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

27+阅读 · 2020年7月26日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

【学科发展报告】智慧城市

【学科发展报告】智慧城市

中国自动化学会

10+阅读 · 2019年1月14日

具身认知学习环境设计：特征、要素、应用及发展趋势

具身认知学习环境设计：特征、要素、应用及发展趋势

MOOC

10+阅读 · 2018年10月30日

交互设计理论：视觉感知、认知摩擦、认知负荷和情境认知

交互设计理论：视觉感知、认知摩擦、认知负荷和情境认知

人人都是产品经理

20+阅读 · 2018年5月10日

报名 | 让机器读懂你的意图——人体姿态估计入门

报名 | 让机器读懂你的意图——人体姿态估计入门

人工智能头条

10+阅读 · 2017年9月19日

相关论文

Urban-ImageNet: A Large-Scale Multi-Modal Dataset and Evaluation Framework for Urban Space Perception

Arxiv

0+阅读 · 5月11日

UIGaze: How Closely Can VLMs Approximate Human Visual Attention on User Interfaces?

Arxiv

0+阅读 · 4月29日

Seeing Without Eyes: 4D Human-Scene Understanding from Wearable IMUs

Arxiv

0+阅读 · 4月23日

Empowering NPC Dialogue with Environmental Context Using LLMs and Panoramic Images

Arxiv

0+阅读 · 4月23日

Empowering NPC Dialogue with Environmental Context Using LLMs and Panoramic Images

Arxiv

0+阅读 · 4月21日

UrbanClipAtlas: A Visual Analytics Framework for Event and Scene Retrieval in Urban Videos

Arxiv

0+阅读 · 4月16日

Conditional Distribution Estimation of Building Characteristics with Diffusion Models for Urban Energy Modeling

Arxiv

0+阅读 · 4月2日

Vision-Language Models vs Human: Perceptual Image Quality Assessment

Arxiv

0+阅读 · 3月25日

The People's Gaze: Co-Designing and Refining Gaze Gestures with General Users and Gaze Interaction Experts

Arxiv

0+阅读 · 3月24日

GraphiContact: Pose-aware Human-Scene Robust Contact Perception for Interactive Systems

Arxiv

0+阅读 · 3月19日

相关基金

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

新媒体语境下旅游形象量化投射模型构建与评估研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于语义网络的街区场景相似性研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于人类视觉仿生的高分辨率遥感影像建筑物提取方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

多特征融合与集成学习的城市高分辨率遥感影像变化检测

国家自然科学基金

4+阅读 · 2014年12月31日

基于视觉注意与眼动跟踪的地图认知计算模型与方法研究

国家自然科学基金

6+阅读 · 2014年12月31日

不同人为热环境下城市景观格局气温调节功能的动态研究

国家自然科学基金

0+阅读 · 2014年12月31日

城市群空间交互情景分析与多尺度协同模拟

国家自然科学基金

0+阅读 · 2014年12月31日

城市建筑群空间分布模式的识别方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于主题图的城市空间信息关联与知识整合研究

国家自然科学基金

3+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员