HeatPrompt: Zero-Shot Vision-Language Modeling of Urban Heat Demand from Satellite Images - 专知论文

会员服务 ·

0

样本 · 零样本 · 需求建模 · 提取 · Prompt ·

HeatPrompt: Zero-Shot Vision-Language Modeling of Urban Heat Demand from Satellite Images

翻译：HeatPrompt：基于卫星图像的零样本视觉语言城市热需求建模

Kundan Thota,Xuanhao Mu,Thorsten Schlachter,Veit Hagenmeyer

Accurate heat-demand maps play a crucial role in decarbonizing space heating, yet most municipalities lack detailed building-level data needed to calculate them. We introduce HeatPrompt, a zero-shot vision-language energy modeling framework that estimates annual heat demand using semantic features extracted from satellite images, basic Geographic Information System (GIS), and building-level features. We feed pretrained Large Vision Language Models (VLMs) with a domain-specific prompt to act as an energy planner and extract the visual attributes such as roof age, building density, etc, from the RGB satellite image that correspond to the thermal load. A Multi-Layer Perceptron (MLP) regressor trained on these captions shows an $R^2$ uplift of 93.7% and shrinks the mean absolute error (MAE) by 30% compared to the baseline model. Qualitative analysis shows that high-impact tokens align with high-demand zones, offering lightweight support for heat planning in data-scarce regions.

翻译：精确的热需求地图在空间供暖脱碳中起着关键作用，然而大多数市政当局缺乏计算所需详细的建筑级数据。我们提出了HeatPrompt，一种零样本视觉语言能源建模框架，它利用从卫星图像、基础地理信息系统（GIS）和建筑级特征中提取的语义特征来估算年度热需求。我们向预训练的大型视觉语言模型（VLMs）输入特定领域提示，使其扮演能源规划师的角色，并从RGB卫星图像中提取与热负荷相对应的视觉属性，如屋顶年代、建筑密度等。基于这些描述训练的MLP回归器显示，与基线模型相比，其$R^2$提升了93.7%，并将平均绝对误差（MAE）降低了30%。定性分析表明，高影响力词汇与高需求区域相符，为数据稀缺地区的热规划提供了轻量级支持。

0

相关内容

《评估用于军事空军基地作战监控的视觉语言模型：卫星图像中的零样本飞机检测》

《评估用于军事空军基地作战监控的视觉语言模型：卫星图像中的零样本飞机检测》

专知会员服务

8+阅读 · 今天1:47

【ICML2026】WeatherSyn：面向天气报告生成的指令微调多模态大语言模型

【ICML2026】WeatherSyn：面向天气报告生成的指令微调多模态大语言模型

专知会员服务

3+阅读 · 5月11日

《用于水文建模应用的美国空军全球空陆天气开发模型数据流程：GALWEM采集系统v1.0与v2.0概述》最新报告

《用于水文建模应用的美国空军全球空陆天气开发模型数据流程：GALWEM采集系统v1.0与v2.0概述》最新报告

专知会员服务

16+阅读 · 2025年12月27日

视觉语言建模遇见遥感：模型、数据集与前景展望

视觉语言建模遇见遥感：模型、数据集与前景展望

专知会员服务

17+阅读 · 2025年5月21日

【剑桥博士论文】利用深度学习方法预测与建模空间天气

【剑桥博士论文】利用深度学习方法预测与建模空间天气

专知会员服务

15+阅读 · 2025年5月2日

大语言模型时代的城市计算

大语言模型时代的城市计算

专知会员服务

21+阅读 · 2025年4月4日

大模型如何构建和部署？微软等最新《大型语言模型》综述，详述GPT, LLaMA, PaLM技术细节，Tomas等大牛撰写

大模型如何构建和部署？微软等最新《大型语言模型》综述，详述GPT, LLaMA, PaLM技术细节，Tomas等大牛撰写

专知会员服务

91+阅读 · 2024年2月12日

大模型如何用于遥感？NYUAD等最新《遥感中的视觉-语言模型:当前进展与未来趋势》，全面阐述遥感中八项基本视觉语言模型任务应用

大模型如何用于遥感？NYUAD等最新《遥感中的视觉-语言模型:当前进展与未来趋势》，全面阐述遥感中八项基本视觉语言模型任务应用

专知会员服务

77+阅读 · 2023年5月16日

【清华-百度】面向季节性时空数据的预测式循环网络及其在城市计算中的应用，计算机学报

【清华-百度】面向季节性时空数据的预测式循环网络及其在城市计算中的应用，计算机学报

专知会员服务

42+阅读 · 2020年3月10日

【DeepMind】基于变换的大规模数据对抗视频预测，Transformation-based Adversarial Video Prediction on Large-Scale Data

【DeepMind】基于变换的大规模数据对抗视频预测，Transformation-based Adversarial Video Prediction on Large-Scale Data

专知会员服务

17+阅读 · 2020年3月9日

CVPR 2020 | 看图说话之随心所欲：细粒度可控的图像描述自动生成

CVPR 2020 | 看图说话之随心所欲：细粒度可控的图像描述自动生成

AI科技评论

14+阅读 · 2020年3月16日

【论文笔记】用于深度时空图建模的Geaph WaveNet

【论文笔记】用于深度时空图建模的Geaph WaveNet

专知

109+阅读 · 2019年11月4日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

AmpliGraph：知识图谱表示学习工具包

AmpliGraph：知识图谱表示学习工具包

专知

40+阅读 · 2019年4月6日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

无监督深度学习——这《元监督视觉学习》132页伯克利博士论文带你回顾无监督视觉应用最新发展脉络

无监督深度学习——这《元监督视觉学习》132页伯克利博士论文带你回顾无监督视觉应用最新发展脉络

专知

26+阅读 · 2019年1月1日

【泡泡点云时空】3DFeat-Net：用于点云配准的弱监督学习的局部3D特征（ECCV2018-3）

【泡泡点云时空】3DFeat-Net：用于点云配准的弱监督学习的局部3D特征（ECCV2018-3）

泡泡机器人SLAM

12+阅读 · 2018年10月2日

PyTorch 中使用深度学习（CNN和LSTM）的自动图像捕获

PyTorch 中使用深度学习（CNN和LSTM）的自动图像捕获

AI研习社

40+阅读 · 2018年9月21日

GIS最新热点以及未来发展热门

GIS最新热点以及未来发展热门

人工智能学家

10+阅读 · 2018年3月29日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

全球海洋热含量估计中的Mapping方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

非均质场景热辐射方向性模型构建与应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

热红外遥感图像模拟中异质异构地表像元辐射计算方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于静止气象卫星数据的日尺度地表土壤热通量模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

多特征融合与集成学习的城市高分辨率遥感影像变化检测

国家自然科学基金

4+阅读 · 2014年12月31日

城市化进程中海岸带城市景观格局演变与热岛效应互动机制

国家自然科学基金

0+阅读 · 2014年12月31日

基于模型确认的高温环境复杂结构动力学建模方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

城市下垫面热辐射方向性的多尺度几何模型

国家自然科学基金

0+阅读 · 2014年12月31日

动态群稀疏约束场景知识建模的感兴趣监控目标超分辨率重建

国家自然科学基金

1+阅读 · 2014年12月31日

不同人为热环境下城市景观格局气温调节功能的动态研究

国家自然科学基金

0+阅读 · 2014年12月31日

Modeling Subjective Urban Perception with Human Gaze

Arxiv

0+阅读 · 5月1日

High-Speed Vision Improves Zero-Shot Semantic Understanding of Human Actions

Arxiv

0+阅读 · 5月1日

Conflated Inverse Modeling to Generate Diverse and Temperature-Change Inducing Urban Vegetation Patterns

Arxiv

0+阅读 · 4月14日

Capturing Unseen Spatial Heat Extremes Through Dependence-Aware Generative Modeling

Arxiv

0+阅读 · 4月9日

Lightweight Multimodal Adaptation of Vision Language Models for Species Recognition and Habitat Context Interpretation in Drone Thermal Imagery

Arxiv

0+阅读 · 4月7日

NeedForHeat DataGear: An Open Monitoring System to Accelerate the Residential Heating Transition

Arxiv

0+阅读 · 4月3日

Meteorology-Driven GPT4AP: A Multi-Task Forecasting LLM for Atmospheric Air Pollution in Data-Scarce Settings

Arxiv

0+阅读 · 3月31日

3DCity-LLM: Empowering Multi-modality Large Language Models for 3D City-scale Perception and Understanding

Arxiv

0+阅读 · 3月24日

Full Dynamic Range Sky-Modelling For Image Based Lighting

Arxiv

0+阅读 · 3月5日

GeoDiT: Point-Conditioned Diffusion Transformer for Satellite Image Synthesis

Arxiv

0+阅读 · 3月2日

VIP会员

文章信息

相关主题

最新内容

[ICML 2026] SOL：让大模型把算力花在关键Token上：自优化语言模型

[ICML 2026] SOL：让大模型把算力花在关键Token上：自优化语言模型

专知会员服务

0+阅读 · 今天14:22

人工智能解释公平性：统一框架、公理与负责任AI的未来方向

人工智能解释公平性：统一框架、公理与负责任AI的未来方向

专知会员服务

0+阅读 · 今天14:19

《美军软件工厂案例研究：空军数字人才的人员需求》

《美军软件工厂案例研究：空军数字人才的人员需求》

专知会员服务

6+阅读 · 今天7:50

《美国防部DevSecOps实践现状：软件工厂之现代战争的数字兵工厂》47页文件

《美国防部DevSecOps实践现状：软件工厂之现代战争的数字兵工厂》47页文件

专知会员服务

6+阅读 · 今天7:35

有意义的人类指挥：迈向军事人机交互新模型探析（中文版PDF下载，2.5万字，2026年）

有意义的人类指挥：迈向军事人机交互新模型探析（中文版PDF下载，2.5万字，2026年）

专知会员服务

15+阅读 · 今天7:24

《执行无人机蜂群任务：智能体增强大语言模型推理赋能无人机物联网》

《执行无人机蜂群任务：智能体增强大语言模型推理赋能无人机物联网》

专知会员服务

6+阅读 · 今天5:52

下一代软件定义无线电：锻造现代战场的数字支柱

下一代软件定义无线电：锻造现代战场的数字支柱

专知会员服务

7+阅读 · 今天3:48

综合压制敌方防空和网电活动：北约反一体化防空系统策略的多域方法（中英文版下载）

综合压制敌方防空和网电活动：北约反一体化防空系统策略的多域方法（中英文版下载）

专知会员服务

13+阅读 · 今天2:20

美军“软件工厂”：为作战指挥官赋能数字战场

美军“软件工厂”：为作战指挥官赋能数字战场

专知会员服务

13+阅读 · 今天2:03

《面向大规模决策的分布式优化架构》247页

《面向大规模决策的分布式优化架构》247页

专知会员服务

15+阅读 · 今天1:57

《概率分布增强战争迷雾场景下的导航与战略规划》88页

《概率分布增强战争迷雾场景下的导航与战略规划》88页

专知会员服务

13+阅读 · 今天1:50

《评估用于军事空军基地作战监控的视觉语言模型：卫星图像中的零样本飞机检测》

《评估用于军事空军基地作战监控的视觉语言模型：卫星图像中的零样本飞机检测》

专知会员服务

8+阅读 · 今天1:47

《量子传感及其在印度军事导航系统中的应用》2026最新50页报告

《量子传感及其在印度军事导航系统中的应用》2026最新50页报告

专知会员服务

7+阅读 · 今天1:40

【ICML2026】WeatherSyn：面向天气报告生成的指令微调多模态大语言模型

【ICML2026】WeatherSyn：面向天气报告生成的指令微调多模态大语言模型

专知会员服务

3+阅读 · 5月11日

智能体技能综合综述：分类、技术与应用

智能体技能综合综述：分类、技术与应用

专知会员服务

16+阅读 · 5月11日

相关VIP内容

《评估用于军事空军基地作战监控的视觉语言模型：卫星图像中的零样本飞机检测》

《评估用于军事空军基地作战监控的视觉语言模型：卫星图像中的零样本飞机检测》

专知会员服务

8+阅读 · 今天1:47

【ICML2026】WeatherSyn：面向天气报告生成的指令微调多模态大语言模型

【ICML2026】WeatherSyn：面向天气报告生成的指令微调多模态大语言模型

专知会员服务

3+阅读 · 5月11日

《用于水文建模应用的美国空军全球空陆天气开发模型数据流程：GALWEM采集系统v1.0与v2.0概述》最新报告

《用于水文建模应用的美国空军全球空陆天气开发模型数据流程：GALWEM采集系统v1.0与v2.0概述》最新报告

专知会员服务

16+阅读 · 2025年12月27日

视觉语言建模遇见遥感：模型、数据集与前景展望

视觉语言建模遇见遥感：模型、数据集与前景展望

专知会员服务

17+阅读 · 2025年5月21日

【剑桥博士论文】利用深度学习方法预测与建模空间天气

【剑桥博士论文】利用深度学习方法预测与建模空间天气

专知会员服务

15+阅读 · 2025年5月2日

大语言模型时代的城市计算

大语言模型时代的城市计算

专知会员服务

21+阅读 · 2025年4月4日

大模型如何构建和部署？微软等最新《大型语言模型》综述，详述GPT, LLaMA, PaLM技术细节，Tomas等大牛撰写

大模型如何构建和部署？微软等最新《大型语言模型》综述，详述GPT, LLaMA, PaLM技术细节，Tomas等大牛撰写

专知会员服务

91+阅读 · 2024年2月12日

大模型如何用于遥感？NYUAD等最新《遥感中的视觉-语言模型:当前进展与未来趋势》，全面阐述遥感中八项基本视觉语言模型任务应用

大模型如何用于遥感？NYUAD等最新《遥感中的视觉-语言模型:当前进展与未来趋势》，全面阐述遥感中八项基本视觉语言模型任务应用

专知会员服务

77+阅读 · 2023年5月16日

【清华-百度】面向季节性时空数据的预测式循环网络及其在城市计算中的应用，计算机学报

【清华-百度】面向季节性时空数据的预测式循环网络及其在城市计算中的应用，计算机学报

专知会员服务

42+阅读 · 2020年3月10日

【DeepMind】基于变换的大规模数据对抗视频预测，Transformation-based Adversarial Video Prediction on Large-Scale Data

【DeepMind】基于变换的大规模数据对抗视频预测，Transformation-based Adversarial Video Prediction on Large-Scale Data

专知会员服务

17+阅读 · 2020年3月9日

热门VIP内容

开通专知VIP会员享更多权益服务

人工智能解释公平性：统一框架、公理与负责任AI的未来方向

《美国防部DevSecOps实践现状：软件工厂之现代战争的数字兵工厂》47页文件

[ICML 2026] SOL：让大模型把算力花在关键Token上：自优化语言模型

《美军软件工厂案例研究：空军数字人才的人员需求》

相关资讯

CVPR 2020 | 看图说话之随心所欲：细粒度可控的图像描述自动生成

CVPR 2020 | 看图说话之随心所欲：细粒度可控的图像描述自动生成

AI科技评论

14+阅读 · 2020年3月16日

【论文笔记】用于深度时空图建模的Geaph WaveNet

【论文笔记】用于深度时空图建模的Geaph WaveNet

专知

109+阅读 · 2019年11月4日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

AmpliGraph：知识图谱表示学习工具包

AmpliGraph：知识图谱表示学习工具包

专知

40+阅读 · 2019年4月6日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

无监督深度学习——这《元监督视觉学习》132页伯克利博士论文带你回顾无监督视觉应用最新发展脉络

无监督深度学习——这《元监督视觉学习》132页伯克利博士论文带你回顾无监督视觉应用最新发展脉络

专知

26+阅读 · 2019年1月1日

【泡泡点云时空】3DFeat-Net：用于点云配准的弱监督学习的局部3D特征（ECCV2018-3）

【泡泡点云时空】3DFeat-Net：用于点云配准的弱监督学习的局部3D特征（ECCV2018-3）

泡泡机器人SLAM

12+阅读 · 2018年10月2日

PyTorch 中使用深度学习（CNN和LSTM）的自动图像捕获

PyTorch 中使用深度学习（CNN和LSTM）的自动图像捕获

AI研习社

40+阅读 · 2018年9月21日

GIS最新热点以及未来发展热门

GIS最新热点以及未来发展热门

人工智能学家

10+阅读 · 2018年3月29日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

相关论文

Modeling Subjective Urban Perception with Human Gaze

Arxiv

0+阅读 · 5月1日

High-Speed Vision Improves Zero-Shot Semantic Understanding of Human Actions

Arxiv

0+阅读 · 5月1日

Conflated Inverse Modeling to Generate Diverse and Temperature-Change Inducing Urban Vegetation Patterns

Arxiv

0+阅读 · 4月14日

Capturing Unseen Spatial Heat Extremes Through Dependence-Aware Generative Modeling

Arxiv

0+阅读 · 4月9日

Lightweight Multimodal Adaptation of Vision Language Models for Species Recognition and Habitat Context Interpretation in Drone Thermal Imagery

Arxiv

0+阅读 · 4月7日

NeedForHeat DataGear: An Open Monitoring System to Accelerate the Residential Heating Transition

Arxiv

0+阅读 · 4月3日

Meteorology-Driven GPT4AP: A Multi-Task Forecasting LLM for Atmospheric Air Pollution in Data-Scarce Settings

Arxiv

0+阅读 · 3月31日

3DCity-LLM: Empowering Multi-modality Large Language Models for 3D City-scale Perception and Understanding

Arxiv

0+阅读 · 3月24日

Full Dynamic Range Sky-Modelling For Image Based Lighting

Arxiv

0+阅读 · 3月5日

GeoDiT: Point-Conditioned Diffusion Transformer for Satellite Image Synthesis

Arxiv

0+阅读 · 3月2日

相关基金

全球海洋热含量估计中的Mapping方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

非均质场景热辐射方向性模型构建与应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

热红外遥感图像模拟中异质异构地表像元辐射计算方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于静止气象卫星数据的日尺度地表土壤热通量模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

多特征融合与集成学习的城市高分辨率遥感影像变化检测

国家自然科学基金

4+阅读 · 2014年12月31日

城市化进程中海岸带城市景观格局演变与热岛效应互动机制

国家自然科学基金

0+阅读 · 2014年12月31日

基于模型确认的高温环境复杂结构动力学建模方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

城市下垫面热辐射方向性的多尺度几何模型

国家自然科学基金

0+阅读 · 2014年12月31日

动态群稀疏约束场景知识建模的感兴趣监控目标超分辨率重建

国家自然科学基金

1+阅读 · 2014年12月31日

不同人为热环境下城市景观格局气温调节功能的动态研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员