Meteorology-Driven GPT4AP: A Multi-Task Forecasting LLM for Atmospheric Air Pollution in Data-Scarce Settings - 专知论文

会员服务 ·

0

污染 · 样本 · 泛化 · 泛化能力 · 长期预测 ·

Meteorology-Driven GPT4AP: A Multi-Task Forecasting LLM for Atmospheric Air Pollution in Data-Scarce Settings

翻译：气象驱动的GPT4AP：数据稀缺场景下大气空气污染的多任务预测大语言模型

Prasanjit Dey,Soumyabrata Dev,Bianca Schoen-Phelan

from arxiv, This manuscript is under review

Accurate forecasting of air pollution is important for environmental monitoring and policy support, yet data-driven models often suffer from limited generalization in regions with sparse observations. This paper presents Meteorology-Driven GPT for Air Pollution (GPT4AP), a parameter-efficient multi-task forecasting framework based on a pre-trained GPT-2 backbone and Gaussian rank-stabilized low-rank adaptation (rsLoRA). The model freezes the self-attention and feed-forward layers and adapts lightweight positional and output modules, substantially reducing the number of trainable parameters. GPT4AP is evaluated on six real-world air quality monitoring datasets under few-shot, zero-shot, and long-term forecasting settings. In the few-shot regime using 10% of the training data, GPT4AP achieves an average MSE/MAE of 0.686/0.442, outperforming DLinear (0.728/0.530) and ETSformer (0.734/0.505). In zero-shot cross-station transfer, the proposed model attains an average MSE/MAE of 0.529/0.403, demonstrating improved generalization compared with existing baselines. In long-term forecasting with full training data, GPT4AP remains competitive, achieving an average MAE of 0.429, while specialized time-series models show slightly lower errors. These results indicate that GPT4AP provides a data-efficient forecasting approach that performs robustly under limited supervision and domain shift, while maintaining competitive accuracy in data-rich settings.

翻译：空气污染的准确预测对于环境监测和政策支持至关重要，然而数据驱动模型在观测稀疏的区域往往泛化能力有限。本文提出气象驱动的大气污染GPT（GPT4AP），一种基于预训练GPT-2骨架和高斯秩稳定低秩自适应（rsLoRA）的参数高效多任务预测框架。该模型冻结自注意力层和前馈层，仅调整轻量级位置模块和输出模块，从而大幅减少可训练参数量。GPT4AP在六个真实空气质量监测数据集上进行了少样本、零样本和长期预测场景的评估。在仅使用10%训练数据的少样本模式下，GPT4AP的平均MSE/MAE达到0.686/0.442，优于DLinear（0.728/0.530）和ETSformer（0.734/0.505）。在跨站点零样本迁移中，该模型实现了0.529/0.403的平均MSE/MAE，相比现有基准模型展现出更强的泛化能力。在使用全量训练数据的长期预测中，GPT4AP保持竞争力，平均MAE达0.429，而专用时间序列模型表现略低。这些结果表明，GPT4AP提供了一种数据高效的预测方法，在有限监督和领域偏移条件下表现稳健，同时在数据丰富场景中保持竞争性精度。

0

相关内容

【ICML2026】WeatherSyn：面向天气报告生成的指令微调多模态大语言模型

【ICML2026】WeatherSyn：面向天气报告生成的指令微调多模态大语言模型

专知会员服务

8+阅读 · 5月11日

《用于水文建模应用的美国空军全球空陆天气开发模型数据流程：GALWEM采集系统v1.0与v2.0概述》最新报告

《用于水文建模应用的美国空军全球空陆天气开发模型数据流程：GALWEM采集系统v1.0与v2.0概述》最新报告

专知会员服务

18+阅读 · 2025年12月27日

【剑桥博士论文】利用深度学习方法预测与建模空间天气

【剑桥博士论文】利用深度学习方法预测与建模空间天气

专知会员服务

15+阅读 · 2025年5月2日

深度学习与基础模型在天气预测中的应用：综述

深度学习与基础模型在天气预测中的应用：综述

专知会员服务

25+阅读 · 2025年1月15日

大模型如何预测天气？悉尼科技大学等最新《天气和气候数据理解的基础模型》综述

大模型如何预测天气？悉尼科技大学等最新《天气和气候数据理解的基础模型》综述

专知会员服务

49+阅读 · 2023年12月9日

适配还是提示？微软最新《通用大模型是否超过专业领域微调大模型》论文，GPT-4多种策略提示超越医学大模型

适配还是提示？微软最新《通用大模型是否超过专业领域微调大模型》论文，GPT-4多种策略提示超越医学大模型

专知会员服务

59+阅读 · 2023年12月3日

选用哪个GPT？华中科大等最新《大型GPT模型》综述，37页pdf详述关于语言、多模态及科学GPT模型

选用哪个GPT？华中科大等最新《大型GPT模型》综述，37页pdf详述关于语言、多模态及科学GPT模型

专知会员服务

99+阅读 · 2023年9月30日

用GPT-4实现可控文本图像生成，UC伯克利&微软提出新框架Control-GPT

用GPT-4实现可控文本图像生成，UC伯克利&微软提出新框架Control-GPT

专知会员服务

35+阅读 · 2023年6月3日

GPT-4多模态大模型发布！98页《OpenAI GPT-4 技术报告》论文详细阐述！附下载（附151页技术报告中文版）

GPT-4多模态大模型发布！98页《OpenAI GPT-4 技术报告》论文详细阐述！附下载（附151页技术报告中文版）

专知会员服务

558+阅读 · 2023年3月15日

多模态预训练怎么做？鹏程实验室最新《大规模多模态预训练模型》全面综述，45页pdf全面阐述其数据、网络架构等技术

多模态预训练怎么做？鹏程实验室最新《大规模多模态预训练模型》全面综述，45页pdf全面阐述其数据、网络架构等技术

专知会员服务

104+阅读 · 2023年2月24日

GPT-4视频讲解！附Slides，OpenAI 《GPT-4 技术报告》中英文版下载,151页pdf

GPT-4视频讲解！附Slides，OpenAI 《GPT-4 技术报告》中英文版下载,151页pdf

专知

22+阅读 · 2023年4月10日

【ChatGPT系列报告】ChatGPT/GPT-4 如何赋能应用，31页pdf

【ChatGPT系列报告】ChatGPT/GPT-4 如何赋能应用，31页pdf

专知

29+阅读 · 2023年4月9日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

武大提出FarSeg：遥感图像分割新网络，解决前景背景不平衡问题 | CVPR 2020

武大提出FarSeg：遥感图像分割新网络，解决前景背景不平衡问题 | CVPR 2020

CVer

17+阅读 · 2020年7月10日

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

【综述】交通流量预测，附15页论文下载

【综述】交通流量预测，附15页论文下载

专知

23+阅读 · 2020年4月23日

逆天语言模型GPT-2最新开源：345M预训练模型和1.5B参数都来了

逆天语言模型GPT-2最新开源：345M预训练模型和1.5B参数都来了

量子位

18+阅读 · 2019年5月4日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

PyTorch 中使用深度学习（CNN和LSTM）的自动图像捕获

PyTorch 中使用深度学习（CNN和LSTM）的自动图像捕获

AI研习社

40+阅读 · 2018年9月21日

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

数据派THU

59+阅读 · 2017年11月6日

面向浅水波大气动力方程求解器的可重构计算方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于风险评价识别我国空气污染健康损伤的高危人群

国家自然科学基金

0+阅读 · 2017年12月31日

基于卫星遥感与地统计结合的PM2.5估算方法研究

国家自然科学基金

0+阅读 · 2016年12月31日

井震联合数据驱动下，多智能技术融合的煤层气储层参数预测与评价

国家自然科学基金

2+阅读 · 2015年12月31日

支持应急决策的气象灾害大数据融合的方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于社会化网络媒体数据的城市空气质量监测方法与模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

黑河流域高时空分辨率未来气候变化情景模拟与不确定性评估

国家自然科学基金

0+阅读 · 2014年12月31日

基于大数据的雾霾天气情景构建与应急决策鲁棒优化方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向大数据的环境绩效评价理论、方法及其应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

Unbox Responsible GeoAI: Navigating Climate Extreme and Disaster Mapping

Arxiv

0+阅读 · 5月1日

K-MetBench: A Multi-Dimensional Benchmark for Fine-Grained Evaluation of Expert Reasoning, Locality, and Multimodality in Meteorology

Arxiv

0+阅读 · 4月27日

Ground-Level Near Real-Time Modeling for PM2.5 Pollution Prediction

Arxiv

0+阅读 · 4月21日

Towards a Foundation-Model Paradigm for Aerodynamic Prediction in Three-dimensional Design

Arxiv

0+阅读 · 4月20日

RemoteShield: Enable Robust Multimodal Large Language Models for Earth Observation

Arxiv

0+阅读 · 4月19日

Beyond Conservative Automated Driving in Multi-Agent Scenarios via Coupled Model Predictive Control and Deep Reinforcement Learning

Arxiv

0+阅读 · 4月15日

NeuroDDAF: Neural Dynamic Diffusion-Advection Fields with Evidential Fusion for Air Quality Forecasting

Arxiv

0+阅读 · 4月1日

SmaAT-QMix-UNet: A Parameter-Efficient Vector-Quantized UNet for Precipitation Nowcasting

Arxiv

0+阅读 · 3月29日

LLM4AD: Large Language Models for Autonomous Driving -- Concept, Review, Benchmark, Experiments, and Future Trends

Arxiv

0+阅读 · 3月26日

Large-scale Multi-Modal Pre-trained Models: A Comprehensive Survey

Arxiv

25+阅读 · 2023年2月20日

VIP会员

文章信息

相关主题

最新内容

无人机自主控制与人工智能：系统性综述

无人机自主控制与人工智能：系统性综述

专知会员服务

10+阅读 · 今天7:25

巡飞弹与反无人机系统——现代战场的两大支柱

巡飞弹与反无人机系统——现代战场的两大支柱

专知会员服务

3+阅读 · 今天6:54

《打造“黄金舰队”》57页报告

《打造“黄金舰队”》57页报告

专知会员服务

3+阅读 · 今天6:52

《北约数字教官网络发展路径》128页报告

《北约数字教官网络发展路径》128页报告

专知会员服务

2+阅读 · 今天6:33

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

7+阅读 · 6月25日

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

6+阅读 · 6月25日

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

9+阅读 · 6月25日

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

7+阅读 · 6月25日

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

8+阅读 · 6月25日

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

8+阅读 · 6月25日

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

10+阅读 · 6月25日

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

9+阅读 · 6月25日

《国防领域敏感性分析白皮书》

《国防领域敏感性分析白皮书》

专知会员服务

9+阅读 · 6月25日

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

10+阅读 · 6月24日

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

10+阅读 · 6月24日

相关VIP内容

【ICML2026】WeatherSyn：面向天气报告生成的指令微调多模态大语言模型

【ICML2026】WeatherSyn：面向天气报告生成的指令微调多模态大语言模型

专知会员服务

8+阅读 · 5月11日

《用于水文建模应用的美国空军全球空陆天气开发模型数据流程：GALWEM采集系统v1.0与v2.0概述》最新报告

《用于水文建模应用的美国空军全球空陆天气开发模型数据流程：GALWEM采集系统v1.0与v2.0概述》最新报告

专知会员服务

18+阅读 · 2025年12月27日

【剑桥博士论文】利用深度学习方法预测与建模空间天气

【剑桥博士论文】利用深度学习方法预测与建模空间天气

专知会员服务

15+阅读 · 2025年5月2日

深度学习与基础模型在天气预测中的应用：综述

深度学习与基础模型在天气预测中的应用：综述

专知会员服务

25+阅读 · 2025年1月15日

大模型如何预测天气？悉尼科技大学等最新《天气和气候数据理解的基础模型》综述

大模型如何预测天气？悉尼科技大学等最新《天气和气候数据理解的基础模型》综述

专知会员服务

49+阅读 · 2023年12月9日

适配还是提示？微软最新《通用大模型是否超过专业领域微调大模型》论文，GPT-4多种策略提示超越医学大模型

适配还是提示？微软最新《通用大模型是否超过专业领域微调大模型》论文，GPT-4多种策略提示超越医学大模型

专知会员服务

59+阅读 · 2023年12月3日

选用哪个GPT？华中科大等最新《大型GPT模型》综述，37页pdf详述关于语言、多模态及科学GPT模型

选用哪个GPT？华中科大等最新《大型GPT模型》综述，37页pdf详述关于语言、多模态及科学GPT模型

专知会员服务

99+阅读 · 2023年9月30日

用GPT-4实现可控文本图像生成，UC伯克利&微软提出新框架Control-GPT

用GPT-4实现可控文本图像生成，UC伯克利&微软提出新框架Control-GPT

专知会员服务

35+阅读 · 2023年6月3日

GPT-4多模态大模型发布！98页《OpenAI GPT-4 技术报告》论文详细阐述！附下载（附151页技术报告中文版）

GPT-4多模态大模型发布！98页《OpenAI GPT-4 技术报告》论文详细阐述！附下载（附151页技术报告中文版）

专知会员服务

558+阅读 · 2023年3月15日

多模态预训练怎么做？鹏程实验室最新《大规模多模态预训练模型》全面综述，45页pdf全面阐述其数据、网络架构等技术

多模态预训练怎么做？鹏程实验室最新《大规模多模态预训练模型》全面综述，45页pdf全面阐述其数据、网络架构等技术

专知会员服务

104+阅读 · 2023年2月24日

热门VIP内容

开通专知VIP会员享更多权益服务

巡飞弹与反无人机系统——现代战场的两大支柱

《北约数字教官网络发展路径》128页报告

无人机自主控制与人工智能：系统性综述

《打造“黄金舰队”》57页报告

相关资讯

GPT-4视频讲解！附Slides，OpenAI 《GPT-4 技术报告》中英文版下载,151页pdf

GPT-4视频讲解！附Slides，OpenAI 《GPT-4 技术报告》中英文版下载,151页pdf

专知

22+阅读 · 2023年4月10日

【ChatGPT系列报告】ChatGPT/GPT-4 如何赋能应用，31页pdf

【ChatGPT系列报告】ChatGPT/GPT-4 如何赋能应用，31页pdf

专知

29+阅读 · 2023年4月9日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

武大提出FarSeg：遥感图像分割新网络，解决前景背景不平衡问题 | CVPR 2020

武大提出FarSeg：遥感图像分割新网络，解决前景背景不平衡问题 | CVPR 2020

CVer

17+阅读 · 2020年7月10日

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

【综述】交通流量预测，附15页论文下载

【综述】交通流量预测，附15页论文下载

专知

23+阅读 · 2020年4月23日

逆天语言模型GPT-2最新开源：345M预训练模型和1.5B参数都来了

逆天语言模型GPT-2最新开源：345M预训练模型和1.5B参数都来了

量子位

18+阅读 · 2019年5月4日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

PyTorch 中使用深度学习（CNN和LSTM）的自动图像捕获

PyTorch 中使用深度学习（CNN和LSTM）的自动图像捕获

AI研习社

40+阅读 · 2018年9月21日

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

数据派THU

59+阅读 · 2017年11月6日

相关论文

Unbox Responsible GeoAI: Navigating Climate Extreme and Disaster Mapping

Arxiv

0+阅读 · 5月1日

K-MetBench: A Multi-Dimensional Benchmark for Fine-Grained Evaluation of Expert Reasoning, Locality, and Multimodality in Meteorology

Arxiv

0+阅读 · 4月27日

Ground-Level Near Real-Time Modeling for PM2.5 Pollution Prediction

Arxiv

0+阅读 · 4月21日

Towards a Foundation-Model Paradigm for Aerodynamic Prediction in Three-dimensional Design

Arxiv

0+阅读 · 4月20日

RemoteShield: Enable Robust Multimodal Large Language Models for Earth Observation

Arxiv

0+阅读 · 4月19日

Beyond Conservative Automated Driving in Multi-Agent Scenarios via Coupled Model Predictive Control and Deep Reinforcement Learning

Arxiv

0+阅读 · 4月15日

NeuroDDAF: Neural Dynamic Diffusion-Advection Fields with Evidential Fusion for Air Quality Forecasting

Arxiv

0+阅读 · 4月1日

SmaAT-QMix-UNet: A Parameter-Efficient Vector-Quantized UNet for Precipitation Nowcasting

Arxiv

0+阅读 · 3月29日

LLM4AD: Large Language Models for Autonomous Driving -- Concept, Review, Benchmark, Experiments, and Future Trends

Arxiv

0+阅读 · 3月26日

Large-scale Multi-Modal Pre-trained Models: A Comprehensive Survey

Arxiv

25+阅读 · 2023年2月20日

相关基金

面向浅水波大气动力方程求解器的可重构计算方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于风险评价识别我国空气污染健康损伤的高危人群

国家自然科学基金

0+阅读 · 2017年12月31日

基于卫星遥感与地统计结合的PM2.5估算方法研究

国家自然科学基金

0+阅读 · 2016年12月31日

井震联合数据驱动下，多智能技术融合的煤层气储层参数预测与评价

国家自然科学基金

2+阅读 · 2015年12月31日

支持应急决策的气象灾害大数据融合的方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于社会化网络媒体数据的城市空气质量监测方法与模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

黑河流域高时空分辨率未来气候变化情景模拟与不确定性评估

国家自然科学基金

0+阅读 · 2014年12月31日

基于大数据的雾霾天气情景构建与应急决策鲁棒优化方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向大数据的环境绩效评价理论、方法及其应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员