Photovoltaic (PV) power forecasting plays a critical role in power system dispatch and market participation. Because PV generation is highly sensitive to weather conditions and cloud motion, accurate forecasting requires effective modeling of complex spatiotemporal dependencies across multiple information sources. Although recent studies have advanced AI-based forecasting methods, most fail to fuse temporal observations, satellite imagery, and textual weather information in a unified framework. This paper proposes Solar-VLM, a large-language-model-driven framework for multimodal PV power forecasting. First, modality-specific encoders are developed to extract complementary features from heterogeneous inputs. The time-series encoder adopts a patch-based design to capture temporal patterns from multivariate observations at each site. The visual encoder, built upon a Qwen-based vision backbone, extracts cloud-cover information from satellite images. The text encoder distills historical weather characteristics from textual descriptions. Second, to capture spatial dependencies across geographically distributed PV stations, a cross-site feature fusion mechanism is introduced. Specifically, a Graph Learner models inter-station correlations through a graph attention network constructed over a K-nearest-neighbor (KNN) graph, while a cross-site attention module further facilitates adaptive information exchange among sites. Finally, experiments conducted on data from eight PV stations in a northern province of China demonstrate the effectiveness of the proposed framework. Our proposed model is publicly available at https://github.com/rhp413/Solar-VLM.


翻译:光伏发电功率预测在电力系统调度与市场参与中发挥着关键作用。由于光伏发电对气象条件与云层运动高度敏感,准确预测需对多源信息中复杂的时空依赖性进行有效建模。尽管近期研究已推动基于人工智能的预测方法发展,但多数方法未能将时间观测、卫星影像与文本气象信息融合至统一框架。本文提出Solar-VLM——一种大语言模型驱动的多模态光伏发电预测框架。首先,开发模态专用编码器以从异构输入中提取互补特征:时序编码器采用基于分块的设计,从各站点多变量观测中捕获时序模式;视觉编码器基于Qwen视觉骨干网络构建,从卫星影像中提取云覆盖信息;文本编码器则从气象描述文本中提炼历史气象特征。其次,为捕获地理分布光伏电站间的空间依赖关系,引入跨站点特征融合机制:具体而言,图学习器通过基于K近邻(KNN)图构建的图注意力网络建模站点间相关性,跨站点注意力模块则进一步促进站点间的自适应信息交互。最后,基于中国北方某省八个光伏电站数据的实验验证了所提框架的有效性。本模型开源地址为:https://github.com/rhp413/Solar-VLM。

0
下载
关闭预览

相关内容

AI大模型技术在电力系统中的应用及发展趋势
专知会员服务
18+阅读 · 2025年6月23日
电力人工智能技术研究框架、应用现状及展望
专知会员服务
17+阅读 · 2025年5月15日
深度学习与基础模型在天气预测中的应用:综述
专知会员服务
25+阅读 · 2025年1月15日
【AI+电力】大模型在电力系统中的应用
专知会员服务
105+阅读 · 2023年6月20日
深度学习在电力系统预测中的应用
专知会员服务
44+阅读 · 2023年1月31日
数字电网最新报告:数字赋能,电网添翼,33页ppt
专知会员服务
37+阅读 · 2022年12月15日
深度预测学习:模型与应用
专知会员服务
49+阅读 · 2022年12月5日
电力人工智能发展报告
专知会员服务
85+阅读 · 2022年4月11日
专知会员服务
40+阅读 · 2021年8月31日
【综述】交通流量预测,附15页论文下载
专知
23+阅读 · 2020年4月23日
专家报告|高光谱遥感信息提取方法
中国图象图形学报
12+阅读 · 2019年7月14日
GIS最新热点以及未来发展热门
人工智能学家
10+阅读 · 2018年3月29日
展望:模型驱动的深度学习
人工智能学家
12+阅读 · 2018年1月23日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
4+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
4+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关VIP内容
AI大模型技术在电力系统中的应用及发展趋势
专知会员服务
18+阅读 · 2025年6月23日
电力人工智能技术研究框架、应用现状及展望
专知会员服务
17+阅读 · 2025年5月15日
深度学习与基础模型在天气预测中的应用:综述
专知会员服务
25+阅读 · 2025年1月15日
【AI+电力】大模型在电力系统中的应用
专知会员服务
105+阅读 · 2023年6月20日
深度学习在电力系统预测中的应用
专知会员服务
44+阅读 · 2023年1月31日
数字电网最新报告:数字赋能,电网添翼,33页ppt
专知会员服务
37+阅读 · 2022年12月15日
深度预测学习:模型与应用
专知会员服务
49+阅读 · 2022年12月5日
电力人工智能发展报告
专知会员服务
85+阅读 · 2022年4月11日
专知会员服务
40+阅读 · 2021年8月31日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员