The reliability of data-driven applications in electric vehicle (EV) infrastructure, such as charging demand forecasting, hinges on the availability of complete, high-quality charging data. However, real-world EV datasets are often plagued by missing records, and existing imputation methods are ill-equipped for the complex, multimodal context of charging data, often relying on a restrictive one-model-per-station paradigm that ignores valuable inter-station correlations. To address these gaps, we develop a novel PRobabilistic variational imputation framework that leverages the power of large lAnguage models and retrIeval-augmented Memory (PRAIM). PRAIM employs a pre-trained language model to encode heterogeneous data, spanning time-series demand, calendar features, and geospatial context, into a unified, semantically rich representation. This is dynamically fortified by retrieval-augmented memory that retrieves relevant examples from the entire charging network, enabling a single, unified imputation model empowered by variational neural architecture to overcome data sparsity. Extensive experiments on four public datasets demonstrate that PRAIM significantly outperforms established baselines in both imputation accuracy and its ability to preserve the original data's statistical distribution, leading to substantial improvements in downstream forecasting performance.


翻译:数据驱动应用在电动汽车(EV)基础设施(如充电需求预测)中的可靠性,依赖于完整、高质量充电数据的可用性。然而,现实世界的电动汽车数据集常受缺失记录困扰,且现有插补方法难以应对充电数据复杂、多模态的上下文,往往依赖于限制性的“一站一模型”范式,忽略了有价值的站间相关性。为弥补这些不足,我们开发了一种新颖的概率变分插补框架,该框架利用大语言模型和检索增强记忆库(PRAIM)的能力。PRAIM采用预训练语言模型将异构数据(涵盖时间序列需求、日历特征和地理空间上下文)编码为统一、语义丰富的表示。该表示通过检索增强记忆库动态增强,该记忆库从整个充电网络中检索相关示例,从而赋能一个由变分神经架构驱动的单一统一插补模型,以克服数据稀疏性问题。在四个公共数据集上的大量实验表明,PRAIM在插补准确性和保持原始数据统计分布的能力方面均显著优于现有基线方法,从而在下游预测性能上带来实质性提升。

0
下载
关闭预览

相关内容

汽车,本来是指汽油车,在中国泛指四轮内燃机车,包括汽油车,柴油车,电动车,混动车。汽车由德国人发明,德语词为Automobil,这个词由两部分构成,分别是Auto和Mobil,意为自动运行车,或称为自动车。
电动汽车路径规划模型与算法研究进展
专知会员服务
39+阅读 · 2024年3月10日
自动驾驶开源数据体系:现状与未来
专知会员服务
41+阅读 · 2024年1月28日
电力系统的大语言模型微调数据准备规范
专知会员服务
70+阅读 · 2024年1月11日
最新《生成式数据增强的统一框架》综述,85页pdf
专知会员服务
65+阅读 · 2023年10月8日
2022年中国汽车智能充电行业概览
专知会员服务
24+阅读 · 2022年8月18日
「知识增强预训练语言模型」最新研究综述
专知
18+阅读 · 2022年11月18日
用于语音识别的数据增强
AI研习社
24+阅读 · 2019年6月5日
【大数据】大数据参考架构和关键技术(综合)
产业智能官
14+阅读 · 2018年11月22日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
谷歌推出新型数据增强算法:AutoAugment
论智
20+阅读 · 2018年6月6日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员