Urban traffic management demands systems that simultaneously predict future conditions, detect anomalies, and take safe corrective actions -- all while providing reliability guarantees. We present STREAM-RL, a unified framework that introduces three novel algorithmic contributions: (1) PU-GAT+, an Uncertainty-Guided Adaptive Conformal Forecaster that uses prediction uncertainty to dynamically reweight graph attention via confidence-monotonic attention, achieving distribution-free coverage guarantees; (2) CRFN-BY, a Conformal Residual Flow Network that models uncertainty-normalized residuals via normalizing flows with Benjamini-Yekutieli FDR control under arbitrary dependence; and (3) LyCon-WRL+, an Uncertainty-Guided Safe World-Model RL agent with Lyapunov stability certificates, certified Lipschitz bounds, and uncertainty-propagated imagination rollouts. To our knowledge, this is the first framework to propagate calibrated uncertainty from forecasting through anomaly detection to safe policy learning with end-to-end theoretical guarantees. Experiments on multiple real-world traffic trajectory data demonstrate that STREAM-RL achieves 91.4\% coverage efficiency, controls FDR at 4.1\% under verified dependence, and improves safety rate to 95.2\% compared to 69\% for standard PPO while achieving higher reward, with 23ms end-to-end inference latency.


翻译:城市交通管理要求系统能够同时预测未来状况、检测异常并采取安全的纠正措施——所有这些都需提供可靠性保证。我们提出了STREAM-RL这一统一框架,该框架包含三项新颖的算法贡献:(1) PU-GAT+:一种不确定性引导的自适应共形预测器,通过置信度单调注意力机制利用预测不确定性动态调整图注意力权重,实现无分布覆盖保证;(2) CRFN-BY:一种共形残差流网络,通过标准化流建模不确定性归一化残差,并在任意依赖关系下实现Benjamini-Yekutieli错误发现率控制;(3) LyCon-WRL+:一种具有李雅普诺夫稳定性证明、经认证的利普希茨边界及不确定性传播想象推演的不确定性引导安全世界模型强化学习智能体。据我们所知,这是首个将校准不确定性从预测端经异常检测传播至安全策略学习、并具有端到端理论保证的框架。在多个真实世界交通轨迹数据上的实验表明,STREAM-RL实现了91.4%的覆盖效率,在已验证依赖关系下将错误发现率控制在4.1%,安全率提升至95.2%(标准PPO为69%),同时获得更高奖励,且端到端推理延迟仅为23毫秒。

0
下载
关闭预览

相关内容

基于机器学习的交通流预测方法综述
专知会员服务
35+阅读 · 2023年8月17日
【AAAI2023】基于时空自监督学习的交通流预测
专知会员服务
23+阅读 · 2022年12月10日
基于模型的强化学习综述
专知会员服务
149+阅读 · 2022年7月13日
【AAAI2021】Graph Diffusion Network提升交通流量预测精度
专知会员服务
54+阅读 · 2021年1月21日
最新《智能交通系统的深度强化学习》综述论文,22页pdf
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
176+阅读 · 2020年2月8日
「基于通信的多智能体强化学习」 进展综述
基于模型的强化学习综述
专知
42+阅读 · 2022年7月13日
【综述】交通流量预测,附15页论文下载
专知
23+阅读 · 2020年4月23日
深度学习模型不确定性方法对比
PaperWeekly
20+阅读 · 2020年2月10日
量化金融强化学习论文集合
专知
14+阅读 · 2019年12月18日
城市公共交通智能化应用系统 (公交都市)
智能交通技术
10+阅读 · 2019年8月14日
智慧交通大数据可视化分析决策平台
智能交通技术
10+阅读 · 2019年4月15日
基于车路协同的群体智能协同
智能交通技术
10+阅读 · 2019年1月23日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关资讯
「基于通信的多智能体强化学习」 进展综述
基于模型的强化学习综述
专知
42+阅读 · 2022年7月13日
【综述】交通流量预测,附15页论文下载
专知
23+阅读 · 2020年4月23日
深度学习模型不确定性方法对比
PaperWeekly
20+阅读 · 2020年2月10日
量化金融强化学习论文集合
专知
14+阅读 · 2019年12月18日
城市公共交通智能化应用系统 (公交都市)
智能交通技术
10+阅读 · 2019年8月14日
智慧交通大数据可视化分析决策平台
智能交通技术
10+阅读 · 2019年4月15日
基于车路协同的群体智能协同
智能交通技术
10+阅读 · 2019年1月23日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员