Safe Urban Traffic Control via Uncertainty-Aware Conformal Prediction and World-Model Reinforcement Learning - 专知论文

会员服务 ·

0

不确定 · 不确定性 · 共形 · 模型强化学习 · 共形预测 ·

Safe Urban Traffic Control via Uncertainty-Aware Conformal Prediction and World-Model Reinforcement Learning

翻译：基于不确定性感知的共形预测与世界模型强化学习的城市交通安全控制

Joydeep Chandra,Satyam Kumar Navneet,Aleksandr Algazinov,Yong Zhang

Urban traffic management demands systems that simultaneously predict future conditions, detect anomalies, and take safe corrective actions -- all while providing reliability guarantees. We present STREAM-RL, a unified framework that introduces three novel algorithmic contributions: (1) PU-GAT+, an Uncertainty-Guided Adaptive Conformal Forecaster that uses prediction uncertainty to dynamically reweight graph attention via confidence-monotonic attention, achieving distribution-free coverage guarantees; (2) CRFN-BY, a Conformal Residual Flow Network that models uncertainty-normalized residuals via normalizing flows with Benjamini-Yekutieli FDR control under arbitrary dependence; and (3) LyCon-WRL+, an Uncertainty-Guided Safe World-Model RL agent with Lyapunov stability certificates, certified Lipschitz bounds, and uncertainty-propagated imagination rollouts. To our knowledge, this is the first framework to propagate calibrated uncertainty from forecasting through anomaly detection to safe policy learning with end-to-end theoretical guarantees. Experiments on multiple real-world traffic trajectory data demonstrate that STREAM-RL achieves 91.4\% coverage efficiency, controls FDR at 4.1\% under verified dependence, and improves safety rate to 95.2\% compared to 69\% for standard PPO while achieving higher reward, with 23ms end-to-end inference latency.

翻译：城市交通管理要求系统能够同时预测未来状况、检测异常并采取安全的纠正措施——所有这些都需提供可靠性保证。我们提出了STREAM-RL这一统一框架，该框架包含三项新颖的算法贡献：(1) PU-GAT+：一种不确定性引导的自适应共形预测器，通过置信度单调注意力机制利用预测不确定性动态调整图注意力权重，实现无分布覆盖保证；(2) CRFN-BY：一种共形残差流网络，通过标准化流建模不确定性归一化残差，并在任意依赖关系下实现Benjamini-Yekutieli错误发现率控制；(3) LyCon-WRL+：一种具有李雅普诺夫稳定性证明、经认证的利普希茨边界及不确定性传播想象推演的不确定性引导安全世界模型强化学习智能体。据我们所知，这是首个将校准不确定性从预测端经异常检测传播至安全策略学习、并具有端到端理论保证的框架。在多个真实世界交通轨迹数据上的实验表明，STREAM-RL实现了91.4%的覆盖效率，在已验证依赖关系下将错误发现率控制在4.1%，安全率提升至95.2%（标准PPO为69%），同时获得更高奖励，且端到端推理延迟仅为23毫秒。

0

相关内容

不确定

《实现网络防御态势感知能力的决策支持要素和使能技术》2023最新博士论文

《实现网络防御态势感知能力的决策支持要素和使能技术》2023最新博士论文

专知会员服务

41+阅读 · 2023年11月15日

基于机器学习的交通流预测方法综述

基于机器学习的交通流预测方法综述

专知会员服务

36+阅读 · 2023年8月17日

MILA等最新《强化学习Transformer模型》综述，详述表征学习、奖励建模、转换函数建模和策略学习等技术

MILA等最新《强化学习Transformer模型》综述，详述表征学习、奖励建模、转换函数建模和策略学习等技术

专知会员服务

61+阅读 · 2023年7月16日

国防科大最新《时空图神经网络》综述，24页pdf详述其在城市计算预测学习应用进展

国防科大最新《时空图神经网络》综述，24页pdf详述其在城市计算预测学习应用进展

专知会员服务

72+阅读 · 2023年4月3日

【AAAI2023】基于时空自监督学习的交通流预测

【AAAI2023】基于时空自监督学习的交通流预测

专知会员服务

23+阅读 · 2022年12月10日

基于模型的强化学习综述

基于模型的强化学习综述

专知会员服务

150+阅读 · 2022年7月13日

苏黎世联邦理工最新《深度学习在交通拥堵检测、预测和缓解中的应用综述》27页pdf

苏黎世联邦理工最新《深度学习在交通拥堵检测、预测和缓解中的应用综述》27页pdf

专知会员服务

31+阅读 · 2022年4月27日

【AAAI2021】Graph Diffusion Network提升交通流量预测精度

【AAAI2021】Graph Diffusion Network提升交通流量预测精度

专知会员服务

54+阅读 · 2021年1月21日

最新《智能交通系统的深度强化学习》综述论文，22页pdf

最新《智能交通系统的深度强化学习》综述论文，22页pdf

专知会员服务

190+阅读 · 2020年5月5日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

177+阅读 · 2020年2月8日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

33+阅读 · 2022年11月12日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

【综述】交通流量预测，附15页论文下载

【综述】交通流量预测，附15页论文下载

专知

23+阅读 · 2020年4月23日

深度学习模型不确定性方法对比

深度学习模型不确定性方法对比

PaperWeekly

20+阅读 · 2020年2月10日

量化金融强化学习论文集合

量化金融强化学习论文集合

专知

14+阅读 · 2019年12月18日

城市公共交通智能化应用系统（公交都市）

城市公共交通智能化应用系统（公交都市）

智能交通技术

10+阅读 · 2019年8月14日

智慧交通大数据可视化分析决策平台

智慧交通大数据可视化分析决策平台

智能交通技术

10+阅读 · 2019年4月15日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

城市轨道交通系统中列车运行调整与驾驶控制一体化模型与算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

大数据环境下公路网突发事件预警与应急决策研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向城市环境的车载机会网络关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向城市交通通道仿真的交通流建模与组织优化

国家自然科学基金

0+阅读 · 2015年12月31日

混合交通环境中自动驾驶汽车安全可达性分析与优化控制研究

国家自然科学基金

1+阅读 · 2015年12月31日

交通场景下基于视频的智能监控分析关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

城市快速路车流可变限速模型与控制策略研究

国家自然科学基金

0+阅读 · 2014年12月31日

交通信息对驾驶员路径选择行为及交通流特性影响的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于交通流量概率推理的不规则交叉口交通信号配时参数优化研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于交通行为的道路网络脆弱性识别及改善策略研究

国家自然科学基金

0+阅读 · 2014年12月31日

Long-Horizon Traffic Forecasting via Incident-Aware Conformal Spatio-Temporal Transformers

Arxiv

0+阅读 · 3月17日

A Lightweight Digital-Twin-Based Framework for Edge-Assisted Vehicle Tracking and Collision Prediction

Arxiv

0+阅读 · 3月7日

Risk-Aware World Model Predictive Control for Generalizable End-to-End Autonomous Driving

Arxiv

0+阅读 · 2月26日

Safe Reinforcement Learning for Real-World Engine Control

Arxiv

0+阅读 · 2月24日

Safe Reinforcement Learning via Recovery-based Shielding with Gaussian Process Dynamics Models

Arxiv

0+阅读 · 2月17日

Delay-Aware Reinforcement Learning for Highway On-Ramp Merging under Stochastic Communication Latency

Arxiv

0+阅读 · 2月9日

Uncertainty-Aware Counterfactual Traffic Signal Control with Predictive Safety and Starvation-Avoidance Constraints Using Vision-Based Sensing

Arxiv

0+阅读 · 2月8日

Geographically-aware Transformer-based Traffic Forecasting for Urban Motorway Digital Twins

Geographically-aware Transformer-based Traffic Forecasting for Urban Motorway Digital Twins

Arxiv

0+阅读 · 2月5日

Transformer-Based Reinforcement Learning for Autonomous Orbital Collision Avoidance in Partially Observable Environments

Arxiv

0+阅读 · 2月5日

Conformal Reachability for Safe Control in Unknown Environments

Conformal Reachability for Safe Control in Unknown Environments

Arxiv

0+阅读 · 2月3日

VIP会员

文章信息

相关主题

模型强化学习

最新内容

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

4+阅读 · 今天15:21

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

0+阅读 · 今天15:12

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

2+阅读 · 今天15:06

《无人机蜂群通信技术研究》50页

《无人机蜂群通信技术研究》50页

专知会员服务

4+阅读 · 今天14:55

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

专知会员服务

9+阅读 · 7月18日

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

专知会员服务

7+阅读 · 7月18日

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

专知会员服务

9+阅读 · 7月18日

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

专知会员服务

6+阅读 · 7月18日

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

专知会员服务

9+阅读 · 7月17日

《边缘端实时无线感知赋能现场多机器人部署》200页

《边缘端实时无线感知赋能现场多机器人部署》200页

专知会员服务

9+阅读 · 7月17日

战力倍增器：自主武器系统与乌克兰及加沙冲突

战力倍增器：自主武器系统与乌克兰及加沙冲突

专知会员服务

5+阅读 · 7月17日

人工智能赋能战场情报：提速决策进程

人工智能赋能战场情报：提速决策进程

专知会员服务

3+阅读 · 7月17日

《拥抱新兴技术：面向未来军官的教育革新》

《拥抱新兴技术：面向未来军官的教育革新》

专知会员服务

7+阅读 · 7月17日

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

专知会员服务

5+阅读 · 7月17日

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

专知会员服务

6+阅读 · 7月17日

相关VIP内容

《实现网络防御态势感知能力的决策支持要素和使能技术》2023最新博士论文

《实现网络防御态势感知能力的决策支持要素和使能技术》2023最新博士论文

专知会员服务

41+阅读 · 2023年11月15日

基于机器学习的交通流预测方法综述

基于机器学习的交通流预测方法综述

专知会员服务

36+阅读 · 2023年8月17日

MILA等最新《强化学习Transformer模型》综述，详述表征学习、奖励建模、转换函数建模和策略学习等技术

MILA等最新《强化学习Transformer模型》综述，详述表征学习、奖励建模、转换函数建模和策略学习等技术

专知会员服务

61+阅读 · 2023年7月16日

国防科大最新《时空图神经网络》综述，24页pdf详述其在城市计算预测学习应用进展

国防科大最新《时空图神经网络》综述，24页pdf详述其在城市计算预测学习应用进展

专知会员服务

72+阅读 · 2023年4月3日

【AAAI2023】基于时空自监督学习的交通流预测

【AAAI2023】基于时空自监督学习的交通流预测

专知会员服务

23+阅读 · 2022年12月10日

基于模型的强化学习综述

基于模型的强化学习综述

专知会员服务

150+阅读 · 2022年7月13日

苏黎世联邦理工最新《深度学习在交通拥堵检测、预测和缓解中的应用综述》27页pdf

苏黎世联邦理工最新《深度学习在交通拥堵检测、预测和缓解中的应用综述》27页pdf

专知会员服务

31+阅读 · 2022年4月27日

【AAAI2021】Graph Diffusion Network提升交通流量预测精度

【AAAI2021】Graph Diffusion Network提升交通流量预测精度

专知会员服务

54+阅读 · 2021年1月21日

最新《智能交通系统的深度强化学习》综述论文，22页pdf

最新《智能交通系统的深度强化学习》综述论文，22页pdf

专知会员服务

190+阅读 · 2020年5月5日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

177+阅读 · 2020年2月8日

热门VIP内容

开通专知VIP会员享更多权益服务

锻造未来士兵：外骨骼、基因工程与赛博格

《无人机蜂群通信技术研究》50页

深入Project Maven：为何人工智能在战场上依然失灵

《无人机系统（UAS）通信网状网络试验性部署》50页报告

相关资讯

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

33+阅读 · 2022年11月12日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

【综述】交通流量预测，附15页论文下载

【综述】交通流量预测，附15页论文下载

专知

23+阅读 · 2020年4月23日

深度学习模型不确定性方法对比

深度学习模型不确定性方法对比

PaperWeekly

20+阅读 · 2020年2月10日

量化金融强化学习论文集合

量化金融强化学习论文集合

专知

14+阅读 · 2019年12月18日

城市公共交通智能化应用系统（公交都市）

城市公共交通智能化应用系统（公交都市）

智能交通技术

10+阅读 · 2019年8月14日

智慧交通大数据可视化分析决策平台

智慧交通大数据可视化分析决策平台

智能交通技术

10+阅读 · 2019年4月15日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

相关论文

Long-Horizon Traffic Forecasting via Incident-Aware Conformal Spatio-Temporal Transformers

Arxiv

0+阅读 · 3月17日

A Lightweight Digital-Twin-Based Framework for Edge-Assisted Vehicle Tracking and Collision Prediction

Arxiv

0+阅读 · 3月7日

Risk-Aware World Model Predictive Control for Generalizable End-to-End Autonomous Driving

Arxiv

0+阅读 · 2月26日

Safe Reinforcement Learning for Real-World Engine Control

Arxiv

0+阅读 · 2月24日

Safe Reinforcement Learning via Recovery-based Shielding with Gaussian Process Dynamics Models

Arxiv

0+阅读 · 2月17日

Delay-Aware Reinforcement Learning for Highway On-Ramp Merging under Stochastic Communication Latency

Arxiv

0+阅读 · 2月9日

Uncertainty-Aware Counterfactual Traffic Signal Control with Predictive Safety and Starvation-Avoidance Constraints Using Vision-Based Sensing

Arxiv

0+阅读 · 2月8日

Geographically-aware Transformer-based Traffic Forecasting for Urban Motorway Digital Twins

Geographically-aware Transformer-based Traffic Forecasting for Urban Motorway Digital Twins

Arxiv

0+阅读 · 2月5日

Transformer-Based Reinforcement Learning for Autonomous Orbital Collision Avoidance in Partially Observable Environments

Arxiv

0+阅读 · 2月5日

Conformal Reachability for Safe Control in Unknown Environments

Conformal Reachability for Safe Control in Unknown Environments

Arxiv

0+阅读 · 2月3日

相关基金

城市轨道交通系统中列车运行调整与驾驶控制一体化模型与算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

大数据环境下公路网突发事件预警与应急决策研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向城市环境的车载机会网络关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向城市交通通道仿真的交通流建模与组织优化

国家自然科学基金

0+阅读 · 2015年12月31日

混合交通环境中自动驾驶汽车安全可达性分析与优化控制研究

国家自然科学基金

1+阅读 · 2015年12月31日

交通场景下基于视频的智能监控分析关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

城市快速路车流可变限速模型与控制策略研究

国家自然科学基金

0+阅读 · 2014年12月31日

交通信息对驾驶员路径选择行为及交通流特性影响的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于交通流量概率推理的不规则交叉口交通信号配时参数优化研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于交通行为的道路网络脆弱性识别及改善策略研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员