天气悖论：为何降水无法预测美国大规模数据中的交通事故严重程度 (The Weather Paradox: Why Precipitation Fails to Predict Traffic Accident Severity in Large-Scale US Data) - 专知论文

会员服务 ·

0

类别 · 数据集 · 大规模数据 · 能见度 · xgboost ·

The Weather Paradox: Why Precipitation Fails to Predict Traffic Accident Severity in Large-Scale US Data

翻译：天气悖论：为何降水无法预测美国大规模数据中的交通事故严重程度

Yann Bellec,Rohan Kaman,Siwen Cui,Aarav Agrawal,Calvin Chen

from arxiv, 11 pages, 8 figures, 0 tables. Preprint, machine learning analysis of 500,000 US traffic accidents

This study investigates the predictive capacity of environmental, temporal, and spatial factors on traffic accident severity in the United States. Using a dataset of 500,000 U.S. traffic accidents spanning 2016-2023, we trained an XGBoost classifier optimized through randomized search cross-validation and adjusted for class imbalance via class weighting. The final model achieves an overall accuracy of 78%, with strong performance on the majority class (Severity 2), attaining 87% precision and recall. Feature importance analysis reveals that time of day, geographic location, and weather-related variables, including visibility, temperature, and wind speed, rank among the strongest predictors of accident severity. However, contrary to initial hypotheses, precipitation and visibility demonstrate limited predictive power, potentially reflecting behavioral adaptation by drivers under overtly hazardous conditions. The dataset's predominance of mid-level severity accidents constrains the model's capacity to learn meaningful patterns for extreme cases, highlighting the need for alternative sampling strategies, enhanced feature engineering, and integration of external datasets. These findings contribute to evidence-based traffic management and suggest future directions for severity prediction research.

翻译：本研究探讨了环境、时间和空间因素对美国交通事故严重程度的预测能力。利用2016年至2023年间涵盖50万起美国交通事故的数据集，我们训练了一个XGBoost分类器，该模型通过随机搜索交叉验证进行优化，并通过类别加权调整了类别不平衡问题。最终模型的整体准确率达到78%，在多数类别（严重程度2级）上表现强劲，精确率和召回率均达到87%。特征重要性分析表明，一天中的时间、地理位置以及与天气相关的变量（包括能见度、温度和风速）是事故严重程度的最强预测因子之一。然而，与初始假设相反，降水和能见度的预测能力有限，这可能反映了驾驶员在明显危险条件下的行为适应。数据集中以中等严重程度事故为主，限制了模型学习极端案例有意义模式的能力，突显了采用替代抽样策略、增强特征工程以及整合外部数据集的必要性。这些发现为基于证据的交通管理提供了依据，并为严重程度预测研究指明了未来方向。

0

相关内容

自动驾驶中的轨迹预测大型基础模型：全面综述

自动驾驶中的轨迹预测大型基础模型：全面综述

专知会员服务

16+阅读 · 2025年9月18日

【剑桥博士论文】利用深度学习方法预测与建模空间天气

【剑桥博士论文】利用深度学习方法预测与建模空间天气

专知会员服务

15+阅读 · 2025年5月2日

大模型如何预测天气？悉尼科技大学等最新《天气和气候数据理解的基础模型》综述

大模型如何预测天气？悉尼科技大学等最新《天气和气候数据理解的基础模型》综述

专知会员服务

49+阅读 · 2023年12月9日

基于机器学习的交通流预测方法综述

基于机器学习的交通流预测方法综述

专知会员服务

35+阅读 · 2023年8月17日

苏黎世联邦理工最新《深度学习在交通拥堵检测、预测和缓解中的应用综述》27页pdf

苏黎世联邦理工最新《深度学习在交通拥堵检测、预测和缓解中的应用综述》27页pdf

专知会员服务

31+阅读 · 2022年4月27日

【清华大学】图神经网络交通流预测综述论文，19页pdf

【清华大学】图神经网络交通流预测综述论文，19页pdf

专知会员服务

50+阅读 · 2021年1月29日

【AAAI2021】Graph Diffusion Network提升交通流量预测精度

【AAAI2021】Graph Diffusion Network提升交通流量预测精度

专知会员服务

54+阅读 · 2021年1月21日

最新《大数据时代事件预测》综述论文，40页pdf，Emory 大学

最新《大数据时代事件预测》综述论文，40页pdf，Emory 大学

专知会员服务

68+阅读 · 2020年7月21日

【综述】交通流量预测，附15页论文下载

【综述】交通流量预测，附15页论文下载

专知会员服务

132+阅读 · 2020年4月23日

基于动态时空图CNNs的交通流预测，Dynamic Spatio-temporal Graph-based CNNs for Traffic Flow Prediction

基于动态时空图CNNs的交通流预测，Dynamic Spatio-temporal Graph-based CNNs for Traffic Flow Prediction

专知会员服务

136+阅读 · 2020年3月8日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

47+阅读 · 2022年11月16日

【CMU-Amazon】时间序列预测：理论与实践，379页ppt阐述大规模时序预测工具与方法

【CMU-Amazon】时间序列预测：理论与实践，379页ppt阐述大规模时序预测工具与方法

专知

31+阅读 · 2020年4月24日

【综述】交通流量预测，附15页论文下载

【综述】交通流量预测，附15页论文下载

专知

23+阅读 · 2020年4月23日

您可以相信模型的不确定性吗？

您可以相信模型的不确定性吗？

TensorFlow

14+阅读 · 2020年1月31日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

从信息论的角度来理解损失函数

从信息论的角度来理解损失函数

深度学习每日摘要

17+阅读 · 2019年4月7日

智能交通大数据最新论文综述-附PDF下载

智能交通大数据最新论文综述-附PDF下载

专知

22+阅读 · 2019年1月21日

详解常见的损失函数

详解常见的损失函数

七月在线实验室

20+阅读 · 2018年7月12日

使用随机森林分类器预测森林火灾规模

使用随机森林分类器预测森林火灾规模

论智

13+阅读 · 2018年5月15日

回归预测&时间序列预测

回归预测&时间序列预测

GBASE数据工程部数据团队

44+阅读 · 2017年5月17日

支持应急决策的气象灾害大数据融合的方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向智能交通的车联网时空数据流异常分析研究

国家自然科学基金

7+阅读 · 2015年12月31日

大数据环境下公路网突发事件预警与应急决策研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机路径选择模型的交通悖论特征研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

面向车联网的道路交通事故链动态演变规律及其阻断方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

自然灾害风险的时空尺度效应分析与推绎技术研究—以农业旱灾风险为例

国家自然科学基金

0+阅读 · 2014年12月31日

驾驶行为与交通安全状态交互作用机理研究

国家自然科学基金

2+阅读 · 2014年12月31日

整合大数据挖掘与路网脆弱性评估的疏散交通管理研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于大数据的雾霾天气情景构建与应急决策鲁棒优化方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

TSBOW: Traffic Surveillance Benchmark for Occluded Vehicles Under Various Weather Conditions

Arxiv

0+阅读 · 2月5日

EVEREST: An Evidential, Tail-Aware Transformer for Rare-Event Time-Series Forecasting

Arxiv

0+阅读 · 1月28日

Failing on Bias Mitigation: Investigating Why Predictive Models Struggle with Government Data

Arxiv

0+阅读 · 1月21日

Traffic Collisions: Temporal Patterns and Severity-Weighted Hotspot Analysis

Arxiv

0+阅读 · 1月18日

Predictive Modeling of Power Outages during Extreme Events: Integrating Weather and Socio-Economic Factors

Arxiv

0+阅读 · 1月16日

Meta Dynamic Graph for Traffic Flow Prediction

Arxiv

0+阅读 · 1月15日

Data-Driven Stochastic VRP: Integration of Forecast Duration into Optimization for Utility Workforce Management

Arxiv

0+阅读 · 1月12日

From Lagging to Leading: Validating Hard Braking Events as High-Density Indicators of Segment Crash Risk

Arxiv

0+阅读 · 1月9日

Extreme-value forest fire prediction A study of the Loss Function in an Ordinality Scheme

Arxiv

0+阅读 · 1月8日

Measuring the Impact of Missingness in Traffic Stop Data

Arxiv

0+阅读 · 2025年12月30日

VIP会员

文章信息

相关主题

大规模数据

相关VIP内容

自动驾驶中的轨迹预测大型基础模型：全面综述

自动驾驶中的轨迹预测大型基础模型：全面综述

专知会员服务

16+阅读 · 2025年9月18日

【剑桥博士论文】利用深度学习方法预测与建模空间天气

【剑桥博士论文】利用深度学习方法预测与建模空间天气

专知会员服务

15+阅读 · 2025年5月2日

大模型如何预测天气？悉尼科技大学等最新《天气和气候数据理解的基础模型》综述

大模型如何预测天气？悉尼科技大学等最新《天气和气候数据理解的基础模型》综述

专知会员服务

49+阅读 · 2023年12月9日

基于机器学习的交通流预测方法综述

基于机器学习的交通流预测方法综述

专知会员服务

35+阅读 · 2023年8月17日

苏黎世联邦理工最新《深度学习在交通拥堵检测、预测和缓解中的应用综述》27页pdf

苏黎世联邦理工最新《深度学习在交通拥堵检测、预测和缓解中的应用综述》27页pdf

专知会员服务

31+阅读 · 2022年4月27日

【清华大学】图神经网络交通流预测综述论文，19页pdf

【清华大学】图神经网络交通流预测综述论文，19页pdf

专知会员服务

50+阅读 · 2021年1月29日

【AAAI2021】Graph Diffusion Network提升交通流量预测精度

【AAAI2021】Graph Diffusion Network提升交通流量预测精度

专知会员服务

54+阅读 · 2021年1月21日

最新《大数据时代事件预测》综述论文，40页pdf，Emory 大学

最新《大数据时代事件预测》综述论文，40页pdf，Emory 大学

专知会员服务

68+阅读 · 2020年7月21日

【综述】交通流量预测，附15页论文下载

【综述】交通流量预测，附15页论文下载

专知会员服务

132+阅读 · 2020年4月23日

基于动态时空图CNNs的交通流预测，Dynamic Spatio-temporal Graph-based CNNs for Traffic Flow Prediction

基于动态时空图CNNs的交通流预测，Dynamic Spatio-temporal Graph-based CNNs for Traffic Flow Prediction

专知会员服务

136+阅读 · 2020年3月8日

热门VIP内容

开通专知VIP会员享更多权益服务

论学习、公平性与复杂度

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

2025中国人工智能学会系列白皮书⸺棋盘上的人工智能|附下载

通用智能体评估的逻辑架构

相关资讯

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

47+阅读 · 2022年11月16日

【CMU-Amazon】时间序列预测：理论与实践，379页ppt阐述大规模时序预测工具与方法

【CMU-Amazon】时间序列预测：理论与实践，379页ppt阐述大规模时序预测工具与方法

专知

31+阅读 · 2020年4月24日

【综述】交通流量预测，附15页论文下载

【综述】交通流量预测，附15页论文下载

专知

23+阅读 · 2020年4月23日

您可以相信模型的不确定性吗？

您可以相信模型的不确定性吗？

TensorFlow

14+阅读 · 2020年1月31日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

从信息论的角度来理解损失函数

从信息论的角度来理解损失函数

深度学习每日摘要

17+阅读 · 2019年4月7日

智能交通大数据最新论文综述-附PDF下载

智能交通大数据最新论文综述-附PDF下载

专知

22+阅读 · 2019年1月21日

详解常见的损失函数

详解常见的损失函数

七月在线实验室

20+阅读 · 2018年7月12日

使用随机森林分类器预测森林火灾规模

使用随机森林分类器预测森林火灾规模

论智

13+阅读 · 2018年5月15日

回归预测&时间序列预测

回归预测&时间序列预测

GBASE数据工程部数据团队

44+阅读 · 2017年5月17日

相关论文

TSBOW: Traffic Surveillance Benchmark for Occluded Vehicles Under Various Weather Conditions

Arxiv

0+阅读 · 2月5日

EVEREST: An Evidential, Tail-Aware Transformer for Rare-Event Time-Series Forecasting

Arxiv

0+阅读 · 1月28日

Failing on Bias Mitigation: Investigating Why Predictive Models Struggle with Government Data

Arxiv

0+阅读 · 1月21日

Traffic Collisions: Temporal Patterns and Severity-Weighted Hotspot Analysis

Arxiv

0+阅读 · 1月18日

Predictive Modeling of Power Outages during Extreme Events: Integrating Weather and Socio-Economic Factors

Arxiv

0+阅读 · 1月16日

Meta Dynamic Graph for Traffic Flow Prediction

Arxiv

0+阅读 · 1月15日

Data-Driven Stochastic VRP: Integration of Forecast Duration into Optimization for Utility Workforce Management

Arxiv

0+阅读 · 1月12日

From Lagging to Leading: Validating Hard Braking Events as High-Density Indicators of Segment Crash Risk

Arxiv

0+阅读 · 1月9日

Extreme-value forest fire prediction A study of the Loss Function in an Ordinality Scheme

Arxiv

0+阅读 · 1月8日

Measuring the Impact of Missingness in Traffic Stop Data

Arxiv

0+阅读 · 2025年12月30日

相关基金

支持应急决策的气象灾害大数据融合的方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向智能交通的车联网时空数据流异常分析研究

国家自然科学基金

7+阅读 · 2015年12月31日

大数据环境下公路网突发事件预警与应急决策研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机路径选择模型的交通悖论特征研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

面向车联网的道路交通事故链动态演变规律及其阻断方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

自然灾害风险的时空尺度效应分析与推绎技术研究—以农业旱灾风险为例

国家自然科学基金

0+阅读 · 2014年12月31日

驾驶行为与交通安全状态交互作用机理研究

国家自然科学基金

2+阅读 · 2014年12月31日

整合大数据挖掘与路网脆弱性评估的疏散交通管理研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于大数据的雾霾天气情景构建与应急决策鲁棒优化方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员