Modeling traffic dynamics is a critical challenge for urban computing, with applications from real-time traffic management to infrastructure planning. However, progress in this area is fundamentally constrained by a lack of large-scale public datasets that capture the subtle properties of real city road networks. Existing benchmarks are often limited by their small scale, reliance on sparse highway traffic sensors, absence of true road connectivity information, and lack of information about road properties. To address this issue, we introduce datasets representing fine-grained road networks of two major cities, which are unique in their scale (up to 100,000 road segments), use of real road connectivity, presence of time series measurements for both traffic speed and volume at a 5-minute resolution, and inclusion of rich static road attributes. These datasets enable in-depth analysis of spatiotemporal traffic patterns and can serve as benchmarks for various ML applications. As a practical demonstration of the utility of our datasets and the challenges they present, we use them for the task of traffic forecasting. The size of the real-world road networks in our datasets reveals significant scalability issues in current traffic forecasting models. To address them, we propose a simple and efficient baseline that not only scales to large road graphs but also achieves forecasting performance competitive with other established spatiotemporal models. We hope that the proposed datasets will serve as a foundational resource for a broad range of research in traffic modeling, urban computing, and smart city development.


翻译:交通动态建模是城市计算中的关键挑战,其应用涵盖实时交通管理与基础设施规划。然而,该领域的发展从根本上受限于缺乏能够捕捉真实城市道路网络细微特性的大规模公开数据集。现有基准数据集往往存在规模较小、依赖稀疏高速公路传感器、缺乏真实道路连通性信息以及缺失道路属性数据等问题。为解决此问题,我们提出了两个主要城市的精细路网数据集,其独特性体现在:规模庞大(包含多达10万个路段)、采用真实道路连通性、提供5分钟粒度的交通流量与速度时序测量数据、以及包含丰富的静态道路属性。这些数据集不仅支持对时空交通模式的深度分析,还可作为多种机器学习应用的基准测试平台。作为数据集实用性与挑战性验证的示范,我们将其应用于交通预测任务。数据集中真实路网规模揭示了当前交通预测模型存在的显著可扩展性问题。为此,我们提出了一种简单高效的基线模型,该模型不仅能扩展至大规模路网图,其预测性能亦可与现有成熟的时空模型相媲美。我们期待所提出的数据集能够成为交通建模、城市计算与智慧城市发展等领域广泛研究的核心基础资源。

0
下载
关闭预览

相关内容

数据集,又称为资料集、数据集合或资料集合,是一种由数据所组成的集合。
Data set(或dataset)是一个数据的集合,通常以表格形式出现。每一列代表一个特定变量。每一行都对应于某一成员的数据集的问题。它列出的价值观为每一个变量,如身高和体重的一个物体或价值的随机数。每个数值被称为数据资料。对应于行数,该数据集的数据可能包括一个或多个成员。
专知会员服务
67+阅读 · 2021年8月24日
【AAAI2021】Graph Diffusion Network提升交通流量预测精度
专知会员服务
54+阅读 · 2021年1月21日
专知会员服务
53+阅读 · 2020年12月19日
【综述】交通流量预测,附15页论文下载
专知
23+阅读 · 2020年4月23日
城市公共交通智能化应用系统 (公交都市)
智能交通技术
10+阅读 · 2019年8月14日
车路协同构建“通信+计算”新体系
智能交通技术
11+阅读 · 2019年3月26日
基于车路协同的群体智能协同
智能交通技术
10+阅读 · 2019年1月23日
智能交通大数据最新论文综述-附PDF下载
专知
22+阅读 · 2019年1月21日
【学科发展报告】智慧城市
中国自动化学会
10+阅读 · 2019年1月14日
【大数据】大数据参考架构和关键技术(综合)
产业智能官
14+阅读 · 2018年11月22日
智慧公路建设方案
智能交通技术
30+阅读 · 2018年2月28日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
4+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
6+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
3+阅读 · 6月17日
相关VIP内容
专知会员服务
67+阅读 · 2021年8月24日
【AAAI2021】Graph Diffusion Network提升交通流量预测精度
专知会员服务
54+阅读 · 2021年1月21日
专知会员服务
53+阅读 · 2020年12月19日
相关资讯
【综述】交通流量预测,附15页论文下载
专知
23+阅读 · 2020年4月23日
城市公共交通智能化应用系统 (公交都市)
智能交通技术
10+阅读 · 2019年8月14日
车路协同构建“通信+计算”新体系
智能交通技术
11+阅读 · 2019年3月26日
基于车路协同的群体智能协同
智能交通技术
10+阅读 · 2019年1月23日
智能交通大数据最新论文综述-附PDF下载
专知
22+阅读 · 2019年1月21日
【学科发展报告】智慧城市
中国自动化学会
10+阅读 · 2019年1月14日
【大数据】大数据参考架构和关键技术(综合)
产业智能官
14+阅读 · 2018年11月22日
智慧公路建设方案
智能交通技术
30+阅读 · 2018年2月28日
相关基金
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员