SVII-3D: Advancing Roadside Infrastructure Inventory with Decimeter-level 3D Localization and Comprehension from Sparse Street Imagery - 专知论文

会员服务 ·

0

稀疏 · 3D · 三维定位 · 鲁棒 · 细粒度 ·

SVII-3D: Advancing Roadside Infrastructure Inventory with Decimeter-level 3D Localization and Comprehension from Sparse Street Imagery

翻译：SVII-3D：基于稀疏街景图像实现分米级三维定位与理解的道路基础设施盘点技术进展

Chong Liu,Luxuan Fu,Yang Jia,Zhen Dong,Bisheng Yang

The automated creation of digital twins and precise asset inventories is a critical task in smart city construction and facility lifecycle management. However, utilizing cost-effective sparse imagery remains challenging due to limited robustness, inaccurate localization, and a lack of fine-grained state understanding. To address these limitations, SVII-3D, a unified framework for holistic asset digitization, is proposed. First, LoRA fine-tuned open-set detection is fused with a spatial-attention matching network to robustly associate observations across sparse views. Second, a geometry-guided refinement mechanism is introduced to resolve structural errors, achieving precise decimeter-level 3D localization. Third, transcending static geometric mapping, a Vision-Language Model agent leveraging multi-modal prompting is incorporated to automatically diagnose fine-grained operational states. Experiments demonstrate that SVII-3D significantly improves identification accuracy and minimizes localization errors. Consequently, this framework offers a scalable, cost-effective solution for high-fidelity infrastructure digitization, effectively bridging the gap between sparse perception and automated intelligent maintenance.

翻译：数字孪生的自动化构建与精确资产盘点是智慧城市建设和设施全生命周期管理中的关键任务。然而，利用经济高效的稀疏图像仍面临诸多挑战，包括鲁棒性不足、定位不准确以及缺乏细粒度状态理解。为应对这些局限，本文提出了SVII-3D——一个用于资产整体数字化的统一框架。首先，通过融合LoRA微调的开集检测与空间注意力匹配网络，实现了稀疏视角间观测结果的鲁棒关联。其次，引入几何引导的优化机制以消除结构误差，实现了精确至分米级的三维定位。第三，超越静态几何映射，集成了一种利用多模态提示的视觉-语言模型智能体，以自动诊断细粒度的运行状态。实验表明，SVII-3D显著提升了识别精度并最小化了定位误差。因此，该框架为高保真基础设施数字化提供了一个可扩展、经济高效的解决方案，有效弥合了稀疏感知与自动化智能维护之间的鸿沟。

0

相关内容

3D点云基础模型：综述与展望

3D点云基础模型：综述与展望

专知会员服务

17+阅读 · 2025年1月31日

《军用地面车辆中的数字孪生系统：设计与预测性维护》最新136页

《军用地面车辆中的数字孪生系统：设计与预测性维护》最新136页

专知会员服务

32+阅读 · 2024年8月6日

《智慧城市城市数字孪生第1部分：技术参考架构（征求意见稿）》

《智慧城市城市数字孪生第1部分：技术参考架构（征求意见稿）》

专知会员服务

38+阅读 · 2024年1月18日

《3DLIVE技术分析：研究三维点云数据集的分割、分类和目标检测》49页报告，美空军研究实验室

《3DLIVE技术分析：研究三维点云数据集的分割、分类和目标检测》49页报告，美空军研究实验室

专知会员服务

30+阅读 · 2023年6月20日

数字孪生互联网是什么？西安交大等最新《数字孪生技术》综述论文，21页pdf全面阐述数字孪生体系结构、赋能技术、安全与隐私与展望

数字孪生互联网是什么？西安交大等最新《数字孪生技术》综述论文，21页pdf全面阐述数字孪生体系结构、赋能技术、安全与隐私与展望

专知会员服务

86+阅读 · 2023年2月2日

港中文发布最新《自动驾驶三维物体检测》综述论文，32页pdf涵盖367篇文献全面概述基于激光雷达、基于相机和多模态的物体检测进展

港中文发布最新《自动驾驶三维物体检测》综述论文，32页pdf涵盖367篇文献全面概述基于激光雷达、基于相机和多模态的物体检测进展

专知会员服务

44+阅读 · 2022年6月23日

《智慧城市知识图谱模型与本体构建方法》拓尔思知识图谱研究院等

《智慧城市知识图谱模型与本体构建方法》拓尔思知识图谱研究院等

专知会员服务

50+阅读 · 2022年3月27日

三维视觉前沿进展

专知会员服务

67+阅读 · 2021年5月21日

基于图像的大规模室外三维重建技术进展综述

专知会员服务

56+阅读 · 2021年4月4日

【CIKM 2019论文】重力启发式图自编码器定向链路预测（Gravity-Inspired Graph Autoencoders for Directed Link Prediction），Guillaume Salha，Stratis Limnios

【CIKM 2019论文】重力启发式图自编码器定向链路预测（Gravity-Inspired Graph Autoencoders for Directed Link Prediction），Guillaume Salha，Stratis Limnios

专知会员服务

28+阅读 · 2019年11月20日

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

《数字孪生仿真赋能要素及其在国防领域信息优势中的应用》2022最新16页技术报告，北约STO

《数字孪生仿真赋能要素及其在国防领域信息优势中的应用》2022最新16页技术报告，北约STO

专知

34+阅读 · 2022年10月26日

城市数字孪生标准化白皮书（2022版），60页pdf

城市数字孪生标准化白皮书（2022版），60页pdf

专知

25+阅读 · 2022年1月12日

3D Human相关研究总结：人体、姿态估计、人体重建等

3D Human相关研究总结：人体、姿态估计、人体重建等

PaperWeekly

27+阅读 · 2021年3月1日

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

专知

21+阅读 · 2019年12月31日

腾讯未来城市图景WeCity发布，70页PPT详解智慧城市进化之道 | 附报告下载

腾讯未来城市图景WeCity发布，70页PPT详解智慧城市进化之道 | 附报告下载

腾讯研究院

14+阅读 · 2019年11月7日

报告 | 中国信通院：数字孪生城市研究报告（2019年）（附PPT及报告全文下载）

报告 | 中国信通院：数字孪生城市研究报告（2019年）（附PPT及报告全文下载）

走向智能论坛

23+阅读 · 2019年10月11日

贾佳亚等提出Fast Point R-CNN，利用点云快速高效检测3D目标

贾佳亚等提出Fast Point R-CNN，利用点云快速高效检测3D目标

机器之心

11+阅读 · 2019年9月10日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

计算机视觉方向简介 | 三维重建技术概述

计算机视觉方向简介 | 三维重建技术概述

计算机视觉life

26+阅读 · 2019年6月13日

动态环境下的实时高清大规模三维地形重建研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于结构单元探测与修复的车载LiDAR数据建筑物立面模型三维重建研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于车载激光点云的城市道路三维精细重建

国家自然科学基金

0+阅读 · 2015年12月31日

地面激光雷达与设计数据正逆向结合的建筑物三维重建技术

国家自然科学基金

0+阅读 · 2015年12月31日

面向智能穿戴设备的三维图形网格简化与渐进显示方法

国家自然科学基金

1+阅读 · 2015年12月31日

基于分层稀疏表示的微动目标ISAR三维层析成像技术

国家自然科学基金

1+阅读 · 2015年12月31日

交通场景下基于视频的智能监控分析关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于结构特性的数字地图多尺度表达研究

国家自然科学基金

1+阅读 · 2014年12月31日

多特征融合与集成学习的城市高分辨率遥感影像变化检测

国家自然科学基金

4+阅读 · 2014年12月31日

融合机载与车载点云的建筑物群快速三维重建方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

An Industrial Dataset for Scene Acquisitions and Functional Schematics Alignment

Arxiv

0+阅读 · 2月17日

3D Object Detection for Autonomous Driving: A Survey

Arxiv

0+阅读 · 2月6日

Geographically-aware Transformer-based Traffic Forecasting for Urban Motorway Digital Twins

Geographically-aware Transformer-based Traffic Forecasting for Urban Motorway Digital Twins

Arxiv

0+阅读 · 2月5日

ShapeUP: Scalable Image-Conditioned 3D Editing

Arxiv

0+阅读 · 2月5日

Efficient Scene Modeling via Structure-Aware and Region-Prioritized 3D Gaussians

Arxiv

0+阅读 · 2月5日

LiDAR-based 3D Change Detection at City Scale

Arxiv

0+阅读 · 2月4日

LiDAR, GNSS and IMU Sensor Fine Alignment through Dynamic Time Warping to Construct 3D City Maps

Arxiv

0+阅读 · 2月4日

Beyond the Vehicle: Cooperative Localization by Fusing Point Clouds for GPS-Challenged Urban Scenarios

Arxiv

0+阅读 · 2月3日

L2M-Reg: Building-level Uncertainty-aware Registration of Outdoor LiDAR Point Clouds and Semantic 3D City Models

Arxiv

0+阅读 · 2月3日

3D Dynamics-Aware Manipulation: Endowing Manipulation Policies with 3D Foresight

Arxiv

0+阅读 · 2月2日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

0+阅读 · 29分钟前

多模态代码智能综述：从视觉输入到可执行代码系统

多模态代码智能综述：从视觉输入到可执行代码系统

专知会员服务

0+阅读 · 31分钟前

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

专知会员服务

3+阅读 · 今天8:18

《面向导弹有效发射时机的监督机器学习方法：基于超视距空战仿真》

《面向导弹有效发射时机的监督机器学习方法：基于超视距空战仿真》

专知会员服务

3+阅读 · 今天7:39

《通用大语言模型：无人机指挥与控制接口》最新40页

《通用大语言模型：无人机指挥与控制接口》最新40页

专知会员服务

9+阅读 · 今天7:33

《通过小型无人机系统将情报能力“作战化”》

《通过小型无人机系统将情报能力“作战化”》

专知会员服务

3+阅读 · 今天7:28

《神经安全型有人–无人协同：面向认知自适应作战能力的参考架构》

《神经安全型有人–无人协同：面向认知自适应作战能力的参考架构》

专知会员服务

6+阅读 · 今天7:14

《在指挥链中通过多准则决策分析传达指挥官意图：空战实验》

《在指挥链中通过多准则决策分析传达指挥官意图：空战实验》

专知会员服务

18+阅读 · 6月15日

消耗优势：美军的“精确规模化”概念

消耗优势：美军的“精确规模化”概念

专知会员服务

7+阅读 · 6月15日

五角大楼的AI优先战略及其对现代战争的启示：来自与伊朗冲突的经验教训

五角大楼的AI优先战略及其对现代战争的启示：来自与伊朗冲突的经验教训

专知会员服务

8+阅读 · 6月15日

《网络空间兵棋推演：挑战、局限性与混合路径》报告

《网络空间兵棋推演：挑战、局限性与混合路径》报告

专知会员服务

8+阅读 · 6月15日

《离线语言支持系统：面向空战战术决策》

《离线语言支持系统：面向空战战术决策》

专知会员服务

8+阅读 · 6月15日

《以通信为中心的6G–LLM架构：面向可扩展的战术自主防御车辆网络》

《以通信为中心的6G–LLM架构：面向可扩展的战术自主防御车辆网络》

专知会员服务

7+阅读 · 6月15日

ICML 2026｜ECA：面向开放式图文生成的高效持续对齐

ICML 2026｜ECA：面向开放式图文生成的高效持续对齐

专知会员服务

6+阅读 · 6月14日

可信智能体AI综述：安全、鲁棒性、隐私与系统安全

可信智能体AI综述：安全、鲁棒性、隐私与系统安全

专知会员服务

6+阅读 · 6月14日

相关VIP内容

3D点云基础模型：综述与展望

3D点云基础模型：综述与展望

专知会员服务

17+阅读 · 2025年1月31日

《军用地面车辆中的数字孪生系统：设计与预测性维护》最新136页

《军用地面车辆中的数字孪生系统：设计与预测性维护》最新136页

专知会员服务

32+阅读 · 2024年8月6日

《智慧城市城市数字孪生第1部分：技术参考架构（征求意见稿）》

《智慧城市城市数字孪生第1部分：技术参考架构（征求意见稿）》

专知会员服务

38+阅读 · 2024年1月18日

《3DLIVE技术分析：研究三维点云数据集的分割、分类和目标检测》49页报告，美空军研究实验室

《3DLIVE技术分析：研究三维点云数据集的分割、分类和目标检测》49页报告，美空军研究实验室

专知会员服务

30+阅读 · 2023年6月20日

数字孪生互联网是什么？西安交大等最新《数字孪生技术》综述论文，21页pdf全面阐述数字孪生体系结构、赋能技术、安全与隐私与展望

数字孪生互联网是什么？西安交大等最新《数字孪生技术》综述论文，21页pdf全面阐述数字孪生体系结构、赋能技术、安全与隐私与展望

专知会员服务

86+阅读 · 2023年2月2日

港中文发布最新《自动驾驶三维物体检测》综述论文，32页pdf涵盖367篇文献全面概述基于激光雷达、基于相机和多模态的物体检测进展

港中文发布最新《自动驾驶三维物体检测》综述论文，32页pdf涵盖367篇文献全面概述基于激光雷达、基于相机和多模态的物体检测进展

专知会员服务

44+阅读 · 2022年6月23日

《智慧城市知识图谱模型与本体构建方法》拓尔思知识图谱研究院等

《智慧城市知识图谱模型与本体构建方法》拓尔思知识图谱研究院等

专知会员服务

50+阅读 · 2022年3月27日

三维视觉前沿进展

专知会员服务

67+阅读 · 2021年5月21日

基于图像的大规模室外三维重建技术进展综述

专知会员服务

56+阅读 · 2021年4月4日

【CIKM 2019论文】重力启发式图自编码器定向链路预测（Gravity-Inspired Graph Autoencoders for Directed Link Prediction），Guillaume Salha，Stratis Limnios

【CIKM 2019论文】重力启发式图自编码器定向链路预测（Gravity-Inspired Graph Autoencoders for Directed Link Prediction），Guillaume Salha，Stratis Limnios

专知会员服务

28+阅读 · 2019年11月20日

热门VIP内容

开通专知VIP会员享更多权益服务

多模态代码智能综述：从视觉输入到可执行代码系统

《面向导弹有效发射时机的监督机器学习方法：基于超视距空战仿真》

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

相关资讯

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

《数字孪生仿真赋能要素及其在国防领域信息优势中的应用》2022最新16页技术报告，北约STO

《数字孪生仿真赋能要素及其在国防领域信息优势中的应用》2022最新16页技术报告，北约STO

专知

34+阅读 · 2022年10月26日

城市数字孪生标准化白皮书（2022版），60页pdf

城市数字孪生标准化白皮书（2022版），60页pdf

专知

25+阅读 · 2022年1月12日

3D Human相关研究总结：人体、姿态估计、人体重建等

3D Human相关研究总结：人体、姿态估计、人体重建等

PaperWeekly

27+阅读 · 2021年3月1日

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

专知

21+阅读 · 2019年12月31日

腾讯未来城市图景WeCity发布，70页PPT详解智慧城市进化之道 | 附报告下载

腾讯未来城市图景WeCity发布，70页PPT详解智慧城市进化之道 | 附报告下载

腾讯研究院

14+阅读 · 2019年11月7日

报告 | 中国信通院：数字孪生城市研究报告（2019年）（附PPT及报告全文下载）

报告 | 中国信通院：数字孪生城市研究报告（2019年）（附PPT及报告全文下载）

走向智能论坛

23+阅读 · 2019年10月11日

贾佳亚等提出Fast Point R-CNN，利用点云快速高效检测3D目标

贾佳亚等提出Fast Point R-CNN，利用点云快速高效检测3D目标

机器之心

11+阅读 · 2019年9月10日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

计算机视觉方向简介 | 三维重建技术概述

计算机视觉方向简介 | 三维重建技术概述

计算机视觉life

26+阅读 · 2019年6月13日

相关论文

An Industrial Dataset for Scene Acquisitions and Functional Schematics Alignment

Arxiv

0+阅读 · 2月17日

3D Object Detection for Autonomous Driving: A Survey

Arxiv

0+阅读 · 2月6日

Geographically-aware Transformer-based Traffic Forecasting for Urban Motorway Digital Twins

Geographically-aware Transformer-based Traffic Forecasting for Urban Motorway Digital Twins

Arxiv

0+阅读 · 2月5日

ShapeUP: Scalable Image-Conditioned 3D Editing

Arxiv

0+阅读 · 2月5日

Efficient Scene Modeling via Structure-Aware and Region-Prioritized 3D Gaussians

Arxiv

0+阅读 · 2月5日

LiDAR-based 3D Change Detection at City Scale

Arxiv

0+阅读 · 2月4日

LiDAR, GNSS and IMU Sensor Fine Alignment through Dynamic Time Warping to Construct 3D City Maps

Arxiv

0+阅读 · 2月4日

Beyond the Vehicle: Cooperative Localization by Fusing Point Clouds for GPS-Challenged Urban Scenarios

Arxiv

0+阅读 · 2月3日

L2M-Reg: Building-level Uncertainty-aware Registration of Outdoor LiDAR Point Clouds and Semantic 3D City Models

Arxiv

0+阅读 · 2月3日

3D Dynamics-Aware Manipulation: Endowing Manipulation Policies with 3D Foresight

Arxiv

0+阅读 · 2月2日

相关基金

动态环境下的实时高清大规模三维地形重建研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于结构单元探测与修复的车载LiDAR数据建筑物立面模型三维重建研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于车载激光点云的城市道路三维精细重建

国家自然科学基金

0+阅读 · 2015年12月31日

地面激光雷达与设计数据正逆向结合的建筑物三维重建技术

国家自然科学基金

0+阅读 · 2015年12月31日

面向智能穿戴设备的三维图形网格简化与渐进显示方法

国家自然科学基金

1+阅读 · 2015年12月31日

基于分层稀疏表示的微动目标ISAR三维层析成像技术

国家自然科学基金

1+阅读 · 2015年12月31日

交通场景下基于视频的智能监控分析关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于结构特性的数字地图多尺度表达研究

国家自然科学基金

1+阅读 · 2014年12月31日

多特征融合与集成学习的城市高分辨率遥感影像变化检测

国家自然科学基金

4+阅读 · 2014年12月31日

融合机载与车载点云的建筑物群快速三维重建方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员