3D 感知在自动驾驶领域中起着至关重要的作用。基于视觉的 3D 感知方法依赖于仅使用相机输入来重建 3D 环境,随着深度学习技术的普及,这些方法取得了显著进展。尽管取得了这些突破,现有的框架仍面临性能瓶颈,并且通常需要大量的激光雷达(LiDAR)标注数据,这限制了它们在不同自动驾驶平台上大规模应用的实际可行性。 本论文对基于视觉的 3D 感知技术的发展作出了多方面的贡献。在第一部分,论文介绍了对单目和立体 3D 物体检测算法的结构性改进。通过将地面参考几何先验信息融入单目检测模型,本研究在单目 3D 检测的基准评估中取得了前所未有的精度。与此同时,本文通过将单目网络中的见解和推理结构融入立体 3D 检测模型,进一步优化了立体检测系统的操作效率。 第二部分专注于基于数据驱动的策略及其在 3D 视觉检测中的实际应用。论文提出了一种新颖的训练方案,结合了带有 2D 或 3D 标签的多种数据集。这种方法不仅通过使用大规模扩展的数据集增强了检测模型,还在实际场景中通过利用仅具有 2D 注释的数据集,使得模型部署更加经济。 最后,论文展示了一个创新的管道,旨在实现自动驾驶场景中的无监督深度估计。大量的实证分析验证了该新提出管道的鲁棒性和有效性。综合来看,这些贡献为基于视觉的 3D 感知技术在自动驾驶应用中的广泛采用奠定了坚实的基础。

成为VIP会员查看完整内容
18

相关内容

【NTU博士论文】基于深度生成模型的图像恢复与表示
专知会员服务
19+阅读 · 2025年2月23日
【HKUST博士论文】基于生成模型的高保真图像与视频编辑
【ETHZ博士论文】用于场景生成的3D生成模型
专知会员服务
22+阅读 · 2024年12月12日
【博士论文】高效且有效的基础大型多模态模型学习
专知会员服务
41+阅读 · 2024年10月21日
【系列专题】MAVROS中的坐标转换
无人机之家
30+阅读 · 2019年10月15日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2025年1月30日
Arxiv
176+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
501+阅读 · 2023年3月31日
Arxiv
27+阅读 · 2023年3月17日
VIP会员
最新内容
综述 | 从问答到任务完成:Agent系统与Harness设计
专知会员服务
1+阅读 · 今天16:54
Agentic RL:框架、实践与长程智能体训练
专知会员服务
1+阅读 · 今天16:52
重新思考无人机时代的生存能力
专知会员服务
5+阅读 · 今天7:44
装甲突击旅:现代战争思考、战斗与组织
专知会员服务
4+阅读 · 今天7:28
在人工智能加速决策环境中拓展OODA循环
专知会员服务
4+阅读 · 今天7:18
军事欺骗:供作战战术指挥官使用的工具
专知会员服务
4+阅读 · 今天7:03
综述 | 世界动作模型:少做梦,多行动
专知会员服务
6+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
10+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
5+阅读 · 6月23日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员