敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024
词汇表

3D 物体检测

探索三维物体检测:激光雷达、点云和深度学习如何为自动驾驶汽车、机器人和 AR 构建精确的三维边界框。

三维物体检测是一种先进的计算机视觉(CV)技术,用于识别和定位三维空间中的物体。与在平面图像上运行的二维物体检测不同,三维检测提供了关键的深度信息,使系统能够了解物体在真实世界中的大小、位置和方向。这种能力可以实现更深入、更准确的空间感知,这对许多现代人工智能应用来说都是必不可少的。

3D 物体检测如何工作

3D 物体检测系统通常依靠专门的传感器来捕捉周围环境的几何形状。常见的数据源包括

  • LiDAR(光探测与测距)这项技术使用激光脉冲来测量物体的精确距离,从而绘制出详细的三维地图,称为点云。点云是三维空间中数据点的集合,它精确地代表了物体的外部表面。
  • 立体相机:与人类视觉类似,立体相机使用两个或多个镜头从略微不同的角度捕捉图像。通过比较这些图像,系统可以计算深度并创建场景的三维表示。
  • 深度图:深度图可由各种传感器生成,包括立体相机或飞行时间(ToF)相机,并提供每个像素的距离值。

一旦捕捉到这些三维数据,专业的深度学习模型就会对其进行分析,以识别和定位物体。VoxelNetVoteNet等模型旨在处理非结构化点云或体素网格(像素的三维等价物),以预测物体周围的三维边界框

3D 与 2D 物体检测

二维物体检测和三维物体检测的主要区别在于它们所处的空间维度。二维检测是通过一个由 X 和 Y 坐标定义的矩形框来确定物体在平面图像上的位置。但是,它缺乏深度感知,因此很难判断物体的真实大小或距离。例如,在二维图像中,远处的一辆大卡车可能与近处的一辆小汽车大小相同。

三维物体检测通过添加 Z 轴来表示深度,从而克服了这一限制。这样,它不仅能确定物体是什么、在画面中的位置,还能确定物体的距离、物理尺寸以及在三维空间中的方位。虽然这能提供更丰富的环境理解,但也带来了更高的计算成本和更复杂的数据要求。

实际应用

三维物体检测提供的详细空间信息在许多领域都非常宝贵。

  1. 自动驾驶汽车这是最关键的应用之一。Waymo等公司生产的自动驾驶汽车使用激光雷达和摄像头建立周围环境的实时 3D 模型。这样,车辆就能准确探测到其他车辆、行人和骑车人,预测他们的动向并安全导航。
  2. 机器人与自动化:在仓库和生产设施中,机器人利用三维检测技术高精度地识别、抓取和移动物体。它也是增强现实(AR)应用的基础,可将虚拟物体逼真地放置在物理世界中并与之互动。

虽然三维物体检测比二维方法更复杂,也更耗费资源,但其提供精确空间理解的能力使其成为下一代智能系统不可或缺的技术。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板