遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

3D Object Detection

探索 3D 目标检测以掌握 AI 中的空间感知能力。了解 Ultralytics YOLO26 如何助力实现现实世界中的深度、方向和 3D 边界框估计。

3D 对象检测是一项复杂的计算机视觉任务,旨在让机器能够识别、定位并确定三维空间中对象的大小。与传统的 2D 对象检测(即在图像中的项目周围绘制一个平面的 边界框)不同,3D 对象检测会估算一个包裹该对象的长方体(3D 框)。这提供了关键的深度信息、方向(航向)和精确的空间维度,使系统不仅能理解对象是什么,还能理解其相对于现实世界中传感器的确切位置。对于需要与其环境进行物理交互的技术而言,此功能至关重要。

Link to this section3D 对象检测的工作原理#

为了感知深度和体积,3D 检测模型通常依赖比标准相机提供的数据更丰富的数据输入。虽然一些先进的方法可以从单目(单镜头)图像中推断出 3D 结构,但大多数强大的系统会利用来自 LiDAR 传感器、雷达或立体相机的输入数据。这些传感器会生成 点云——即代表对象外表面的海量数据点集合。

该过程包含几个关键步骤:

  • 数据采集: 传感器捕捉场景的几何结构。例如,LiDAR 使用激光脉冲测量距离,从而创建精确的 3D 地图。
  • 特征提取: 深度学习模型(通常基于 卷积神经网络 (CNN) 或 Transformer)会处理点云或融合后的图像数据以识别模式。
  • 边界框预测: 模型输出一个 3D 边界框,该框由其中心坐标 (x, y, z)、尺寸(长、宽、高)和旋转角度(偏航角)定义。
  • 分类:图像分类 类似,系统会为检测到的对象分配一个标签(例如“行人”、“车辆”)。

Link to this section2D 与 3D 检测之间的区别#

区分这两个相关概念非常重要。

  • 2D 对象检测: 在平面图像(像素)上运行。它能告诉你一个对象位于帧的“左上角”或“右下角”,但在没有参考标记的情况下无法有效判断距离或现实世界的尺寸。它非常适合诸如 识别制造缺陷 或分析深度不那么关键的视频流等任务。
  • 3D 对象检测: 在体积空间(体素或点)中运行。它提供距离相机的距离(深度)、对象的物理尺寸及其方向。这对于在动态环境中防止碰撞至关重要。

Link to this section实际应用#

从 2D 到 3D 感知的转变,在那些安全性和空间意识至关重要的行业中开启了强大的应用场景。

  • 自动驾驶: 自动驾驶汽车严重依赖 3D 检测来安全导航。通过处理来自 LiDAR 和相机的数据,车辆可以检测到其他车辆、行人和障碍物,并计算出它们的确切距离和速度。这使得感知系统能够在 实时推理 场景中预测轨迹并做出刹车或转向决策。像 Waymo 这样的公司会利用这些强大的传感器套件来实时绘制城市环境地图。
  • 机器人与料箱拣选: 在物流和仓储领域,机器人需要从料箱中拣选各种形状和尺寸的对象。3D 检测使机器人手臂能够理解包装的方向、确定最佳抓取点,并规划出一条无碰撞的移动路径。通过自动化复杂的体力任务,这增强了 AI 在物流领域 的效率。

Link to this section使用 Ultralytics 实现对象检测#

虽然完整的 3D 检测通常需要专门的点云架构,但现代 2D 检测器(如 YOLO26)正越来越多地被用作伪 3D 工作流程的一部分,或者用于通过边界框缩放来估算深度。对于希望在自己的数据集上训练模型的开发者而言,Ultralytics 平台 提供了一个简化的标注和训练环境。

下面是一个如何使用 Ultralytics Python API 运行标准检测的简单示例,这通常是更大型感知流水线的第一步:

import cv2
from ultralytics import YOLO

# Load the YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")

# Perform inference on a local image
results = model("path/to/image.jpg")

# Visualize the results
for result in results:
    # Plot predictions on the image (returns a numpy array)
    im_array = result.plot()

    # Display using OpenCV
    cv2.imshow("Detections", im_array)
    cv2.waitKey(0)  # Press any key to close
    cv2.destroyAllWindows()

Link to this section挑战与未来趋势#

尽管 3D 对象检测很有用,但它在计算成本和传感器费用方面仍面临挑战。处理点云中的数百万个点需要大量的 GPU 算力,这使得在边缘设备上的部署变得困难。然而,模型量化 和高效神经网络架构方面的创新正在减轻这一负担。

此外,传感器融合等技术正在通过结合相机的丰富色彩信息与 LiDAR 的精确深度数据来提高准确性。随着这些技术的成熟,我们可以预见 3D 感知将被集成到更多可访问的设备中,从 增强现实眼镜 到智能家居电器。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅