深圳Yolo 视觉
深圳
立即加入
词汇表

目标检测

探索物体检测的基础原理。Ultralytics 如何以无与伦比的速度和精度实时识别并定位物体。

目标检测是计算机视觉(CV)领域的一项关键技术,它使计算机系统能够识别并定位视觉数据中的特定物体。与简单的图像分类任务(仅为整张图片分配单一标签)不同,目标检测通过同时预测物体的类别(如"人"、"汽车"、"狗")及其空间位置,提供更精细的理解。 该位置通常通过包围物体的矩形边界框表示,并附带表示模型置信度的置信度分数。这种识别与定位的双重能力构成了现代人工智能应用的感知基础,使机器能够与环境进行有意义的交互。

检测的机制

现代检测器高度依赖深度学习(DL)架构,特别是卷积神经网络(CNN),从输入图像中提取复杂特征。该过程始于训练阶段,模型通过大规模标注数据集(COCO )学习识别模式。在此阶段,算法通过优化模型权重来最小化预测误差。

当模型部署用于推理时,它会扫描新图像以提出潜在目标。随后,高级算法通过非最大抑制(NMS)过滤重复检测结果,确保每个独立实体仅被标注一次。这些预测的准确性通常采用交并比(IoU)指标评估,该指标衡量预测框与真实目标之间的重叠程度。 近期技术突破催生了YOLO26等端到端架构,该架构通过简化处理流程,在边缘设备上实现了卓越的运行速度与实时推理能力。

区分关键术语

区分目标检测与相关概念对于为项目选择合适的工具至关重要:

  • 目标检测与图像分类: 图像分类回答"这张图片里有什么?", 而目标检测回答"什么物体在什么位置?"。
  • 目标检测与实例分割:检测在目标周围绘制边框,而实例分割则精确识别每个物体的像素级轮廓(遮罩)。
  • 目标检测与目标追踪:检测在单帧图像中发现目标。 目标追踪则将这些检测结果贯穿整个视频序列, 以监测目标随时间的运动轨迹。

实际应用

物体检测的多功能性推动着各主要行业的创新发展。在汽车领域,自动驾驶车辆的人工智能系统高度依赖检测模型,能够即时识别行人、交通标志及其他车辆,从而实现安全导航。通过处理车载摄像头传来的视频流,这些系统能在瞬间做出决策,有效预防事故发生。

另一个突出的应用场景出现在零售业的人工智能领域。 自动结账系统和智能库存管理机器人通过物体检测技术扫描货架、识别商品,并detect 短缺或错位商品。这种自动化技术通过确保商品持续供应,有效优化了供应链并提升了客户体验。

实施物体检测

开发人员可以轻松地使用该工具实现检测工作流。 ultralytics Python 。以下示例演示了如何加载预训练模型。 YOLO26 模型 并对图像进行推理。

from ultralytics import YOLO

# Load the latest YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")

# Run inference on an image from a URL
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results with bounding boxes
results[0].show()

对于希望扩展业务规模的团队, Ultralytics 提供了一个全面的环境,用于数据标注、 在云端训练定制模型,并将模型部署为多种格式,例如 ONNXTensorRT。利用此类平台可简化 机器学习运维(MLOps)生命周期,使 工程师能够专注于优化应用程序,而非管理基础设施。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入