Object Detection
探索目标检测的基础知识。学习 Ultralytics YOLO26 如何以无与伦比的速度和精度实时识别并定位对象。
目标检测是计算机视觉 (CV)领域的一项关键技术,它使计算机系统能够识别并定位视觉数据中的特定项目。与为整张图片分配单一标签的简单图像分类任务不同,目标检测通过同时预测对象的类别(例如“人”、“汽车”、“狗”)及其空间位置,提供了细粒度的理解。这种位置通常由包含对象的矩形边界框表示,并附有指示模型确定性的置信度分数。这种兼具识别与定位的双重能力,构成了现代人工智能 (AI)应用的感知基础,使机器能够与环境进行有意义的交互。
Link to this section检测机制#
现代检测器高度依赖深度学习 (DL)架构,特别是卷积神经网络 (CNNs)来从输入图像中提取复杂特征。该过程始于训练阶段,模型通过学习海量标注数据集(如COCO dataset)来识别模式。在此阶段,算法会优化其模型权重以最小化预测误差。
当模型部署用于推理时,它会扫描新图像以提出潜在对象。先进的算法随后应用非极大值抑制 (NMS)来过滤掉重复检测,确保每个不同的实体只被突出显示一次。这些预测的准确性通常使用交并比 (IoU)指标进行评估,该指标衡量预测框与真实标注之间的重叠程度。近期的进展带来了诸如YOLO26等端到端架构,这些架构简化了流水线,在边缘设备上实现了卓越的速度和实时推理能力。
Link to this section区分关键术语#
为了给项目选择合适的工具,区分目标检测与相关概念至关重要:
- 目标检测与图像分类: 虽然图像分类回答的是“这张图里有什么?”,但目标检测回答的是“什么东西在什么位置?”。
- 目标检测与实例分割: 检测围绕项目绘制一个框。相比之下,实例分割识别每个对象精确到像素级的轮廓(掩码)。
- 目标检测与目标追踪: 检测是在单帧中查找对象。目标追踪则是在视频序列中关联这些检测结果,以监测随时间推移的运动情况。
Link to this section实际应用#
目标检测的多功能性推动了各主要行业的创新。在汽车领域,自动驾驶汽车中的 AI 关键依赖检测模型来即时识别行人、交通标志和其他车辆,从而安全导航。通过处理车载摄像头的视频流,这些系统能够做出预防事故的瞬时决策。
另一个显著的应用案例见于零售业中的 AI。自动化结账系统和智能库存管理机器人利用目标检测扫描货架、识别产品,并检测库存短缺或放错位置的商品。这种自动化简化了供应链,并通过确保产品始终可用,提升了客户体验。
Link to this section实施目标检测#
开发者可以使用 ultralytics Python 包轻松实施检测工作流。以下示例演示了如何加载预训练的 YOLO26 模型并对图像进行推理。
from ultralytics import YOLO
# Load the latest YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")
# Run inference on an image from a URL
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results with bounding boxes
results[0].show()对于寻求扩展业务的团队,Ultralytics Platform 提供了一个综合环境,用于标注数据、在云端训练自定义模型,并将其部署为 ONNX 或 TensorRT 等多种格式。利用此类平台可以简化 MLOps 生命周期,让工程师能够专注于改进应用,而不是管理基础设施。






