探索对象 detect 的基本原理。了解 Ultralytics YOLO26 如何以无与伦比的速度和准确性实时识别和定位对象。
目标检测是计算机视觉 (CV)领域的一项关键技术,它允许计算机系统在视觉数据中识别和定位特定项目。与更简单的图像分类任务(为整张图片分配一个单一标签)不同,目标检测通过同时预测对象的类别(例如“人”、“汽车”、“狗”)及其空间位置,提供了更细粒度的理解。这个位置通常由一个包含对象的矩形边界框表示,并附带一个表示模型确定性的置信度分数。这种识别加定位的双重能力是现代人工智能 (AI)应用的感觉基础,使机器能够有意义地与环境交互。
现代检测器严重依赖 深度学习 (DL) 架构,特别是 卷积神经网络 (CNN),以从输入图像中提取复杂特征。该过程始于 训练阶段,模型在此阶段利用大规模的标注数据集(例如 COCO dataset)学习识别模式。在此阶段,算法会优化其 模型权重 以最小化预测误差。
当模型部署用于 inference 时,它会扫描新图像以提出潜在目标。高级算法随后应用 非极大值抑制 (NMS) 来过滤掉重复的 detect,确保每个独特的实体只被高亮显示一次。这些预测的准确性通常使用 交并比 (IoU) 指标进行评估,该指标衡量预测框与真实框之间的重叠程度。最近的进展催生了像 YOLO26 这样的端到端架构,它简化了这一 pipeline,以在边缘设备上实现卓越的速度和 实时 inference 能力。
区分对象 detect 与相关概念至关重要,以便为项目选择合适的工具:
对象 detect 的多功能性推动了各大行业的创新。在汽车行业,自动驾驶汽车中的人工智能 严重依赖 detect 模型,以实时识别行人、交通标志和其他车辆,从而安全导航。通过处理车载摄像头的视频流,这些系统能够做出瞬间决策,从而防止事故发生。
另一个突出的用例是 零售业中的人工智能。自动化结账系统和智能库存管理机器人利用对象 detect 来扫描货架、识别产品以及 detect 缺货或错放的商品。这种自动化简化了供应链,并通过确保产品始终有货来改善客户体验。
开发人员可以使用 ultralytics python 包。以下示例演示了如何加载预训练的 YOLO26 模型并在图像上执行推理。
from ultralytics import YOLO
# Load the latest YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")
# Run inference on an image from a URL
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results with bounding boxes
results[0].show()
对于希望扩展其运营的团队,Ultralytics Platform 提供了一个全面的环境,用于标注数据、在云端训练自定义模型,并将其部署到各种格式,例如 ONNX 或 TensorRT。利用此类平台可简化 MLOps 生命周期,使工程师能够专注于完善其应用程序,而不是管理基础设施。

开启您的机器学习未来之旅