探索物体检测的强大功能--利用YOLO 等尖端模型识别和定位图像或视频中的物体。探索现实世界中的应用!
物体检测是计算机视觉 (CV) 中的一项关键能力,它使软件 物体检测是计算机视觉 (CV) 系统不仅能识别图像所代表的内容,还能在图像中找到特定的物体。而 标准分类法为整个视觉输入分配一个标签,而物体检测则通过预测每个物体周围的边界框,提供更精细的 通过预测每个被识别实体周围的边界框 识别出的实体周围有一个边界框,并附有特定的类别标签和 置信度分数。这项技术是 高级 人工智能(AI)的感官基础,让 机器能够感知、解释复杂的物理世界并与之互动。从工厂的自动质量控制 从工厂的自动质量控制到先进的监控,它都能将非结构化的像素数据转化为可操作的洞察力。
现代探测器主要依靠 深度学习(DL)架构,特别是 卷积神经网络 (CNN) 来学习空间层次特征。典型的架构包括一个 骨干网,如 ResNet 或 CSPNet,从输入图像中提取基本视觉特征。 从输入图像中提取基本视觉特征。然后,这些特征由一个 检测头对这些特征进行处理。 边界框的坐标和类别成员的概率。
为实现高性能,模型需要在大量标注数据集上进行训练,如 COCO 数据集进行训练。在推理过程中 算法经常会为同一对象生成多个重叠的方框。这些技术包括 非最大抑制(NMS)等技术。 等技术来过滤这些冗余,只保留置信度最高和最佳的方框。 联合交集(IoU)。 地面实况。
模型一般分为两类:
将物体检测与类似的计算机视觉任务区分开来至关重要。 计算机视觉任务。
物体检测是各行各业许多变革性技术背后的引擎。
下面的代码片段演示了如何使用预先训练好YOLO11 模型与
ultralytics 软件包。这个简单的工作流程会加载一个模型,并在图像上运行推理,以识别公交车和人等物体。
公交车和人等物体。
from ultralytics import YOLO
# Load a pretrained YOLO11 model (n-scale for speed)
model = YOLO("yolo11n.pt")
# Run inference on a remote image source
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results with bounding boxes and labels
results[0].show()