深圳Yolo 视觉
深圳
立即加入
词汇表

目标检测

探索物体检测的强大功能--利用YOLO 等尖端模型识别和定位图像或视频中的物体。探索现实世界中的应用!

物体检测是计算机视觉 (CV) 中的一项关键能力,它使软件 物体检测是计算机视觉 (CV) 系统不仅能识别图像所代表的内容,还能在图像中找到特定的物体。而 标准分类法为整个视觉输入分配一个标签,而物体检测则通过预测每个物体周围的边界框,提供更精细的 通过预测每个被识别实体周围的边界框 识别出的实体周围有一个边界框,并附有特定的类别标签和 置信度分数。这项技术是 高级 人工智能(AI)的感官基础,让 机器能够感知、解释复杂的物理世界并与之互动。从工厂的自动质量控制 从工厂的自动质量控制到先进的监控,它都能将非结构化的像素数据转化为可操作的洞察力。

物体探测机制

现代探测器主要依靠 深度学习(DL)架构,特别是 卷积神经网络 (CNN) 来学习空间层次特征。典型的架构包括一个 骨干网,如 ResNet 或 CSPNet,从输入图像中提取基本视觉特征。 从输入图像中提取基本视觉特征。然后,这些特征由一个 检测头对这些特征进行处理。 边界框的坐标和类别成员的概率。

为实现高性能,模型需要在大量标注数据集上进行训练,如 COCO 数据集进行训练。在推理过程中 算法经常会为同一对象生成多个重叠的方框。这些技术包括 非最大抑制(NMS)等技术。 等技术来过滤这些冗余,只保留置信度最高和最佳的方框。 联合交集(IoU)。 地面实况。

模型一般分为两类:

  • 两阶段物体检测器 Faster R-CNN 等系统首先提出感兴趣的区域,然后classify 其classify 。虽然在历史上是准确的、 但计算成本较高。
  • 单级物体探测器 现代架构,包括 Ultralytics YOLO11, 它能一次性预测边界框和类概率。这种方法针对 实时推理进行了优化,在速度和准确性之间实现了理想的 速度和准确性的理想平衡。展望未来,Ultralytics 目前正在开发 YOLO26,旨在进一步提高端到端检测效率。 效率。

与相关简历任务的区别

将物体检测与类似的计算机视觉任务区分开来至关重要。 计算机视觉任务

  • 图像分类 识别图像中的内容(如 "狗"),但不能识别它在哪里或有多少只。
  • 实例分割 与检测一样,它也是对物体进行定位,但它生成的不是一个方框,而是一个像素完美的遮罩,勾勒出物体的 准确的形状。
  • 物体跟踪它将 将检测扩展到时间域,为检测到的物体分配一个唯一的 ID,并跟踪其在视频帧中的轨迹。 视频帧。

实际应用

物体检测是各行各业许多变革性技术背后的引擎。

  • 自主系统:在汽车行业、 自动驾驶汽车利用检测模型 在几毫秒内识别行人、交通标志和其他车辆。该领域的领先企业如 Waymo特斯拉自动驾驶汽车都依靠 在复杂环境中安全导航的能力。
  • 医疗诊断:在 在医疗人工智能领域,检测模型通过突出 X 光片或 CT 扫描中的 放射科医生,在 X 光片或 CT 扫描中突出显示感兴趣的区域,如肿瘤或骨折。组织 美国国立卫生研究院(NIH)等机构正在积极研究如何通过医疗图像分析来减少医疗费用。 医疗图像分析如何减少 诊断错误。
  • 零售分析:商店利用 零售业中的人工智能,实现结账流程自动化和 监控库存。类似于Amazon Go 的系统利用 检测来track 顾客从货架上拿起哪些商品。

实施实例

下面的代码片段演示了如何使用预先训练好YOLO11 模型与 ultralytics 软件包。这个简单的工作流程会加载一个模型,并在图像上运行推理,以识别公交车和人等物体。 公交车和人等物体。

from ultralytics import YOLO

# Load a pretrained YOLO11 model (n-scale for speed)
model = YOLO("yolo11n.pt")

# Run inference on a remote image source
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results with bounding boxes and labels
results[0].show()

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入