深圳Yolo 视觉
深圳
立即加入
词汇表

实例分割

了解实例分割如何通过像素级精度改进目标检测,从而为 AI 应用启用详细的目标掩码。

实例分割是一种复杂的 计算机视觉 (CV)技术、 定位和划分图像中像素级的单个对象。与 用矩形边界框近似确定物体的位置,而实例分割则不同。 用矩形边界框近似确定物体的位置,而实例 分割则是生成一个精确的遮罩,勾勒出每个不同物体的确切形状。这种细粒度的 这种精细程度使系统能够区分同一类别的多个实例,例如将两辆重叠的汽车或人群中的单个人分开。 汽车或人群中的单个人。 人工智能 (AI) 应用的重要组成部分。

与相关任务的区别

要充分理解实例分割,最好将其与其他基本的计算机视觉任务进行比较。 计算机视觉任务进行比较:

  • 语义分割:这项任务将图像中的每个像素归入一个类别(如 "天空"、"道路"、"人 "等 例如 "天空"、"道路"、"人"),但不区分单个物体。所有属于 "汽车 "类别的所有像素都被归为一类,这意味着它无法区分一辆汽车和另一辆汽车。
  • 物体检测:这项任务检测物体的存在和位置,并将其包围在边界框中。虽然它能区分 例如,汽车 A 与汽车 B),但并不能捕捉到它们的形状或边界。
  • 全景细分:它结合了两方面的优点,既能为每个像素分配类别标签(语义),又能唯一地 识别单个对象实例(实例),从而提供全面的场景理解。

实例分割有效地融合了对象检测的定位功能和像素级 语义分割的精确性。

工作原理

实例分割模型通常采用 深度学习(DL)架构,特别是 卷积神经网络 (CNN) 从图像中提取特征。这一过程通常包括两个并行步骤:

  1. 定位:模型会预测每个物体的类别和边界框坐标。
  2. 掩码生成:同时,模型会在检测到的区域内预测一个二元掩膜、 确定哪些像素属于物体。

Mask R-CNN等早期方法采用两阶段流程,首先 生成区域建议,然后对其进行完善。现代架构,如 Ultralytics YOLO11等现代架构通过在单一阶段执行 检测和分割。这使得 实时推理,从而能够 高速、准确地segment 实时视频流中的物体。

实际应用

实例分割提供的精确边界检测在各行各业都不可或缺:

  • 医学影像分析:在医疗保健领域,准确识别异常的体积和形状至关重要。实例分割用于 在核磁共振成像扫描中划分肿瘤,或在显微镜检查中计算单个细胞,从而帮助进行精确诊断和治疗规划。 显微镜检查中的单个细胞,从而帮助进行精确诊断和治疗规划。
  • 自动驾驶汽车:自动驾驶汽车利用这项技术来理解复杂的道路场景。通过在以下数据集上进行训练 通过在城市景观等数据集上进行训练,车辆可以区分可行驶的路面、行人和其他车辆。 路面、行人和其他车辆,确保即使在拥挤的环境中也能安全导航。
  • 精准农业:农民利用细分技术监测作物健康状况。配备视觉系统的机器人可以识别作物中的个别杂草,以便有针对性地施用除草剂 或引导机械臂收获草莓等水果。 通过识别水果的准确轮廓,引导机械臂收获草莓等水果。
  • 机器人:机器人要与环境互动,例如从垃圾箱中抓取特定物体,必须了解物体的方向和形状。 物体的方向和形状。实例分割可提供成功操纵所需的几何数据。 操作所需的几何数据。

实施实例分割

开发人员可以使用 ultralytics Python 软件包。该库 支持 YOLO11 预训练的模型 COCO 数据集它可以detect 和segment 80 种常见的物体类别。 的功能。

下面是一个简明示例,说明如何加载模型并对图像进行分割:

from ultralytics import YOLO

# Load a pre-trained YOLO11 instance segmentation model
model = YOLO("yolo11n-seg.pt")

# Run inference on an image
# The model predicts classes, boxes, and masks simultaneously
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Visualize the results with masks plotted
results[0].show()

对于希望将其应用于自己数据的用户,该框架支持 在自定义数据集上进行训练,使模型能够学习新的 类。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入