了解实例分割如何通过像素级精度改进目标检测,从而为 AI 应用启用详细的目标掩码。
实例分割是一种复杂的 计算机视觉 (CV)技术、 定位和划分图像中像素级的单个对象。与 用矩形边界框近似确定物体的位置,而实例分割则不同。 用矩形边界框近似确定物体的位置,而实例 分割则是生成一个精确的遮罩,勾勒出每个不同物体的确切形状。这种细粒度的 这种精细程度使系统能够区分同一类别的多个实例,例如将两辆重叠的汽车或人群中的单个人分开。 汽车或人群中的单个人。 人工智能 (AI) 应用的重要组成部分。
要充分理解实例分割,最好将其与其他基本的计算机视觉任务进行比较。 计算机视觉任务进行比较:
实例分割有效地融合了对象检测的定位功能和像素级 语义分割的精确性。
实例分割模型通常采用 深度学习(DL)架构,特别是 卷积神经网络 (CNN) 从图像中提取特征。这一过程通常包括两个并行步骤:
Mask R-CNN等早期方法采用两阶段流程,首先 生成区域建议,然后对其进行完善。现代架构,如 Ultralytics YOLO11等现代架构通过在单一阶段执行 检测和分割。这使得 实时推理,从而能够 高速、准确地segment 实时视频流中的物体。
实例分割提供的精确边界检测在各行各业都不可或缺:
开发人员可以使用 ultralytics Python 软件包。该库
支持 YOLO11 预训练的模型
COCO 数据集它可以detect 和segment 80 种常见的物体类别。
的功能。
下面是一个简明示例,说明如何加载模型并对图像进行分割:
from ultralytics import YOLO
# Load a pre-trained YOLO11 instance segmentation model
model = YOLO("yolo11n-seg.pt")
# Run inference on an image
# The model predicts classes, boxes, and masks simultaneously
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Visualize the results with masks plotted
results[0].show()
对于希望将其应用于自己数据的用户,该框架支持 在自定义数据集上进行训练,使模型能够学习新的 类。

