Instance Segmentation
了解实例分割如何实现像素级对象检测。探索如何使用 Ultralytics YOLO26 进行高速、实时的掩码生成等任务。
实例分割是计算机视觉 (CV)领域的一项复杂技术,它能够在像素级别识别并描绘图像中每个感兴趣的不同对象。虽然标准的目标检测通过矩形边界框来定位项目,但实例分割通过为每个检测到的实体生成精确掩码,将分析推向更深层次。这种能力使人工智能 (AI)模型能够区分同一类别的个体对象(例如分离两个重叠的人),从而相比简单的分类方法,提供对视觉场景更丰富、更详细的理解。
Link to this section区分分割类型#
为了充分掌握实例分割的用途,将其与其他相关图像处理任务区分开来是很有帮助的。根据应用需求,每种方法提供的粒度级别各不相同。
- 语义分割: 这种方法将图像中的每个像素分类到一个类别中(例如“道路”、“天空”、“汽车”)。然而,它并不区分同一类别的不同对象。如果三辆车停在一起,语义分割会将它们视为一个单一的“汽车”区域。
- 实例分割: 这种方法将每个对象视为一个独特的实体。它检测单个实例,并为每个实例的像素分配一个唯一的标签。以停放的汽车为例,实例分割将创建三个不同的掩码,分别识别为“汽车 A”、“汽车 B”和“汽车 C”。
- 全景分割: 一种混合方法,结合了语义分割的背景标注和实例分割的可数对象识别。
Link to this section像素级分析的机制#
现代实例分割模型通常依赖于先进的深度学习 (DL) 架构,特别是卷积神经网络 (CNNs)。这些网络从图像中提取特征,以预测对象的类别及其空间轮廓。历史上,像 Mask R-CNN 这样的两阶段架构是标准做法,它们先提出感兴趣区域,然后再将其细化为掩码。
然而,近期的进步推动了像 YOLO26 这样的单阶段检测器的出现,它们可以同时执行检测和分割。这种“端到端”的方法显著提高了实时推理速度,使得在消费级硬件上将高精度分割应用于实时视频流成为可能。
Link to this section实际应用#
实例分割提供的精确边界对于那些需要了解对象确切形状和位置以进行决策的行业来说至关重要。
- 医疗 AI: 在医学诊断中,确定肿瘤或病变的准确大小和形状至关重要。实例分割允许模型以高精度勾勒出 MRI 扫描中的异常情况,协助放射科医生进行治疗计划制定和疾病进展监测。
- 自动驾驶汽车: 自动驾驶汽车依靠分割技术在复杂的环境中导航。利用像 Cityscapes 这样的数据集,车辆可以识别可行驶路面、识别车道标记,并在拥挤的人行横道中分离出单个行人以确保安全。
- 农业 AI: 精准农业使用分割技术来监测作物健康。配备视觉系统的机器人可以识别单个水果进行自动化采摘,或者检测特定的杂草进行针对性的除草剂喷洒,从而减少化学品使用并优化产量。
Link to this section使用 Python 实现分割#
开发者可以使用 ultralytics 库轻松实现实例分割。以下示例演示了如何加载预训练的 YOLO26 模型并为图像生成分割掩码。
from ultralytics import YOLO
# Load a pre-trained YOLO26 instance segmentation model
# The 'n' suffix denotes the nano version, optimized for speed
model = YOLO("yolo26n-seg.pt")
# Run inference on an image
# This predicts classes, bounding boxes, and masks
results = model("https://ultralytics.com/images/bus.jpg")
# Visualize the results
# Displays the image with overlaid segmentation masks
results[0].show()Link to this section挑战与模型训练#
虽然实例分割功能强大,但与简单的边界框检测相比,它对计算要求更高。生成像素完美的掩码需要大量的 GPU 资源和精确的数据标注。为这些任务标注数据涉及在每个对象周围绘制紧密的多边形,这可能非常耗时。
To streamline this process, teams often use tools like the Ultralytics Platform, which offers features for dataset management, auto-annotation, and cloud-based training. This allows developers to fine-tune models on custom data—such as specific industrial parts or biological specimens—and deploy them efficiently to edge AI devices using optimized formats like ONNX or TensorRT.






