深圳Yolo 视觉
深圳
立即加入
词汇表

图像分割

探索计算机视觉中的图像 segmentation。了解 Ultralytics YOLO26 如何为实例、语义和全景 segmentation 提供精确的像素级掩码。

图像 segmentation 是计算机视觉 (CV) 中的一种复杂技术,它将数字图像分割成多个像素子组,通常称为图像片段或区域。与为整个图像分配单个标签的标准图像分类不同,segmentation 通过为每个单独的像素分配特定的类别标签,在更精细的粒度级别上分析视觉数据。这个过程创建了一个精确的像素级地图,使人工智能 (AI) 模型不仅能理解存在哪些物体,还能确切了解它们的位置及其具体边界。

像素级分析的机制

为了实现这种高保真理解,分割模型通常利用深度学习 (DL)架构,特别是卷积神经网络 (CNN)。这些网络充当强大的特征提取器,识别边缘、纹理和复杂形状等模式。传统的分割架构,如经典的U-Net,通常采用编码器-解码器结构。编码器压缩输入图像以捕获语义上下文,而解码器重建空间细节以输出最终的分割掩码

现代技术进步催生了实时架构,例如2026年1月发布的YOLO26。这些模型将分割能力直接集成到端到端管道中,从而实现在从云端GPU到边缘设备等各种硬件上的高速处理。

主要分割类型

根据项目的具体目标,开发者通常在三种主要的 segmentation 技术之间进行选择:

  • 语义分割: 这种方法根据像素的类别进行 classify,但不区分同一类别的不同对象。例如,在 卫星图像分析中,所有代表“森林”的像素都将着色为绿色,将整个森林视为一个单一实体。
  • Instance Segmentation: 这种技术识别并分离出感兴趣的独立个体对象。在繁忙的街景中,实例分割会为“汽车A”、“汽车B”和“行人A”生成独特的遮罩,使系统能够计数和track特定实体。这是Ultralytics YOLO26模型家族的核心功能。
  • 全景分割: 一种混合方法,结合了语义分割的覆盖范围和实例分割的精度。它为每个像素分配一个标签,区分无定形的背景元素(如天空和道路),同时唯一地识别可计数的前景对象。

与目标 detect 的区别

将 segmentation 与目标 detect 区分开来至关重要。尽管 detect 算法使用矩形bounding box定位物体,但它们不可避免地会将背景像素包含在该框内。segmentation 通过描绘物体的精确轮廓或多边形,提供更紧密、更准确的表示。这种差异对于机器人抓取等应用至关重要,因为机械臂必须了解物体的精确几何形状才能在不发生碰撞的情况下对其进行操作。

实际应用

图像分割提供的精度推动了各行各业的创新:

  • 医学诊断:医学图像分析领域,segmentation对于勾勒解剖结构至关重要。算法分析 MRI扫描以描绘肿瘤或器官边界,使外科医生能够计算精确体积并以挽救生命的准确性规划手术。
  • 自动驾驶:自动驾驶车辆依赖segmentation以安全导航。通过处理视频流,车辆的计算机可以区分可行驶车道与人行道和障碍物。像SAE International这样的标准组织定义了自动驾驶级别,这需要这种高保真环境感知。
  • 精准农业:农业AI中,分割有助于机器人系统识别作物中的杂草。通过为特定植物叶片生成掩码,自动化喷洒器可以仅针对入侵物种,从而显著减少除草剂的使用量。

使用 YOLO26 实现 segmentation

开发者可以使用以下方法高效实现实例 segmentation ultralytics python 包。以下示例使用了最先进的 YOLO26模型,它在速度和准确性方面都进行了优化。

from ultralytics import YOLO

# Load a pre-trained YOLO26 segmentation model
# 'n' denotes the nano version, optimized for speed
model = YOLO("yolo26n-seg.pt")

# Run inference on an image to generate masks
# The model identifies objects and outlines their shape
results = model("https://ultralytics.com/images/bus.jpg")

# Display the image with segmentation overlays
results[0].show()

为了在自定义任务上实现高性能,团队通常需要整理高质量的训练数据Ultralytics Platform 通过提供使用多边形掩码标注图像、管理数据集和在云端训练模型的工具来简化此过程,从而简化整个机器学习操作 (MLOps)生命周期。OpenCV 等库也常与这些模型一起用于图像预处理和结果掩码的后处理。

让我们一起共建AI的未来!

开启您的机器学习未来之旅