探索计算机视觉中的图像分割技术。了解Ultralytics 如何为实例分割、语义分割和全局分割提供精确的像素级遮罩。
图像分割是计算机视觉(CV)中一项复杂的技术,涉及将数字图像划分为多个像素子组,通常称为图像分割或区域。与标准图像分类不同——后者仅为整张图像分配单一标签——分割技术通过为每个像素赋予特定类别标签,实现更精细的视觉数据分析。该过程生成精确的像素级映射图,使人工智能(AI)模型不仅能识别物体存在,更能精准定位物体位置并确定其具体边界。
为实现这种高保真理解,分割模型通常采用深度学习(DL)架构,特别是卷积神经网络(CNN)。这类网络作为强大的特征提取器,能识别边缘、纹理和复杂形状等模式。传统分割架构(如经典的U-Net)常采用编码器-解码器结构:编码器通过压缩输入图像来捕捉语义上下文,解码器则重建空间细节以输出最终分割掩膜。 U-Net,常采用编码器-解码器结构。编码器 压缩输入图像以捕捉语义上下文,解码器则重建空间细节以输出 最终分割掩膜。
现代技术进步催生了实时架构,例如 2026年1月发布的YOLO26。这些模型将 分割能力直接集成到端到端管道中,支持在各类硬件上实现高速处理, 从云端GPU到边缘设备皆可运行。
根据项目的具体目标,开发人员通常会在三种主要细分技术中进行选择:
区分分割与目标检测至关重要。检测算法通过矩形边界框定位物体时,不可避免地会将背景像素包含在框内。 分割技术通过追踪物体的精确轮廓或多边形,提供更紧密、更准确的表示。这种差异对机器人抓取等应用至关重要——机械臂必须掌握物品的精确几何形状,才能在操作时避免碰撞。
图像分割技术所提供的精准度正推动着各行各业的创新:
开发者可通过该方法高效实现实例分割。 ultralytics Python 。
以下示例使用了最先进的 YOLO26模型该算法在速度和准确性方面都经过了优化。
from ultralytics import YOLO
# Load a pre-trained YOLO26 segmentation model
# 'n' denotes the nano version, optimized for speed
model = YOLO("yolo26n-seg.pt")
# Run inference on an image to generate masks
# The model identifies objects and outlines their shape
results = model("https://ultralytics.com/images/bus.jpg")
# Display the image with segmentation overlays
results[0].show()
为在定制任务中实现高性能,团队通常需要精心挑选高质量的训练数据。Ultralytics 通过提供多边形遮罩图像标注工具、数据集管理功能以及云端模型训练服务,简化了这一流程,从而优化了整个机器学习运维(MLOps)生命周期。诸如OpenCV之类的库... OpenCV 常与这些模型配合使用,用于图像预处理及生成的遮罩后处理。