深圳Yolo 视觉
深圳
立即加入
词汇表

图像分割

探索计算机视觉中的图像分割技术。了解Ultralytics 如何为实例分割、语义分割和全局分割提供精确的像素级遮罩。

图像分割是计算机视觉(CV)中一项复杂的技术,涉及将数字图像划分为多个像素子组,通常称为图像分割或区域。与标准图像分类不同——后者仅为整张图像分配单一标签——分割技术通过为每个像素赋予特定类别标签,实现更精细的视觉数据分析。该过程生成精确的像素级映射图,使人工智能(AI)模型不仅能识别物体存在,更能精准定位物体位置并确定其具体边界

像素级分析的机制

为实现这种高保真理解,分割模型通常采用深度学习(DL)架构,特别是卷积神经网络(CNN)。这类网络作为强大的特征提取器,能识别边缘、纹理和复杂形状等模式。传统分割架构(如经典的U-Net)常采用编码器-解码器结构:编码器通过压缩输入图像来捕捉语义上下文,解码器则重建空间细节以输出最终分割掩膜。 U-Net,常采用编码器-解码器结构。编码器 压缩输入图像以捕捉语义上下文,解码器则重建空间细节以输出 最终分割掩膜

现代技术进步催生了实时架构,例如 2026年1月发布的YOLO26。这些模型将 分割能力直接集成到端到端管道中,支持在各类硬件上实现高速处理, 从云端GPU到边缘设备皆可运行。

主要细分类型

根据项目的具体目标,开发人员通常会在三种主要细分技术中进行选择:

  • 语义分割 该方法根据像素类别进行分类,但不区分同一类别的独立对象。例如在卫星图像分析中,所有代表"森林"的像素都会被标记为绿色,将整个森林视为单一实体。
  • 实例分割 该技术可识别并分离出不同的目标个体。在繁忙的街道场景中,实例分割会为"汽车A"、"汽车B"和"行人A"生成独立的遮罩, 使系统能够track 实体进行计数和track 。Ultralytics 家族的核心功能。
  • 全景分割一种 融合语义分割覆盖率与实例分割精度的混合方法。它 为每个像素分配标签,既能区分无定形背景元素(如天空与道路),又能唯一标识可计数的前景物体。

与目标检测的区别

区分分割与目标检测至关重要。检测算法通过矩形边界框定位物体时,不可避免地会将背景像素包含在框内。 分割技术通过追踪物体的精确轮廓或多边形,提供更紧密、更准确的表示。这种差异对机器人抓取等应用至关重要——机械臂必须掌握物品的精确几何形状,才能在操作时避免碰撞。

实际应用

图像分割技术所提供的精准度正推动着各行各业的创新:

  • 医学诊断:医学影像分析领域,分割技术对于勾勒解剖结构至关重要。算法通过分析MRI扫描图像来界定肿瘤或器官边界,使外科医生能够精确计算体积并制定手术方案,以挽救生命的精准度实施治疗。
  • 自动驾驶:无人驾驶车辆依赖场景分割技术实现安全导航。通过处理视频流,车辆计算机能够区分可通行车道与人行道及障碍物。国际汽车工程师学会等标准组织定义的自动驾驶等级体系,均要求具备这种高保真环境感知能力。
  • 精准农业: 在农业人工智能领域,分割技术助力机器人系统识别作物中的杂草。通过为特定植物叶片生成遮罩,自动喷洒设备可精准定位入侵物种,大幅减少除草剂用量。

使用YOLO26实现分割

开发者可通过该方法高效实现实例分割。 ultralytics Python 。 以下示例使用了最先进的 YOLO26模型该算法在速度和准确性方面都经过了优化。

from ultralytics import YOLO

# Load a pre-trained YOLO26 segmentation model
# 'n' denotes the nano version, optimized for speed
model = YOLO("yolo26n-seg.pt")

# Run inference on an image to generate masks
# The model identifies objects and outlines their shape
results = model("https://ultralytics.com/images/bus.jpg")

# Display the image with segmentation overlays
results[0].show()

为在定制任务中实现高性能,团队通常需要精心挑选高质量的训练数据Ultralytics 通过提供多边形遮罩图像标注工具、数据集管理功能以及云端模型训练服务,简化了这一流程,从而优化了整个机器学习运维(MLOps)生命周期。诸如OpenCV之类的库... OpenCV 常与这些模型配合使用,用于图像预处理及生成的遮罩后处理。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入