深圳尤洛视觉
深圳
立即加入
词汇表

图像分割

了解 Ultralytics YOLO 图像分割的强大功能。 探索像素级精度、类型、应用和真实的 AI 用例。

图像分割是一项基本的计算机视觉 (CV)任务,它涉及将数字图像划分为多个不同的区域或片段。其目标是为图像中的每个像素分配一个特定的标签,从而有效地创建物体和背景的像素级地图。与其他可能用一个简单的框来识别物体位置的CV任务不同,图像分割通过勾勒出每个物体的精确形状,提供更详细的理解。这种精细的细节对于需要深入了解场景几何结构和构成的应用至关重要。该过程是许多高级AI应用的基础。

图像分割的类型

图像分割可以分为三种主要类型,每种类型提供不同级别的细节并服务于不同的目的:

  • 语义分割 此技术将图像中的每个像素分类为预定义的类别,例如“汽车”、“道路”或“天空”。同一对象类的所有实例都分组在单个标签下。例如,在具有多辆汽车的图像中,语义分割会将属于任何汽车的所有像素简单地标记为“汽车”,而不区分一辆汽车与另一辆汽车。
  • 实例分割 此方法在分割的基础上更进一步,不仅对每个像素进行分类,还区分同一类别的各个实例。在同一街道场景中,实例分割会将每辆车识别为唯一对象,为“汽车 1”、“汽车 2”等分配单独的掩码。当需要计数或跟踪单个对象时,这尤其有用。
  • 全景分割: 作为一种混合方法,全景分割结合了语义分割和实例分割的优势。它的目标是通过为每个像素分配一个类别标签(如语义分割),同时唯一地识别每个对象实例(如实例分割),从而创建对场景的完整和统一的理解。这提供了最全面的场景分析。

图像分割与其他计算机视觉任务有何不同

区分图像分割和其他常见的计算机视觉任务非常重要:

  • 图像分类: 专注于为整个图像分配单个标签(例如,“这是一张海滩的照片”)。它了解图像中的内容,但不知道在哪里。
  • 目标检测: 识别并定位图像中的对象,通常通过在它们周围绘制边界框来实现。它告诉你存在哪些对象以及它们的大概位置,但不是它们的精确形状。
  • 图像分割: 通过勾勒出每个对象在像素级别的精确边界来提供最详细的信息,从而精确了解对象的形状和位置。

应用与用例

图像分割的详细输出使其在许多领域都非常宝贵。

  • 自动驾驶汽车为了使自动驾驶汽车能够安全导航,它们需要精确了解其环境。分割模型识别道路、车道、行人、其他车辆和障碍物的确切边界,从而实现更好的路径规划和决策。您可以阅读更多关于人工智能在汽车行业中的作用
  • 医学图像分析: 在医疗保健领域,分割用于分析医学扫描图像,如MRICT扫描。它可以精确地勾勒出肿瘤、器官或异常,帮助医生进行准确的诊断、手术计划和监测疾病进展。这一直是像U-Net这样的架构的关键应用,它在生物医学领域表现出色。
  • 卫星图像分析 分割模型处理卫星图像以监测环境变化,例如森林砍伐或城市化。它们可以对土地覆盖(例如,森林、水域、城市区域)进行分类,并检测建筑物或船舶等单个物体,用于制图和情报收集。
  • 制造业和机器人技术 在自动化工厂中,分割有助于机器人识别传送带上的特定零件以进行组装,或通过高精度检测缺陷来执行质量控制。您可以了解更多关于它在裂缝分割中的应用。

图像分割和Ultralytics YOLO

现代深度学习模型,特别是基于卷积神经网络 (CNN)的模型,是图像分割的标准。Ultralytics YOLO模型,包括YOLOv8和最新的YOLO11,提供高性能、实时的分割能力。 这些模型可以很容易地在标准数据集(如COCO)或用于专门任务的自定义数据集上进行训练。

Ultralytics 框架简化了整个工作流程,从训练模型验证其性能以及部署它以进行推理。有关实践指南,您可以按照关于在 Google Colab 上使用 YOLO11 进行图像分割的教程,或学习如何隔离分割的对象。诸如Ultralytics HUB之类的工具提供了一种无需代码的解决方案,用于管理数据集、使用云资源训练模型以及将其部署到实际应用中

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板