术语表

图像分割

使用 Ultralytics YOLO 探索图像分割的强大功能。探索像素级精度、类型、应用和真实的人工智能使用案例。

图像分割是一项基本的计算机视觉(CV)任务,涉及将数字图像分割成多个不同的区域或片段。其目的是为图像中的每个像素分配一个特定的标签,从而有效地创建一个像素级的物体和背景地图。其他 CV 任务可能会用一个简单的方框来识别物体的位置,而图像分割则不同,它通过勾勒出每个物体的精确形状来提供更详细的理解。对于需要深入了解场景几何和构成的应用来说,这种细粒度的细节至关重要。这一过程是许多高级人工智能应用的基础。

图像分割类型

图像分割可分为三种主要类型,每种类型都能提供不同程度的细节并满足不同的目的:

  • 语义分割这种技术将图像中的每个像素归入一个预定义的类别,如 "汽车"、"道路 "或 "天空"。同一对象类别的所有实例都被归入一个标签下。例如,在一张有多辆汽车的图像中,语义分割技术会将属于任何一辆汽车的所有像素都简单地标记为 "汽车",而不会将一辆汽车与另一辆汽车区分开来。
  • 实例分割这种方法不仅能对每个像素进行分类,还能区分同一类别中的各个实例,从而将分割技术向前推进了一步。在同一个街道场景中,实例分割法会将每辆车识别为一个独特的对象,为 "车 1"、"车 2 "等分别分配一个掩码。这在需要对单个物体进行计数或跟踪时特别有用。
  • 全景分割作为一种混合方法,全景分割结合了语义分割和实例分割的优势。它的目的是通过为每个像素分配一个类别标签(如语义分割),同时唯一识别每个对象实例(如实例分割),从而建立对场景的完整统一的理解。这提供了最全面的场景分析。

图像分割与其他简历任务的区别

必须将图像分割与其他常见的计算机视觉任务区分开来:

  • 图像分类侧重于为整幅图像指定一个标签(例如,"这是一张海滩照片")。它能理解图像中的内容,但不知道在哪里。
  • 物体检测识别并定位图像中的物体,通常是在物体周围画一个边界框。它能告诉你有哪些物体以及它们的大致位置,但不能告诉你它们的确切形状。
  • 图像分割:通过在像素级别勾勒出每个物体的准确边界,提供最详细的信息,从而精确了解物体的形状和位置。

应用和用例

图像分割的详细输出结果使其在众多领域都具有重要价值。

  • 自动驾驶汽车自动驾驶汽车要想安全导航,就必须准确了解周围环境。分段模型可以识别道路、车道、行人、其他车辆和障碍物的准确边界,从而更好地规划路径和做出决策。您可以阅读有关人工智能在汽车行业中的作用的更多信息。
  • 医学图像分析在医疗保健领域,分割技术用于分析核磁共振成像CT 扫描等医学扫描图像。它可以精确地勾勒出肿瘤、器官或异常部位的轮廓,帮助医生准确诊断、制定手术计划和监测疾病进展。这一直是U-Net 等架构的关键应用,U-Net 在生物医学领域表现出色。
  • 卫星图像分析分割模型处理卫星图像以监测环境变化,如森林砍伐或城市化。它们可以对土地覆盖(如森林、水域、城市区域)进行分类,并探测建筑物或船只等单个物体,用于制图和情报收集
  • 制造和机器人技术在自动化工厂中,分割技术可帮助机器人识别传送带上的特定部件进行组装,或通过高精度检测缺陷来执行质量控制。您可以了解其在裂缝分割中的更多应用。

图像分割和超级分析 YOLO

现代深度学习模型,尤其是基于卷积神经网络(CNN)的模型,是图像分割的标准。Ultralytics YOLO模型(包括YOLOv8和最新的YOLO11)可提供高性能的实时分割功能。这些模型可以在COCO等标准数据集或用于特殊任务的自定义数据集上轻松训练。

Ultralytics 框架简化了整个工作流程,从训练模型验证 模型性能,再到部署模型进行推理。要获得实践指南,您可以关注谷歌 Colab 上的 YOLO11 图像分割教程,或学习如何分离分割对象Ultralytics HUB等工具为管理数据集、利用云资源训练模型以及将模型部署到实际应用中提供了无代码解决方案。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、合作和成长

立即加入
链接复制到剪贴板