图像分割
使用 Ultralytics YOLO 探索图像分割的强大功能。探索像素级精度、类型、应用和真实的人工智能使用案例。
图像分割是一项基本的计算机视觉(CV)任务,涉及将数字图像分割成多个不同的区域或片段。其目的是为图像中的每个像素分配一个特定的标签,从而有效地创建一个像素级的物体和背景地图。其他 CV 任务可能会用一个简单的方框来识别物体的位置,而图像分割则不同,它通过勾勒出每个物体的精确形状来提供更详细的理解。对于需要深入了解场景几何和构成的应用来说,这种细粒度的细节至关重要。这一过程是许多高级人工智能应用的基础。
图像分割类型
图像分割可分为三种主要类型,每种类型都能提供不同程度的细节并满足不同的目的:
- 语义分割:这种技术将图像中的每个像素归入一个预定义的类别,如 "汽车"、"道路 "或 "天空"。同一对象类别的所有实例都被归入一个标签下。例如,在一张有多辆汽车的图像中,语义分割技术会将属于任何一辆汽车的所有像素都简单地标记为 "汽车",而不会将一辆汽车与另一辆汽车区分开来。
- 实例分割:这种方法不仅能对每个像素进行分类,还能区分同一类别中的各个实例,从而将分割技术向前推进了一步。在同一个街道场景中,实例分割法会将每辆车识别为一个独特的对象,为 "车 1"、"车 2 "等分别分配一个掩码。这在需要对单个物体进行计数或跟踪时特别有用。
- 全景分割:作为一种混合方法,全景分割结合了语义分割和实例分割的优势。它的目的是通过为每个像素分配一个类别标签(如语义分割),同时唯一识别每个对象实例(如实例分割),从而建立对场景的完整统一的理解。这提供了最全面的场景分析。
图像分割与其他简历任务的区别
必须将图像分割与其他常见的计算机视觉任务区分开来:
- 图像分类:侧重于为整幅图像指定一个标签(例如,"这是一张海滩照片")。它能理解图像中的内容,但不知道在哪里。
- 物体检测:识别并定位图像中的物体,通常是在物体周围画一个边界框。它能告诉你有哪些物体以及它们的大致位置,但不能告诉你它们的确切形状。
- 图像分割:通过在像素级别勾勒出每个物体的准确边界,提供最详细的信息,从而精确了解物体的形状和位置。
应用和用例
图像分割的详细输出结果使其在众多领域都具有重要价值。
- 自动驾驶汽车:自动驾驶汽车要想安全导航,就必须准确了解周围环境。分段模型可以识别道路、车道、行人、其他车辆和障碍物的准确边界,从而更好地规划路径和做出决策。您可以阅读有关人工智能在汽车行业中的作用的更多信息。
- 医学图像分析:在医疗保健领域,分割技术用于分析核磁共振成像或CT 扫描等医学扫描图像。它可以精确地勾勒出肿瘤、器官或异常部位的轮廓,帮助医生准确诊断、制定手术计划和监测疾病进展。这一直是U-Net 等架构的关键应用,U-Net 在生物医学领域表现出色。
- 卫星图像分析:分割模型处理卫星图像以监测环境变化,如森林砍伐或城市化。它们可以对土地覆盖(如森林、水域、城市区域)进行分类,并探测建筑物或船只等单个物体,用于制图和情报收集。
- 制造和机器人技术:在自动化工厂中,分割技术可帮助机器人识别传送带上的特定部件进行组装,或通过高精度检测缺陷来执行质量控制。您可以了解其在裂缝分割中的更多应用。