敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024
词汇表

实例分割

了解实例分割如何通过像素级精度改进目标检测,从而为 AI 应用启用详细的目标掩码。

实例分割是一项高级的 计算机视觉 (CV) 任务,它在像素级别识别和描绘图像中的各个对象。与其他视觉任务不同,它不仅仅是分类图像或在对象周围绘制 边界框;相反,它为每个不同的对象实例生成一个精确的像素级掩码。这种技术提供了对场景更深入的理解,因为它可以区分同一类别的重叠对象。

实例分割 vs. 语义分割和对象检测

区分实例分割与其他相关的计算机视觉任务非常重要。

  • 目标检测: 此任务识别对象的存在和位置,通常通过在对象周围绘制矩形边界框并分配类别标签来实现。 它回答“图像中有什么以及它在哪里?”但未提供形状信息。
  • 语义分割: 此任务将图像中的每个像素分类为特定类别。例如,它会将属于汽车的所有像素标记为“汽车”,但不会区分图像中的两辆不同的汽车。它回答“每个像素属于哪个类别?”
  • 实例分割: 这结合了对象检测和语义分割的功能。它检测每个对象实例并为其生成唯一的分割掩码。在具有三辆汽车的图像中,实例分割将输出三个单独的掩码,每个掩码对应于一辆特定的汽车。
  • 全景分割(Panoptic Segmentation):这是分割任务中最全面的方法,它融合了语义分割和实例分割。它为每个像素分配一个类别标签和一个唯一的实例 ID,从而提供对场景的完整、统一的理解。

实例分割的工作原理

实例分割模型通常执行两个主要功能:首先,它们检测图像中的所有对象实例;其次,它们为每个检测到的实例生成一个分割掩码。这个过程因 Mask R-CNN 等架构而闻名,它通过添加一个并行分支来扩展 Faster R-CNN 等对象检测器,该分支预测每个感兴趣区域的二元掩码。现代模型进一步改进了这个过程,以获得更好的速度和准确性,从而在许多应用中实现 实时推理。开发通常依赖于强大的 深度学习 框架,如 PyTorchTensorFlow

实际应用

实例分割提供的详细对象轮廓在许多领域都很有价值。

  • 自动驾驶汽车: 自动驾驶汽车依赖于实例分割来精确定位和识别单个行人、车辆和骑自行车者的形状和位置。这种精细的细节对于安全导航和路径规划至关重要,尤其是在具有许多重叠物体的复杂城市环境中。诸如Cityscapes之类的数据集在推动该领域的发展方面发挥了重要作用。
  • 医学影像分析: 在放射学中,实例分割用于以高精度描绘 CT 或 MRI 扫描中的肿瘤、病变和器官。这有助于医生测量肿瘤的大小、计划手术和监测治疗效果。您可以在我们关于使用 YOLO11 进行肿瘤检测的博客文章中了解更多信息。
  • 机器人技术: 机器人使用实例分割来理解其环境,识别要抓取的特定物体,并以更高的精度避开障碍物。这对于制造业物流业的任务至关重要。
  • 卫星图像分析: 这项技术用于计算森林中的单棵树木,绘制城市中的建筑物地图,或利用NASA等组织的数据跟踪土地利用随时间的变化。
  • 农业 它可以用于识别和计数单个水果以进行产量估计,或检测特定杂草以进行有针对性的除草剂施用,这是精准农业的关键部分。

使用 Ultralytics YOLO 进行实例分割

Ultralytics 提供能够执行高效实例分割的先进模型。诸如 YOLOv8 和最新的 YOLO11 等模型旨在为各种视觉任务(包括实例分割)提供高性能。您可以在我们的分割任务文档中找到更多详细信息。用户可以利用预训练模型或使用 Ultralytics HUB 平台等工具在自定义 数据集(如 COCO)上执行微调,从而简化从数据管理到模型部署机器学习 (ML) 工作流程。对于实际应用,可以使用我们的 使用预训练的 Ultralytics YOLOv8 模型进行分割 教程或我们的 隔离分割对象 指南等资源。您还可以学习 如何使用 Ultralytics YOLO11 进行实例分割

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板