术语表

语义分割

探索语义分割的强大功能--分类图像中的每个像素,精确理解场景。立即探索应用和工具!

语义分割是一项基本的计算机视觉任务,它涉及为图像中的每个像素分配特定的类别标签。其他方法可能会用方框来识别物体,或为整个图像指定一个标签,而语义分割则不同,它能为不同的语义类别创建一个密集的、像素完美的地图。这就提供了对图像内容丰富而详细的理解,勾勒出每个类别(如 "道路"、"天空"、"建筑 "或 "人物")的确切形状和位置。在一些场景中,理解背景和布局与识别单个物体同样重要,因此这是一项核心技术。

模型和工具

语义分割通常采用深度学习模型,特别是源自卷积神经网络(CNN)的架构。

实际应用

语义分割提供的详细场景理解在许多领域都至关重要:

  • 自动驾驶汽车:自动驾驶汽车要想安全导航,就必须完全了解周围环境。语义分割用于以像素级的精度识别可驾驶区域(道路)、不可驾驶区域(人行道、建筑物)以及行人、骑自行车者和其他车辆的位置。这使得路径规划和决策更加安全。您可以阅读有关人工智能在自动驾驶汽车中的作用的更多信息。
  • 医学图像分析:在医学领域,精确性至关重要。语义分割有助于自动划分核磁共振成像和 CT 扫描等扫描图像中的器官、肿瘤、病变和其他解剖结构。这有助于放射科医生进行诊断、制定治疗计划和监测疾病进展。进一步了解人工智能在医学成像中的应用
  • 卫星图像分析:在地理空间应用中,语义分割用于对卫星图像中的土地覆盖进行分类。这可用于城市规划(识别建筑物、道路和绿地)、环境监测(跟踪森林砍伐或水体)和精准农业
  • 机器人机器人利用语义分割来了解其工作环境,从而能够区分地面、墙壁、需要互动的物体和需要避开的障碍物。这对于在仓库或家庭等复杂环境中执行导航和操纵任务至关重要。进一步了解计算机视觉与机器人技术的结合

与其他任务的主要区别

必须将语义分割与相关的计算机视觉任务区分开来:

  • 实例分割这是最密切相关的任务。虽然两者都执行像素级分类,但实例分割更进一步,可以区分同一对象类别的各个实例。例如,在一张有三辆汽车的图像中,语义分割会将所有汽车像素简单标记为 "汽车"。相比之下,实例分割会将 "汽车 1"、"汽车 2 "和 "汽车 3 "识别为独立的对象。
  • 物体检测这项任务通过在每个物体周围画一个边框并指定一个类别标签,来识别图像中物体的存在和位置。它不提供有关物体形状或哪些像素属于该物体的信息。
  • 全景分割这项任务可视为语义分割和实例分割的统一。其目的是通过为每个像素分配一个类别标签(如语义分割),同时唯一识别每个对象实例(如实例分割),从而提供全面的场景理解。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、合作和成长

立即加入
链接复制到剪贴板