深圳Yolo 视觉
深圳
立即加入
词汇表

U-Net

探索 U-Net,这是一种用于语义分割的强大 CNN 架构。了解它在医疗、卫星和自动成像领域的应用。

U-Net 是一种专门的架构,用于 卷积神经网络(CNN) 设计用于执行精确的像素级分类,即 语义分割.传统的分类模型会给整个图像分配一个标签,而 U-Net 则不同,它能预测每个像素的类别,并创建详细的地图,勾勒出物体的确切形状和位置。 不同的是,U-Net 可预测每个像素的类别,从而绘制出详细的地图,勾勒出物体的确切形状和位置。U-Net 最初是为 U-Net 最初是为生物医学图像分析而开发的,如今已成为图像分类领域的基础结构。 计算机视觉(CV)由于其 能在有限的 训练数据同时产生 高分辨率的结果。

U 型建筑

U 型网络 "的名称源于其对称的 U 型图,它修改了标准的 自动编码器设计。该架构 由三个主要部分组成,它们协同提取特征,并通过详细的 分割掩码。

  • 收缩路径(编码器):U "的左侧是传统的 CNN 骨干网.它重复应用 卷积和池化操作 逐步缩小图像的空间维度。这一过程被称为 降采样增加了 特征图增加每层的特征图数量、 这样,模型就能学习到图像中 "有什么 "的复杂、高级上下文。
  • 扩展路径(解码器):结构的右侧与编码器相似,但执行反向操作。 反向操作。它使用上卷积层将特征的分辨率提高到原 输入大小。这 上采样步骤对于 将上下文传播到分辨率更高的层,帮助网络理解物体的 "位置"。 物体的位置。
  • 跳过连接:U-Net 的创新之处在于使用了 跳转连接.这些连接将收缩路径中的高分辨率特征图直接连接到扩展路径中的相应图层。 扩展路径中的相应层。这种机制保留了细粒度的空间信息,而这些信息通常会在下采样过程中丢失。 这种机制保留了通常在下采样过程中丢失的细粒度空间信息,从而能够生成清晰、准确的边界。

实际应用

开创性论文《U-Net》介绍了 U-Net "U-Net:用于生物医学图像分割的卷积网络 "一文中介绍了 U-Net。 此后,U-Net 被广泛应用于需要精确 定位.

医学图像分析

在医疗保健领域,精度至关重要。U-Net 广泛应用于 医学图像分析以 自动检测异常。例如,它通过分割核磁共振成像扫描中的肿瘤或计算显微镜图像中的单个细胞来协助放射科医生的工作流程。 扫描中的肿瘤进行分割,或对显微镜图像中的单个细胞进行计数,从而协助放射科医生的工作流程,推动医学图像分析领域的进步。 人工智能在医疗保健领域的应用.

地理空间和卫星监测

该架构对以下方面也至关重要 分析卫星图像.U-Net 模型可以segment 土地覆被类型--区分水域、森林和城市地区--以track 森林砍伐或监测作物健康状况 智能农业.

与相关术语的区别

理解 U-Net 需要将其与其他视觉任务区分开来:

  • U-Net 与物体检测对象检测模型 使用矩形 边界框在此基础上,U-Net 会生成一个像素完美的遮罩,以准确追踪物体的轮廓。
  • U-Net 与实例分割:标准 U-Net 执行语义分割,将所有同类对象(如所有汽车)视为单一区域。 同类对象(如所有汽车)视为单一区域。相比之下 实例分割 则是区分同一类别中的单个对象。现代架构,如 YOLO11等现代架构已发展到能高效处理 检测和分割任务。

利用Ultralytics进行现代细分

虽然实现原始 U-Net 通常需要在诸如 PyTorchTensorFlow等现代库简化了这一过程。Ultralytics 生态系统提供优化的细分模型,这些模型可 利用类似的架构原理实现实时性能。

下面的示例展示了如何使用预训练的 YOLO11 分割模型生成 像素级掩码:

from ultralytics import YOLO

# Load a pre-trained YOLO11 segmentation model
model = YOLO("yolo11n-seg.pt")

# Run inference on an image to detect and segment objects
results = model("path/to/image.jpg")

# Display the results with segmentation masks overlaid
results[0].show()

这种简化的工作流程使开发人员能够将复杂的细分功能集成到应用程序中,以便 模型部署在边缘设备上部署模型。 在自定义数据集上训练这些模型时,可采用 数据增强建议 以防止 过拟合这是在处理精确的像素级注释时经常遇到的难题。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入