利用 Albumentations 对Ultralytics YOLO 数据进行扩充

示例 H2

示例 H3

在构建计算机视觉解决方案时，收集多样化的图像集来训练视觉 AI 模型可能是流程中的关键部分。这通常需要大量的时间和金钱，而且有时，收集的图像对于模型有效学习来说仍然不够多样化。

例如，计算机视觉模型 Ultralytics YOLO11等计算机视觉模型可以在与不同应用相关的各种计算机视觉任务的图像数据集上进行定制训练。多样化的数据是关键，因为这有助于模型更好地泛化，使其能够在广泛的现实世界场景中识别物体和模式。

如果您正在努力解决缺乏多样化数据的问题，图像数据增强技术可能是一个很好的解决方案。旋转、翻转和调整亮度等方法可以帮助增加数据集的多样性，从而提高模型处理更广泛条件的能力。

因此，Ultralytics 支持图像数据增强集成。使用Albumentations（一种提供转换集合的流行工具），您可以创建多样化的可视化数据。该集成通过自动增强训练图像简化了YOLO11 训练过程，从而提高了模型性能。

在本文中，我们将探讨如何使用 Albumentations 集成、它的好处以及它对模型训练的影响。

什么是 Albumentations？

计算机视觉模型可以从广泛的高质量图像集中学习，以识别不同环境中的对象。从真实来源收集大型数据集可能既缓慢又昂贵且效率低下。为了简化这项任务，您可以使用图像数据增强来创建现有图像的新变体，从而帮助模型从不同的场景中学习，而无需收集更多数据。

具体来说，您可以利用 Albumentations，这是一个于 2018 年推出的开源库，用于高效的图像数据增强。它支持各种操作，从简单的几何变化（如旋转和翻转）到更复杂的调整（如亮度、对比度和噪声添加）。

__wf_reserved_inherit — 图 1. 不同类型的图像数据增强示例。

Albumentations 的主要特性

Albumentations 以其高性能而著称，这意味着它可以快速高效地处理图像。它基于优化的库，如 OpenCV和NumPy 等优化库，能以最短的处理时间处理大型数据集，是模型训练期间快速扩充数据的理想选择。

以下是 Albumentations 的其他一些主要特性：

多种变形： Albumentations 提供 70 多种增强效果。
‍
针对速度进行了优化：它使用高级优化技术，例如SIMD（单指令多数据），该技术一次处理多个数据点，以加快图像增强并有效处理大型数据集。
‍
三种级别的数据增强：它通过三种方式增强数据。例如，像素级增强调整亮度与颜色，但不改变物体本身。同时，空间级增强修改物体的位置，但保留关键细节；混合级别增强则混合不同图像的部分，以创建新的样本。

为什么要使用 Albumentations 集成？

你可能会想：有很多方法可以对数据集应用增强功能，你甚至可以使用OpenCV 等工具创建自己的增强功能。那么，为什么要选择支持 Albumentations 这样的库的集成呢？

使用OpenCV 等工具手动创建增强效果需要花费大量时间，而且需要一定的专业知识。此外，微调变换以获得最佳效果也很棘手。Albumentations 集成让这一过程变得更容易。它提供了许多现成可用的转换，可以为您准备数据集节省时间和精力。

选择 Albumentations 集成的另一个原因是，它可以与Ultralytics 模型训练管道顺利配合。由于增强功能会在训练过程中自动应用，因此定制训练YOLO11 变得更加容易。它简化了过程，因此您可以将更多精力放在改进模型上，而不是处理数据准备工作。

Albumentations 集成入门

有趣的是，使用 Albumentations 集成来训练YOLO11 比看上去要简单得多。一旦设置了正确的库，集成就会在训练过程中自动应用图像数据增强。它可以帮助模型从使用相同数据集的不同图像变化中学习。

接下来，让我们了解一下在定制培训YOLO11 时如何安装和使用 Albumentations 集成。

安装Ultralytics Python 软件包和 Albumentations

在应用增强功能之前，需要安装Ultralytics Python 软件包和 Albumentations。整合后，两个库默认情况下可无缝协作，因此无需担心复杂的配置。

整个安装过程只需一条 pip 命令就能在几分钟内完成，如下图所示，这是一个用于安装Python 库的软件包管理工具。

安装 Albumentations 后，Ultralytics 模型训练模式会在训练过程中自动应用图像增强。如果没有安装 Albumentations，则不会应用这些增强功能。更多详情，请参阅 Ultralytics 官方文档。

借助 Albumentations 集成系统培训YOLO11

让我们更好地了解 Albumentations 集成背后的原理。

下面是YOLO11 培训期间使用的增强功能的详细介绍：

模糊：这种变换会给图像添加轻微的模糊效果。即使物体失焦，也能帮助模型detect 它们。
‍
中值模糊它能减少随机噪音，同时保留图像中的物体边缘。
‍
灰度： 通过将图像转换为黑白图像，这种增强可以帮助模型专注于形状和纹理，而不是颜色。
‍
CLAHE（限制对比度自适应直方图均衡化）： 这种增强可以提高图像的对比度，尤其是在太暗或难以看到的区域，例如在弱光或朦胧条件下。这使得这些区域中的对象更清晰，更容易让模型识别。

YOLO11 和 Albumentations 集成的应用

如果您要针对特定应用对YOLO11 进行定制培训，Albumentations 集成可以通过适应各种条件来帮助提高模型的性能。让我们来讨论一些实际应用以及该集成所能解决的挑战。

改进医学影像

视觉 AI 在医疗保健领域正在帮助医生更准确地分析医学图像，以辅助诊断和改善患者护理。事实上，大约五分之一的医疗机构已经在使用 AI 解决方案。

然而，创建这些计算机视觉解决方案也面临着一系列挑战。医疗扫描在不同的医院之间可能差异很大，受到不同设备、设置甚至技术人员经验等因素的影响。亮度、对比度和曝光的变化会影响视觉 AI 模型的一致性和准确性，使其难以在不同的环境中可靠地执行。

这就是整合 Albumentations 等工具的关键所在。通过生成同一扫描图像的多个增强版本，Albumentations 使模型能够从各种图像质量中学习。这有助于提高模型的鲁棒性，使其能够在高质量和低质量的图像中准确detect 疾病。

加强安全和监控

视觉 AI 另一个有趣的应用是在安全和监控领域。实时目标检测可以帮助安全团队快速识别潜在威胁。

与此应用相关的一个主要问题是，安防摄像机全天在不同的照明条件下拍摄录像，而这些条件会极大地影响模型对此类图像的理解。弱光环境、眩光或能见度低等因素都会使计算机视觉模型难以始终如一地detect 物体或识别潜在威胁。

Albumentations 集成通过应用变换来模拟不同的照明条件。这样，模型就能学会在明亮和昏暗的环境中detect 物体，使其更加可靠，并提高在挑战性条件下的响应速度。

重新定义零售工作流程和客户体验

超市通道中的溢出物、狗在商店里乱跑或孩子撞倒商品展示只是零售环境中视觉人工智能的几个日常事件的例子。计算机视觉越来越多地用于通过跟踪购物者行为、监控客流量和识别货架上的产品来改善客户体验。然而，这些真实世界的情况对于人工智能系统来说可能难以理解和准确处理。

虽然并非每种场景都可以在计算机视觉数据集中表示，但 Albumentations 集成通过扩充数据来覆盖许多可能的场景（例如意外照明、不寻常的角度或障碍物）来提供帮助。这有助于计算机视觉模型适应各种条件，从而提高它们处理边缘情况并在动态零售环境中进行准确预测的能力。

主要要点

为模型训练收集各种真实世界的数据可能很复杂，但 Albumentations 通过创建图像变体来简化这一过程，从而帮助模型适应不同的条件。

Ultralytics 支持的 Albumentations 集成简化了在定制训练YOLO11 时应用这些增强功能的过程。这就提高了数据集的质量，通过生成更准确、更可靠的视觉人工智能模型，使各行各业受益匪浅。

加入我们的社区，并探索我们的GitHub仓库，以了解更多关于人工智能的信息，并查看我们的许可选项，以启动您的视觉人工智能项目。对人工智能在制造业中的应用或计算机视觉在自动驾驶中的应用等创新感兴趣吗？访问我们的解决方案页面以了解更多信息。

使用 Albumentations 数据增强来丰富您的数据

什么是 Albumentations？

Albumentations 的主要特性

为什么要使用 Albumentations 集成？

Albumentations 集成入门

安装Ultralytics Python 软件包和 Albumentations

借助 Albumentations 集成系统培训YOLO11

YOLO11 和 Albumentations 集成的应用

改进医学影像

加强安全和监控

重新定义零售工作流程和客户体验

主要要点

阅读更多此类别的内容

使用 ExecuTorch 集成部署Ultralytics YOLO 模型

U-Net 架构及其应用指南

常用的开源 OCR 模型及其工作原理

让我们一起构建人工智能的未来！