敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024

使用 Albumentations 数据增强来丰富您的数据

Abirami Vina

5 分钟阅读

2025年2月17日

了解如何在自定义训练 Ultralytics YOLO11 时使用 Albumentations 进行数据增强,从而通过多样化的训练数据来提高模型性能。

在构建 计算机视觉 解决方案时,收集多样化的图像集来训练视觉 AI 模型可能是流程中的关键部分。这通常需要大量的时间和金钱,而且有时,收集的图像对于模型有效学习来说仍然不够多样化。

例如,像 Ultralytics YOLO11 这样的计算机视觉模型可以在图像数据集上进行自定义训练,以用于与不同应用相关的各种计算机视觉任务。多样化的数据是关键,因为它有助于模型更好地泛化,使其能够识别各种真实场景中的物体和模式。

如果您正在努力解决缺乏多样化数据的问题,图像数据增强技术可能是一个很好的解决方案。旋转、翻转和调整亮度等方法可以帮助增加数据集的多样性,从而提高模型处理更广泛条件的能力。

因此,Ultralytics 支持图像数据增强集成。 使用 Albumentations(一种提供转换集合的流行工具),您可以创建多样化的视觉数据。 此集成通过自动增强训练图像来简化 YOLO11 的训练过程,从而提高模型性能。 

在本文中,我们将探讨如何使用 Albumentations 集成、它的好处以及它对模型训练的影响。

什么是 Albumentations?

计算机视觉模型可以从广泛的高质量图像集中学习,以识别不同环境中的对象。从真实来源收集大型数据集可能既缓慢又昂贵且效率低下。为了简化这项任务,您可以使用图像数据增强来创建现有图像的新变体,从而帮助模型从不同的场景中学习,而无需收集更多数据。

具体来说,您可以利用 Albumentations,这是一个于 2018 年推出的开源库,用于高效的图像数据增强。它支持各种操作,从简单的几何变化(如旋转和翻转)到更复杂的调整(如亮度、对比度和噪声添加)。

__wf_reserved_inherit
图 1. 不同类型的图像数据增强示例。

Albumentations 的主要特性

Albumentations 以其高性能而闻名,这意味着它可以快速有效地处理图像。它基于优化的库(如 OpenCV 和 NumPy)构建,可以处理大型数据集,且处理时间最短,这使其成为模型训练期间快速数据增强的理想选择。

以下是 Albumentations 的其他一些主要特性:

  • 广泛的变换范围: Albumentations 提供了 70 多种类型的增强。这些变化有助于模型学习检测对象,即使在光照、角度或背景发生变化的情况下也是如此。
  • 针对速度进行了优化:它使用高级优化技术,例如SIMD(单指令多数据),该技术一次处理多个数据点,以加快图像增强并有效处理大型数据集。
  • 三种级别的数据增强:它通过三种方式增强数据。例如,像素级增强调整亮度与颜色,但不改变物体本身。同时,空间级增强修改物体的位置,但保留关键细节;混合级别增强则混合不同图像的部分,以创建新的样本。

为什么要使用 Albumentations 集成?

您可能想知道:有很多方法可以将增强应用于数据集,您甚至可以使用 OpenCV 等工具创建自己的增强。那么,为什么要选择支持像 Albumentations 这样的库的集成呢?

使用 OpenCV 等工具手动创建增强可能需要大量时间,并且需要一定的专业知识。微调转换以获得最佳结果也可能很棘手。Albumentations 集成使此过程更容易。它提供了许多现成的转换,可以节省您准备数据集的时间和精力。

选择 Albumentations 集成的另一个原因是它可以与 Ultralytics 模型训练 流程顺利配合。它可以更轻松地自定义训练 YOLO11,因为增强会在训练期间自动应用。它简化了流程,因此您可以更多地关注改进模型,而不是处理数据准备。 

Albumentations 集成入门

有趣的是,使用 Albumentations 集成来训练 YOLO11 比看起来更简单。一旦设置了正确的库,该集成就会在训练期间自动应用图像数据增强。它有助于模型使用相同的数据集从不同的图像变体中学习。

接下来,让我们逐步了解在自定义训练 YOLO11 时如何安装和使用 Albumentations 集成。

安装 Ultralytics Python 包和 Albumentations

在应用增强之前,需要安装 Ultralytics Python 包和 Albumentations。该集成旨在使这两个库默认情况下无缝协同工作,因此您无需担心复杂的配置。

只需一个 pip 命令即可在几分钟内完成整个安装过程,pip 是一个用于安装 Python 库的包管理工具,如下图所示。 

__wf_reserved_inherit
图 2. 安装 Ultralytics 和 Albumentations。

安装 Albumentations 后,Ultralytics 模型训练模式会在训练期间自动应用图像增强。如果未安装 Albumentations,则不会应用这些增强。有关更多详细信息,您可以参考 Ultralytics 官方文档

借助 Albumentations 集成训练 YOLO11

让我们更好地了解 Albumentations 集成背后的原理。 

以下是在 YOLO11 训练期间应用的数据增强的详细介绍:

  • 模糊: 此转换会向图像添加轻微的模糊。 它有助于模型检测物体,即使它们未对焦。
  • 中值模糊: 它可以减少随机噪声,同时保留图像中的对象边缘。这使得模型更容易在复杂的环境中检测对象。
  • 灰度: 通过将图像转换为黑白图像,这种增强可以帮助模型专注于形状和纹理,而不是颜色。
  • CLAHE(限制对比度自适应直方图均衡化): 这种增强可以提高图像的对比度,尤其是在太暗或难以看到的区域,例如在弱光或朦胧条件下。这使得这些区域中的对象更清晰,更容易让模型识别。
__wf_reserved_inherit
图 3. 应用于猫图像的灰度增强示例。

YOLO11 和 Albumentations 集成的应用

如果您正在为特定应用定制训练 YOLO11,Albumentations 集成可以通过适应各种条件来帮助提高模型的性能。让我们讨论一些实际应用以及此集成可以解决的挑战。

改进医学影像

视觉 AI 在医疗保健领域正在帮助医生更准确地分析医学图像,以辅助诊断和改善患者护理。事实上,大约五分之一的医疗机构已经在使用 AI 解决方案。 

然而,创建这些计算机视觉解决方案也面临着一系列挑战。 医疗扫描在不同的医院之间可能差异很大,受到不同设备、设置甚至技术人员经验等因素的影响。 亮度、对比度和曝光的变化会影响视觉 AI 模型的一致性和准确性,使其难以在不同的环境中可靠地执行。

这就是集成 Albumentations 等工具变得至关重要的地方。通过生成同一扫描的多个增强版本,Albumentations 使模型能够从各种图像质量中学习。这有助于模型变得更加稳健,从而能够跨高质量和低质量图像准确地检测疾病。 

__wf_reserved_inherit
图 4. 增强的 X 射线图像。

加强安全和监控

视觉 AI 另一个有趣的应用是在安全和监控领域。实时目标检测可以帮助安全团队快速识别潜在威胁。 

与此应用相关的一个主要问题是,安全摄像头在一天中的各种光照条件下拍摄的画面,这些条件会极大地影响模型对图像的理解。低光环境、眩光或低能见度等因素会使计算机视觉模型难以持续检测物体或识别潜在威胁。

Albumentations 集成通过应用转换来模拟不同的光照条件来提供帮助。这使模型能够学习在明亮和弱光环境中检测对象,使其更可靠并提高在具有挑战性的条件下的响应时间。

重新定义零售工作流程和客户体验

超市通道中的溢出物、狗在商店里乱跑或孩子撞倒商品展示只是零售环境中视觉人工智能的几个日常事件的例子。计算机视觉越来越多地用于通过跟踪购物者行为、监控客流量和识别货架上的产品来改善客户体验。然而,这些真实世界的情况对于人工智能系统来说可能难以理解和准确处理。

虽然并非每种场景都可以在计算机视觉数据集中表示,但 Albumentations 集成通过扩充数据来覆盖许多可能的场景(例如意外照明、不寻常的角度或障碍物)来提供帮助。 这有助于计算机视觉模型适应各种条件,从而提高它们处理边缘情况并在动态零售环境中进行准确预测的能力。

主要要点

为模型训练收集各种真实世界的数据可能很复杂,但 Albumentations 通过创建图像变体来简化这一过程,从而帮助模型适应不同的条件。 

Ultralytics 支持的 Albumentations 集成简化了在自定义训练 YOLO11 时应用这些增强的过程。这可以提高数据集质量,从而通过生成更准确、更可靠的视觉 AI 模型使各行各业受益。

加入我们的社区,并探索我们的GitHub仓库,以了解更多关于人工智能的信息,并查看我们的许可选项,以启动您的视觉人工智能项目。对人工智能在制造业中的应用计算机视觉在自动驾驶中的应用等创新感兴趣吗?访问我们的解决方案页面以了解更多信息。 

让我们一起构建人工智能的未来!

开启您的机器学习未来之旅

免费开始
链接已复制到剪贴板