遇见 YOLO26: 下一代视觉 AI。
Ultralytics
指南

通过数据增强提高 AI 模型的鲁棒性

了解通过数据增强向训练数据添加现实变化如何帮助提高 AI 模型的鲁棒性和现实世界性能。

ABAbirami Vina
4 min read
通过数据增强提高 AI 模型的鲁棒性

测试是构建任何技术解决方案的关键环节。它能在系统上线前向团队展示其真实运行情况,并允许团队尽早修复问题。在人工智能等众多领域中,这一点尤为重要,因为模型在部署后需要应对不可预测的真实世界环境。

例如,计算机视觉是人工智能的一个分支,致力于教会机器理解图像和视频。像Ultralytics YOLO26这样的计算机视觉模型支持诸如目标检测、实例分割和图像分类等任务。

它们可应用于医疗监测、交通分析、自动结账和制造业质量检测等多个行业。然而,即使拥有先进的模型和高质量的训练数据,视觉AI解决方案在面对现实世界的各种变化(如光照改变、运动或物体被部分遮挡)时,依然可能会遇到困难。

这是因为模型是从训练时提供给它们的示例中学习的。如果它们之前没见过强光、运动模糊或部分可见等情况,它们在这些场景下正确识别物体的可能性就会降低。

提高模型鲁棒性的一种方法是进行数据增强。工程师无需收集大量新数据,只需对现有图像进行细微而有意义的更改,例如调整光照、裁剪或混合图像。这有助于模型学习在更广泛的情况下识别同一物体。

在本文中,我们将探讨数据增强如何提高模型鲁棒性,以及视觉AI系统在非受控环境下部署时的可靠性。让我们开始吧!

Link to this section如何检查模型的鲁棒性#

在深入探讨数据增强之前,让我们讨论一下如何判断一个计算机视觉模型是否真正做好了投入现实世界使用的准备。

鲁棒的模型即使在环境发生变化时也能持续良好表现,而不仅仅是处理干净、完美标注的图像。以下是在评估AI模型鲁棒性时需要考虑的一些实际因素:

  • 光照变化: 模型在强光、弱光、眩光或阴影下可能会有不同的表现,这会影响其检测物体的置信度。
  • 部分遮挡: 在日常场景中,物体经常被其他物品遮挡或仅部分可见。更鲁棒的模型即使在视觉信息缺失的情况下也能识别它们。
  • 拥挤场景: 存在大量重叠物体的环境会让检测变得更具挑战性。在这些情况下表现良好的模型,通常在复杂场景中更可靠。

在干净、拍摄完美的图像上取得良好结果,并不总是意味着在现实世界中会有同样出色的表现。在各种环境下进行定期测试有助于展示模型部署后的实际稳健程度。

Link to this section什么是数据增强?#

物体在照片中的外观会随着光照、角度、距离或背景的不同而发生变化。当训练计算机视觉模型时,其学习的数据集需要包含这些变化,这样它才能在不可预测的环境中良好运行。

数据增强通过利用现有图像创建额外的示例来扩展训练数据集。这是通过应用刻意的更改(如旋转、翻转图像、调整亮度或裁剪部分图像)来完成的。

例如,假设你只有一张猫的照片。如果你旋转该图像或改变其亮度,就能从这一张照片中创建出多个新版本。每个版本看起来略有不同,但它们仍然是同一只猫的照片。这些变化有助于教会模型:一个物体在外观改变的同时,本质上仍然是同一个东西。

猫的图像增强示例

图 1. 查看猫的图像增强 (来源)

Link to this section数据增强如何提高模型性能#

在模型训练过程中,数据增强可以直接集成到训练流水线中。无需手动创建和存储新的图像副本,可以在每次加载图像时应用随机变换。

这意味着模型每次看到的图像版本都略有不同,无论是更亮、被翻转还是被部分隐藏。诸如随机擦除(Random Erasing)之类的技术甚至可以移除图像的小块区域,以模拟现实中物体被遮挡或仅部分可见的情况。

基于随机擦除的增强示例

图 2. 随机擦除增强示例 (来源)

看到同一图像的多个不同版本,使得模型能够学习哪些特征是重要的,而不是依赖于一个完美的示例。这种多样性构建了AI模型的鲁棒性,使其在现实条件下能更可靠地运行。

Link to this section常见的数据增强技术#

以下是一些用于在训练图像中引入变化的数据增强技术:

  • 几何变换: 这些技术在空间上改变了物体在图像中的外观。旋转、翻转、缩放、裁剪或移动图像,使模型能够理解物体如何从不同角度或距离呈现。
  • 颜色和光照调整: 现实世界的光照很少是一致的。根据所处的环境或所用的相机,图像可能会过亮、过暗或颜色略有偏差。调整亮度、对比度、色调和饱和度可以让模型处理这些视觉变化,并在不同场景中表现良好。
  • 图像质量变化: 模糊或视觉噪声会导致图像看起来不清晰。在训练过程中添加模糊或噪声,有助于模型学习应对运动模糊、低光图像或低质量相机输出的情况,从而减少对不完美视觉效果的敏感度。
  • 基于遮挡的增强: 在真实环境中,物体经常被其他物体部分遮挡。这被称为图像遮挡。在训练过程中隐藏或遮盖图像的小区域,有助于模型学习即使在物体仅部分可见时也能进行检测。
  • 多图像增强: 这些技术将多张图像的部分内容组合成单个训练示例,这可以增加视野中的物体数量,并提高模型处理复杂或拥挤场景的能力。

多图像增强示例

图 3. 多图像增强示例 (来源)

Link to this section通过 Ultralytics Python 包轻松实现数据增强#

管理数据集、创建图像变体以及编写变换代码会给构建计算机视觉应用增加额外的步骤。Ultralytics Python 包通过提供单一接口来训练、运行和部署如 YOLO26 等 Ultralytics YOLO 模型,简化了这一过程。作为简化训练工作流的一部分,该包内置了经过 Ultralytics 测试、针对 YOLO 模型优化的数据增强功能。

它还支持实用的集成,消除了对独立工具或自定义代码的需求。具体而言,对于数据增强,该包与广泛使用的图像增强库 Albumentations 进行了集成。这种集成允许在训练过程中自动应用增强功能,而无需额外的脚本或自定义代码。

Link to this section管理标注和增强后的数据集#

影响模型鲁棒性的另一个因素是标注质量。使用 Roboflow 等标注工具创建和管理的清晰、准确的标签,有助于模型理解物体的位置及其外观。

在训练过程中,翻转、裁剪和旋转等数据增强是动态应用的,标签会自动调整以匹配这些变化。当标签精确时,这个过程运行顺畅,并为模型提供了许多同一场景的逼真示例。

如果标注不准确或不一致,这些错误可能会在增强后的图像中被重复,从而降低训练效果。从准确的标注开始,可以防止这些错误蔓延,并有助于提高模型鲁棒性。

Link to this section通过数据增强增强视觉AI应用#

接下来,让我们通过示例来看看数据增强如何促进现实应用中AI模型的鲁棒性。

Link to this section提升真实环境中的目标检测精度#

当真实数据有限、敏感或难以收集时,合成图像常被用于训练目标检测系统。它们让团队能够在无需在现实生活中捕获每一个场景的情况下,快速生成产品、环境和相机角度的示例。

然而,与现实世界的镜头相比,合成数据集有时可能看起来过于干净,而现实世界中光照会变化,物体会重叠,场景中也包含背景干扰。数据增强通过引入逼真的变化(如不同的光照、噪声或物体位置)来弥补这一差距,使模型能够学习处理部署时可能遇到的各种条件。

例如,在最近的一项研究中,一个 YOLO11 模型完全是在合成图像上进行训练的,并加入了数据增强以引入额外的变化。这在模型学习更广泛地识别物体方面起到了作用。尽管该模型在训练期间从未见过真实世界的数据,但在测试真实图像时,其表现依旧出色。

Link to this section使医疗成像解决方案更可靠#

医疗成像数据集通常很有限,扫描图像本身也会根据设备类型、成像设置或临床环境而有所不同。患者解剖结构、角度、光照或视觉噪声的差异,使得计算机视觉模型难以学习到在不同患者和医院间具有良好泛化能力的模式。

数据增强通过在训练期间创建同一扫描图像的多个变体来帮助解决这个问题,例如添加噪声、轻微移动图像或应用小幅畸变。这些变化使训练数据更能代表真实的临床情况。

例如,在一项儿科影像研究中,研究人员使用 YOLO11 进行解剖分割,并在增强后的医学数据上进行了训练。他们引入了如添加噪声、轻微位置偏移和小幅畸变等变化,使图像看起来更逼真。

原始和增强后的儿科医学图像

图 4. 原始和增强后的儿科医学影像 (来源)

通过从这些变化中学习,模型专注于有意义的解剖特征,而不是表面的差异。这使得其分割结果在不同的扫描和患者病例中更加稳定。

Link to this section关键要点#

收集多样化的数据很困难,但数据增强允许模型从更广泛的视觉条件下进行学习。这在应对遮挡、光照变化和拥挤场景时,能带来更强的模型鲁棒性。总的来说,这有助于它们在受控训练环境之外更可靠地执行任务。

加入我们的社区,并在我们的 GitHub 仓库探索视觉AI的最新动态。访问我们的解决方案页面,了解诸如制造业中的AI医疗保健中的计算机视觉等应用如何推动进步,并查看我们的许可选项以支持你的下一个AI解决方案。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅