深圳Yolo 视觉
深圳
立即加入
词汇表

数据增强

通过数据增强来增强您的机器学习模型。 探索提高准确性、减少过拟合和提高鲁棒性的技术。

数据扩增是一项战略技术,可用于 机器学习 (ML)用于 的规模和多样性。 训练数据集无需 收集新的原始数据。通过对现有数据样本进行各种转换,开发人员可以创建出经过修改但又逼真的 图像、文本或音频的真实版本。这一过程对于减少 过拟合过度拟合是一个常见问题,在这种情况下,模型会记住训练示例,而不是学习可通用的模式。 最终,有效的增强会带来更高的 准确性并确保模型 在实际环境中接触未见数据时表现稳健。

核心技术和方法

在以下领域 计算机视觉 (CV)增强是指对输入图像进行处理,以模拟不同的条件。这些变换有助于 模型不受方向、光照和比例变化的影响。

  • 几何变换:这些操作可修改图像的空间布局。常见的操作包括 随机旋转、水平翻转、裁剪和缩放。例如,使用 OpenCV 几何变换 可以让模型识别物体,无论物体是倒置还是倾斜。
  • 光度变换:调整像素值,在不改变几何形状的情况下改变视觉外观。 改变几何形状。调整亮度、对比度、饱和度并添加 高斯噪声帮助模型处理 不同的照明条件。
  • 高级混合:现代 对象检测框架 通常会使用复杂的技术,如 Mosaic、MixUp 和 CutMix。这些方法将多幅图像组合成一个 训练样本,鼓励模型学习上下文关系。您可以通过 的 Ultralytics Albumentations 集成.

实际应用

在高质量数据稀缺或获取成本高昂的行业中,数据扩增是不可或缺的。

  1. 医学影像:医学影像分析在医学影像分析中,隐私法和特定病症的罕见性限制了数据集的规模。通过在 X 射线或核磁共振成像扫描中加入 旋转和弹性变形,研究人员可以训练出稳健的模型,用于 肿瘤检测确保人工智能能够识别异常,而不受患者定位或机器校准的影响。
  2. 自动驾驶:自动驾驶汽车必须在不可预测的环境中航行。收集每种 每一种可能的天气条件的数据是不可能的。工程师们使用增强技术在晴天镜头上模拟雨、雾或弱光 场景。这就为 自动驾驶汽车作出反应 安全地在恶劣天气下做出反应,从而大大提高安全标准,如 美国国家公路交通安全管理局.

在Ultralytics YOLO中实施增强功能

"(《世界人权宣言》) ultralytics 库简化了增强功能的应用,直接在 模型训练 管线您可以调整 超参数来控制变换的强度和概率。

from ultralytics import YOLO

# Load the YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model with custom data augmentation parameters
# These arguments modify the training data on-the-fly
model.train(
    data="coco8.yaml",
    epochs=5,
    degrees=30.0,  # Apply random rotations between -30 and +30 degrees
    fliplr=0.5,  # 50% probability of flipping images horizontally
    mosaic=1.0,  # Use Mosaic augmentation (combining 4 images)
    mixup=0.1,  # Apply MixUp augmentation with 10% probability
)

区分相关概念

必须将数据增强与类似的数据战略区分开来:

  • 与合成数据相比:增强数据修改了现有的真实世界数据、 合成数据是 完全是通过计算机模拟或 生成式人工智能.增强功能为现有数据增添了多样性,而合成数据则创造了现有数据所不具备的内容。
  • 数据预处理 数据预处理包括 清理和格式化数据(如调整大小、规范化),使其适合模型。增强 在预处理之后进行,重点是扩大数据集的多样性,而不是数据集的格式。
  • 与迁移学习 迁移学习利用 预训练模型(例如,在......上训练的模型)中的知识。 ImageNet)中的知识来解决新任务。迁移学习与模型权重有关,而增强学习与输入数据有关。 则与输入数据有关。

要深入了解现代增强库,可参考 文档提供了与 PyTorch 和 YOLO11 兼容的 与PyTorch 和YOLO11 兼容的可用转换列表。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入