通过数据增强来增强您的机器学习模型。 探索提高准确性、减少过拟合和提高鲁棒性的技术。
数据扩增是一项战略技术,可用于 机器学习 (ML)用于 的规模和多样性。 训练数据集无需 收集新的原始数据。通过对现有数据样本进行各种转换,开发人员可以创建出经过修改但又逼真的 图像、文本或音频的真实版本。这一过程对于减少 过拟合过度拟合是一个常见问题,在这种情况下,模型会记住训练示例,而不是学习可通用的模式。 最终,有效的增强会带来更高的 准确性并确保模型 在实际环境中接触未见数据时表现稳健。
在以下领域 计算机视觉 (CV)增强是指对输入图像进行处理,以模拟不同的条件。这些变换有助于 模型不受方向、光照和比例变化的影响。
在高质量数据稀缺或获取成本高昂的行业中,数据扩增是不可或缺的。
"(《世界人权宣言》) ultralytics 库简化了增强功能的应用,直接在
模型训练 管线您可以调整
超参数来控制变换的强度和概率。
from ultralytics import YOLO
# Load the YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model with custom data augmentation parameters
# These arguments modify the training data on-the-fly
model.train(
data="coco8.yaml",
epochs=5,
degrees=30.0, # Apply random rotations between -30 and +30 degrees
fliplr=0.5, # 50% probability of flipping images horizontally
mosaic=1.0, # Use Mosaic augmentation (combining 4 images)
mixup=0.1, # Apply MixUp augmentation with 10% probability
)
必须将数据增强与类似的数据战略区分开来:
要深入了解现代增强库,可参考 文档提供了与 PyTorch 和 YOLO11 兼容的 与PyTorch 和YOLO11 兼容的可用转换列表。

