CutMix
Узнай, как метод аугментации данных CutMix предотвращает переобучение. Научись легко применять его для обучения надежных моделей Ultralytics YOLO26.
CutMix — это продвинутая техника аугментации данных, используемая для обучения устойчивых моделей компьютерного зрения путем вырезания прямоугольной области из одного изображения и вставки её в целевое изображение. В отличие от более простых методов аугментации, изменяющих яркость или поворот, CutMix меняет фундаментальную композицию обучающего примера. Когда пиксели заменяются, соответствующие метки ground-truth также смешиваются пропорционально площади патча. Это помогает искусственным нейронным сетям учиться распознавать объекты по частичным представлениям, заставляя модель опираться на множество признаков, а не фокусироваться исключительно на наиболее отличительных частях объекта. Впервые представленный в академической статье 2019 года, метод стал стандартной операцией во фреймворках глубокого обучения для предотвращения переобучения и улучшения обобщающей способности на больших наборах данных.
Link to this sectionКак работает этот метод#
Во время обучения модели алгоритм случайным образом выбирает центральную координату и размер рамки, чтобы извлечь область из вспомогательного изображения. Затем этот патч накладывается прямо на основное изображение в пределах активного батча. Если на основном изображении была собака, а на вспомогательном — кошка, итоговое изображение будет содержать патч с кошкой, заменяющий часть собаки. Метки классификации обновляются с использованием линейной интерполяции на основе точной площади патча — например, результат будет иметь метку 0.7 для собаки и 0.3 для кошки. В задачах обнаружения объектов сохраняются те ограничивающие рамки (bounding boxes), которые удерживают не менее определенного процента (часто 10%) своей исходной площади внутри вставленной области. Этот метод имеет встроенную поддержку в качестве гиперпараметра обучения cutmix в Ultralytics YOLO, что позволяет тебе легко задавать вероятность применения этой трансформации.
Link to this sectionРазличия между MixUp и Cutout#
CutMix тесно связан с двумя другими популярными методами аугментации данных, но он решает их специфические ограничения:
- Аугментация MixUp: MixUp смешивает два изображения глобально, вычисляя взвешенное среднее их значений пикселей. Хотя это эффективно, часто это приводит к появлению неестественных, полупрозрачных фантомных изображений, которые могут сбивать модель с толку, нарушая локальную пространственную корреляцию. В отличие от него, CutMix сохраняет исходную интенсивность пикселей внутри вырезанных областей, что исследователи дополнительно оптимизировали в таких подходах, как Attentive CutMix.
- Аугментация Cutout: Cutout отбрасывает информацию, маскируя случайную прямоугольную область черными пикселями или средним значением датасета. Хотя это побуждает модель смотреть на объект целиком, это приводит к потере полезных обучающих тензоров. CutMix заменяет это пустое пространство информативными патчами для классификации изображений из других изображений, повышая общую эффективность обучения.
Link to this sectionРеальные приложения#
Обучая модели распознавать сильно перекрытые объекты, CutMix значительно повышает производительность машинного обучения в различных отраслях.
- Автомобильный ИИ и автономное вождение: В беспилотных автомобилях это учит систему идентифицировать пешеходов или транспортные средства, даже если они частично перекрыты дорожными знаками, повышая безопасность в условиях интенсивного движения.
- Медицинская диагностика и сегментация органов: В здравоохранении этот метод широко используется для сегментации органов и опухолей, позволяя моделям распознавать сложные границы тканей даже при наложении анатомических структур друг на друга.
- Дистанционное зондирование для спутниковых снимков: Эта стратегия сохраняет плотные перекрывающиеся классы, такие как здания и растительность, на видах сверху. Активно исследуются продвинутые вариации для улучшения распознавания длинного хвоста на сильно несбалансированных данных.
Link to this sectionПрактическое внедрение#
Интеграция этой аугментации в конвейер ИИ выполняется просто. Большинство высокоуровневых библиотек поддерживают её нативно, например PyTorch Transforms и Keras Preprocessing Layers.
При обучении такой модели, как YOLO26, настройка этой аугментации требует корректировки всего одного параметра. Это автоматически берет на себя как наложение патчей на изображение, так и сложную логику обрезки ограничивающих рамок.
from ultralytics import YOLO
# Initialize the recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")
# Train the model with CutMix enabled at a 50% probability
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, cutmix=0.5)Для команд, управляющих масштабными рабочими процессами компьютерного зрения, Ultralytics Platform упрощает задачу, позволяя настраивать эти лучшие практики аугментации данных прямо в облачном интерфейсе, оптимизируя путь от аннотации до развертывания модели.






