CutMix

Descobre como a técnica de aumento de dados CutMix evita o sobreajuste (overfitting). Aprende a aplicá-la facilmente para treinar modelos Ultralytics YOLO26 robustos.

CutMix é uma técnica avançada de data augmentation utilizada para treinar modelos robustos de computer vision, cortando uma parte retangular de uma imagem e colando-a sobre uma imagem de destino. Ao contrário de aumentações mais simples que ajustam o brilho ou a rotação, o CutMix altera a composição fundamental de uma amostra de treino. Quando os pixels são trocados, os ground-truth labels correspondentes também são misturados proporcionalmente à área do recorte. Isso ajuda as artificial neural networks a aprender a identificar objetos a partir de vistas parciais, forçando o modelo a contar com múltiplas características em vez de focar apenas nas partes mais discriminativas de um objeto. Apresentado pela primeira vez num artigo académico de 2019, tornou-se uma operação padrão em frameworks de deep learning para evitar o overfitting e melhorar a generalização em grandes datasets.

Link to this sectionComo funciona a técnica#

Durante o treino do modelo, o algoritmo seleciona aleatoriamente uma coordenada central e um tamanho de caixa para extrair uma região de uma imagem secundária. Esse recorte é então sobreposto diretamente numa imagem primária dentro do batch ativo. Se a imagem primária contivesse um cão e a secundária um gato, a imagem final apresentaria um recorte de gato substituindo uma parte do cão. Os rótulos de classificação são atualizados usando linear interpolation com base na área exata do recorte — por exemplo, resultando num rótulo de 0.7 para cão e 0.3 para gato. Em tarefas de object detection, as bounding boxes que retêm pelo menos uma certa percentagem (frequentemente 10%) da sua área original dentro da região colada são preservadas. Esta técnica é suportada nativamente como um hiperparâmetro de treino cutmix no Ultralytics YOLO, permitindo que os utilizadores definam facilmente a probabilidade desta transformação.

Link to this sectionDiferenciando MixUp de Cutout#

O CutMix está estreitamente relacionado com duas outras técnicas proeminentes de data augmentation, mas resolve as suas limitações específicas:

MixUp Augmentation: O MixUp mistura duas imagens globalmente ao calcular uma média ponderada dos seus valores de pixel. Embora eficaz, muitas vezes resulta em imagens fantasma pouco naturais e semitransparentes que podem confundir os modelos ao interromper a spatial correlation local. Em contraste, o CutMix preserva as intensidades originais dos pixels dentro das regiões cortadas, o que os investigadores otimizaram ainda mais em abordagens como Attentive CutMix.
Cutout Augmentation: O Cutout descarta informações ao mascarar uma região retangular aleatória com pixels pretos ou a média do dataset. Embora encoraje o modelo a observar o objeto inteiro, desperdiça tensors de treino valiosos. O CutMix substitui esse espaço ausente por recortes informativos de image classification de outras imagens, aumentando a eficiência geral da aprendizagem.

Link to this sectionAplicações no Mundo Real#

Ao treinar modelos para reconhecer objetos severamente ocluídos, o CutMix aumenta significativamente o desempenho de machine learning em diversos setores.

IA Automotiva e Condução Autônoma: Em carros autônomos, ele ensina o sistema a identificar pedestres ou veículos mesmo quando eles estão parcialmente bloqueados por placas de sinalização, aumentando a segurança em ambientes lotados.
Medical Diagnostics and Organ Segmentation: Na área da saúde, este método é amplamente utilizado para organ and tumor segmentation, permitindo que os modelos reconheçam limites complexos de tecidos mesmo quando estruturas anatómicas se sobrepõem.
Remote Sensing for Satellite Imagery: Esta estratégia preserva classes densas e sobrepostas, como edifícios e vegetação, a partir de vistas aéreas. Variações avançadas são ativamente pesquisadas para melhorar o long-tailed recognition em dados fortemente desequilibrados.

Link to this sectionImplementação na Prática#

Integrar esta aumentação num pipeline de IA é simples. A maioria das bibliotecas de alto nível suporta-a nativamente, como PyTorch Transforms e Keras Preprocessing Layers.

Ao treinar um modelo como o YOLO26, configurar esta aumentação requer apenas um ajuste de parâmetro. Isto lida automaticamente tanto com a criação de recortes de imagem como com a lógica complexa de corte de bounding boxes.

from ultralytics import YOLO

# Initialize the recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")

# Train the model with CutMix enabled at a 50% probability
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, cutmix=0.5)

Para equipas que gerem fluxos de trabalho de visão de grande escala, a Ultralytics Platform simplifica isto ao permitir que os utilizadores ajustem estas data augmentation best practices diretamente a partir de uma interface na cloud, agilizando o caminho desde a anotação até ao model deployment.

CutMix

Link to this sectionComo funciona a técnica#

Link to this sectionDiferenciando MixUp de Cutout#

Link to this sectionAplicações no Mundo Real#

Link to this sectionImplementação na Prática#

Explore solutions

IA em robótica

IA na Logística

IA no varejo

IA na Saúde

IA na Fabricação

IA no Setor Automóvel

IA na Agricultura

IA em robótica

IA na Logística

IA no varejo

IA na Saúde

IA na Fabricação

IA no Setor Automóvel

IA na Agricultura

IA em robótica

IA na Logística

IA no varejo

IA na Saúde

IA na Fabricação

IA no Setor Automóvel

IA na Agricultura

Vamos construir o futuro da IA juntos!