CutMix
Descobre como a técnica de aumento de dados CutMix evita o sobreajuste (overfitting). Aprende a aplicá-la facilmente para treinar modelos Ultralytics YOLO26 robustos.
CutMix é uma técnica avançada de data augmentation utilizada para treinar modelos robustos de computer vision, cortando uma parte retangular de uma imagem e colando-a sobre uma imagem de destino. Ao contrário de aumentações mais simples que ajustam o brilho ou a rotação, o CutMix altera a composição fundamental de uma amostra de treino. Quando os pixels são trocados, os ground-truth labels correspondentes também são misturados proporcionalmente à área do recorte. Isso ajuda as artificial neural networks a aprender a identificar objetos a partir de vistas parciais, forçando o modelo a contar com múltiplas características em vez de focar apenas nas partes mais discriminativas de um objeto. Apresentado pela primeira vez num artigo académico de 2019, tornou-se uma operação padrão em frameworks de deep learning para evitar o overfitting e melhorar a generalização em grandes datasets.
Link to this sectionComo funciona a técnica#
Durante o treino do modelo, o algoritmo seleciona aleatoriamente uma coordenada central e um tamanho de caixa para extrair uma região de uma imagem secundária. Esse recorte é então sobreposto diretamente numa imagem primária dentro do batch ativo. Se a imagem primária contivesse um cão e a secundária um gato, a imagem final apresentaria um recorte de gato substituindo uma parte do cão. Os rótulos de classificação são atualizados usando linear interpolation com base na área exata do recorte — por exemplo, resultando num rótulo de 0.7 para cão e 0.3 para gato. Em tarefas de object detection, as bounding boxes que retêm pelo menos uma certa percentagem (frequentemente 10%) da sua área original dentro da região colada são preservadas. Esta técnica é suportada nativamente como um hiperparâmetro de treino cutmix no Ultralytics YOLO, permitindo que os utilizadores definam facilmente a probabilidade desta transformação.
Link to this sectionDiferenciando MixUp de Cutout#
O CutMix está estreitamente relacionado com duas outras técnicas proeminentes de data augmentation, mas resolve as suas limitações específicas:
- MixUp Augmentation: O MixUp mistura duas imagens globalmente ao calcular uma média ponderada dos seus valores de pixel. Embora eficaz, muitas vezes resulta em imagens fantasma pouco naturais e semitransparentes que podem confundir os modelos ao interromper a spatial correlation local. Em contraste, o CutMix preserva as intensidades originais dos pixels dentro das regiões cortadas, o que os investigadores otimizaram ainda mais em abordagens como Attentive CutMix.
- Cutout Augmentation: O Cutout descarta informações ao mascarar uma região retangular aleatória com pixels pretos ou a média do dataset. Embora encoraje o modelo a observar o objeto inteiro, desperdiça tensors de treino valiosos. O CutMix substitui esse espaço ausente por recortes informativos de image classification de outras imagens, aumentando a eficiência geral da aprendizagem.
Link to this sectionAplicações no Mundo Real#
Ao treinar modelos para reconhecer objetos severamente ocluídos, o CutMix aumenta significativamente o desempenho de machine learning em diversos setores.
- Automotive AI and Autonomous Driving: Em carros autónomos, ensina o sistema a identificar peões ou veículos mesmo quando estão parcialmente bloqueados por sinais de trânsito, aumentando a segurança em ambientes movimentados.
- Medical Diagnostics and Organ Segmentation: Na área da saúde, este método é amplamente utilizado para organ and tumor segmentation, permitindo que os modelos reconheçam limites complexos de tecidos mesmo quando estruturas anatómicas se sobrepõem.
- Remote Sensing for Satellite Imagery: Esta estratégia preserva classes densas e sobrepostas, como edifícios e vegetação, a partir de vistas aéreas. Variações avançadas são ativamente pesquisadas para melhorar o long-tailed recognition em dados fortemente desequilibrados.
Link to this sectionImplementação na Prática#
Integrar esta aumentação num pipeline de IA é simples. A maioria das bibliotecas de alto nível suporta-a nativamente, como PyTorch Transforms e Keras Preprocessing Layers.
Ao treinar um modelo como o YOLO26, configurar esta aumentação requer apenas um ajuste de parâmetro. Isto lida automaticamente tanto com a criação de recortes de imagem como com a lógica complexa de corte de bounding boxes.
from ultralytics import YOLO
# Initialize the recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")
# Train the model with CutMix enabled at a 50% probability
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, cutmix=0.5)Para equipas que gerem fluxos de trabalho de visão de grande escala, a Ultralytics Platform simplifica isto ao permitir que os utilizadores ajustem estas data augmentation best practices diretamente a partir de uma interface na cloud, agilizando o caminho desde a anotação até ao model deployment.






