Glossário

Suavização de rótulos

Aprimore a precisão e a robustez do modelo de IA com o label smoothing — uma técnica comprovada para melhorar a generalização e reduzir o excesso de confiança.

O Label Smoothing é uma técnica de regularização usada durante o treinamento de modelos de aprendizado de máquina, particularmente em tarefas de classificação. Ele aborda a questão da superconfiança do modelo, impedindo que o modelo atribua a probabilidade total de 1.0 à classe correta. Em vez de usar rótulos "rígidos" (onde a classe correta é 1 e todas as outras são 0), o Label Smoothing cria rótulos "suaves", distribuindo uma pequena porção da massa de probabilidade para as outras classes. Isso incentiva o modelo a ser menos certo sobre suas previsões, o que pode levar a uma melhor generalização e melhor desempenho em dados não vistos. A técnica foi notavelmente usada em modelos de alto desempenho e é detalhada em artigos como When Does Label Smoothing Help?.

Como o Label Smoothing Funciona

Em um problema típico de classificação de aprendizado supervisionado, os dados de treinamento consistem em entradas e seus rótulos corretos correspondentes. Por exemplo, em uma tarefa de classificação de imagens, uma imagem de um gato teria o rótulo "gato" representado como um vetor one-hot encoded como para as classes [gato, cachorro, pássaro]. Ao calcular a função de perda, o modelo é penalizado com base no quão distante sua previsão está desse alvo fixo.

O Label Smoothing modifica esse alvo. Ele reduz ligeiramente a probabilidade alvo para a classe correta (por exemplo, para 0,9) e distribui a pequena probabilidade restante (0,1 neste caso) uniformemente entre as classes incorretas. Assim, o novo alvo "suave" pode ser semelhante a [0,9, 0,05, 0,05]. Essa pequena mudança desencoraja a camada de logit final de uma rede neural de produzir valores extremamente grandes para uma classe, o que ajuda a evitar o overfitting. Este processo pode ser gerenciado durante o treinamento do modelo usando plataformas como o Ultralytics HUB.

Benefícios do Label Smoothing

A principal vantagem do Label Smoothing é que melhora a calibração do modelo. As pontuações de confiança previstas de um modelo bem calibrado refletem com mais precisão a verdadeira probabilidade de correção. Isto é crucial para aplicações onde a compreensão da certeza do modelo é importante, como na análise de imagem médica. Ao evitar o excesso de confiança, também melhora a capacidade do modelo de generalizar para novos dados, um objetivo fundamental de qualquer projeto de aprendizagem automática. Isto resulta frequentemente num ligeiro aumento na precisão. Uma melhor generalização leva a modelos mais robustos para inferência em tempo real e implementação final do modelo.

Aplicações no Mundo Real

O Label Smoothing é uma técnica simples, mas eficaz, aplicada em vários modelos de última geração.

Classificação de Imagens em Larga Escala: Modelos como o Ultralytics YOLO treinados para tarefas de classificação de imagens em conjuntos de dados massivos como o ImageNet frequentemente usam Label Smoothing. Esses conjuntos de dados podem, por vezes, conter rótulos ruidosos ou incorretos do processo de rotulagem de dados. O Label Smoothing torna o modelo mais robusto a esse ruído nos rótulos, impedindo-o de aprender a ser excessivamente confiante sobre rótulos potencialmente errados. Você pode explorar uma variedade de conjuntos de dados de classificação para seus projetos.
Processamento de Linguagem Natural (NLP): Em tarefas como tradução automática, pode haver várias traduções válidas para uma única frase. O Label Smoothing, usado em modelos como o Transformer, desencoraja o modelo de atribuir uma probabilidade de 1.0 a uma única palavra correta no vocabulário, reconhecendo que outras palavras também podem ser adequadas. Este conceito é fundamental no NLP moderno e é discutido em recursos de instituições como o Stanford NLP Group.

Label Smoothing vs. Conceitos Relacionados

É importante diferenciar Label Smoothing de outras técnicas de regularização.

Rótulos Hard: Esta é a abordagem padrão onde o modelo é treinado com certeza absoluta (100% para a classe correta). O Label Smoothing é uma alternativa direta a isso.
Aumento de Dados: Esta é outra técnica de regularização que cria novos exemplos de treino aplicando transformações aos dados existentes. Aumenta a diversidade do conjunto de dados, enquanto o Label Smoothing modifica os próprios valores alvo. Pode encontrar guias para aumento de dados YOLO na documentação da Ultralytics.
Dropout: Este método desativa aleatoriamente uma fração de neurônios durante cada etapa de treinamento para evitar co-adaptações complexas. Ele modifica a arquitetura do modelo durante o treinamento, enquanto o Label Smoothing modifica o cálculo da perda. Uma análise mais aprofundada do dropout pode ser encontrada em um artigo da GeeksforGeeks sobre o tópico.
Destilação de Conhecimento: Nesta técnica, um modelo "estudante" menor é treinado usando os rótulos suaves produzidos por um modelo "professor" maior, pré-treinado. Embora também utilize rótulos suaves, a fonte desses rótulos são as previsões de outro modelo, e não uma simples heurística aplicada aos rótulos ground truth, como no Label Smoothing. O artigo original Distilling the Knowledge in a Neural Network fornece uma compreensão fundamental deste conceito.

Suavização de rótulos

Treine modelos Ultralytics YOLO para otimizar fluxos de trabalho em todos os setores

Solução de licenciamento empresarial flexível para impulsionar sua inovação

Treine modelos de IA em segundos com o Ultralytics YOLO

Como o Label Smoothing Funciona

Benefícios do Label Smoothing

Aplicações no Mundo Real

Label Smoothing vs. Conceitos Relacionados

Leia mais nesta categoria

Implantar modelos YOLO do Ultralytics usando a integração do ExecuTorch

Principais destaques da Ultralytics na Conferência PyTorch 2025

Utilizar a aprendizagem auto-supervisionada para eliminar o ruído das imagens

Junte-se à comunidade Ultralytics