Glossário

Subajuste (Underfitting)

Aprenda como identificar, prevenir e resolver o underfitting em modelos de machine learning com dicas de especialistas, estratégias e exemplos do mundo real.

A subadaptação ocorre na aprendizagem automática (ML) quando um modelo estatístico ou algoritmo é demasiado simples para captar a estrutura subjacente dos dados. Descreve um cenário em que o modelo não consegue aprender adequadamente as relações entre as variáveis de entrada e as variáveis-alvo. Como o modelo não consegue não consegue captar o sinal nos dados, apresenta um fraco desempenho nos dados de treino e generaliza mal para dados novos e não vistos. dados. Um modelo subadaptado sofre tipicamente de viés, o que significa que faz suposições fortes, muitas vezes erróneas suposições sobre os dados, resultando em padrões perdidos e baixa precisão.

Sinais e sintomas de subequipamento

A deteção do subajustamento é geralmente simples durante a fase de avaliação do modelo. O principal indicador é um resultado fraco resultados fracos nas métricas de desempenho, tais como taxas de erro elevadas ou baixa precisão, tanto no conjunto de treino como nos dados de validação. Se a função de perda se a função de perda se mantiver elevada e não diminuir significativamente ao longo do tempo, é provável que o modelo esteja subajustado. Ao contrário do sobreajuste, em que o modelo tem um bom desempenho nos dados de treino, mas com fraco desempenho nos dados de validação, a subadaptação representa uma falha na aprendizagem da tarefa essencialmente desde o essencialmente desde o início. A análise das curvas de aprendizagem pode um modelo subajustado apresentará curvas de treino e validação que convergem rapidamente mas mas com uma taxa de erro elevada.

Underfitting vs. Overfitting

Para compreender o subajustamento, é útil contrastá-lo com a sua contraparte oposta, sobreajuste. Estes dois conceitos representam os extremos do compromisso entre a polarização e a variância, que é central para a construção de sistemas de IA robustos.

Subajuste (viés elevado): O modelo é demasiado simples (por exemplo, um modelo linear para dados não lineares). O modelo presta muito pouca atenção aos dados de treino e simplifica demasiado o problema.
Sobreajuste (variância elevada): O modelo é demasiado complexo. Memoriza os dados de treino, incluindo incluindo ruído e outliers, tornando-o incapaz de generalizar para novas entradas.

O objetivo da aprendizagem profunda (DL) e de outras disciplinas de IA disciplinas de IA é encontrar o "ponto ideal" entre estes dois extremos, criando um modelo que seja suficientemente complexo para aprender os padrões, mas suficientemente simples para generalizar.

Causas e soluções comuns

Vários factores podem levar a um subajuste, mas são muitas vezes corrigíveis ajustando a arquitetura do modelo ou o pipeline de processamento de dados. de processamento de dados.

Simplicidade do modelo: A utilização de um modelo linear para um conjunto de dados complexo e não linear é uma causa frequente.
- Solução: Aumentar a complexidade ou a capacidade do modelo. Por exemplo, mudar de uma regressão simples regressão simples para uma rede neural (NN) ou utilizar uma arquitetura maior, como uma rede neural convolucional rede neural convolucional profunda (CNN).
Caraterísticas insuficientes: O modelo pode não ter os dados de entrada necessários para fazer previsões exactas.
- Solução: Efetuar engenharia de caraterísticas para criar entradas mais entradas mais descritivas ou aplicar técnicas de pré-processamento de dados para tornar padrões mais acessíveis.
Regularização excessiva: As técnicas concebidas para evitar o sobreajuste podem, por vezes, ser aplicadas de forma demasiado agressivamente.
- Solução: Reduzir os parâmetros associados à regularização ou baixar a taxa numa camada de abandono para dar mais liberdade ao modelo para aprender.
Tempo de formação insuficiente: Parar o processo de formação demasiado cedo impede o modelo de convergir.
- Solução: Treinar por mais épocas, dando ao algoritmo de otimização mais tempo para minimizar a perda.

Exemplos do Mundo Real

Previsão de preços de imóveis: Imagine usar um modelo simples de modelo de regressão linear simples para prever os preços preços de habitação com base apenas na metragem quadrada. Os preços das casas no mundo real são influenciados por factores complexos e não lineares como como a localização, a qualidade do bairro e as tendências do mercado. Um modelo linear não conseguiria captar estas nuances, resultando resultando num ajuste insuficiente e resultados de modelação preditiva pobres, em que as estimativas são consistentemente imprecisas.
Diagnóstico por imagem médica: Em IA nos cuidados de saúde, a deteção de tumores em exames de ressonância magnética requer a identificação de formas e texturas complexas. Se os programadores utilizarem uma rede pouco profunda ou um modelo com muito poucos parâmetros para esta tarefa de deteção de objectos, o modelo modelo provavelmente não conseguirá distinguir o tumor do tecido saudável. Falta-lhe a "capacidade" de aprender as caraterísticas pormenorizadas necessárias para uma sensibilidade e especificidade.

Abordar a subadaptação com o código

No contexto da visão por computador, o subajuste ocorre frequentemente quando se utiliza uma variante de modelo demasiado pequena para a para a dificuldade da tarefa (por exemplo, a deteção de pequenos objectos em imagens de drones de alta resolução). O seguinte Python exemplo demonstra como mudar de um modelo mais pequeno para um modelo maior e mais modelo mais capaz usando o ultralytics para resolver uma eventual subadaptação.

from ultralytics import YOLO

# If 'yolo11n.pt' (Nano) is underfitting and yielding low accuracy,
# upgrade to a model with higher capacity like 'yolo11l.pt' (Large).
model = YOLO("yolo11l.pt")

# Train the larger model.
# Increasing epochs also helps the model converge if it was previously underfitting.
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Ao mudar para um maior Ultralytics YOLO11 modelo e assegurando duração adequada do treino, o sistema ganha os parâmetros necessários para aprender padrões complexos, mitigando eficazmente o padrões complexos, atenuando eficazmente a subadaptação. Para tarefas extremamente complexas, arquitecturas futuras como a YOLO26 (atualmente em desenvolvimento) têm como objetivo proporcionar uma densidade e precisão ainda maiores. Para verificar se o seu modelo já não está a ser subajustado, deve sempre avaliá-lo com um conjunto de dados de teste robusto.

Subajuste (Underfitting)

Treine os modelosYOLO Ultralytics para simplificar os fluxos de trabalho em todos os sectores

Solução de licenciamento empresarial flexível para impulsionar sua inovação

Treine modelos de IA em segundos com o Ultralytics YOLO

Sinais e sintomas de subequipamento

Underfitting vs. Overfitting

Causas e soluções comuns

Exemplos do Mundo Real

Abordar a subadaptação com o código

Leia mais nesta categoria

Compreender por que a anotação humana no ciclo é fundamental

O que é destilação de conjuntos de dados? Uma rápida visão geral

Os óculos Oakley Meta AI estão a redefinir os óculos com a Vision AI

Junte-se à comunidade Ultralytics