Entenda o desempenho do modelo com uma matriz de confusão. Explore métricas, usos no mundo real e ferramentas para refinar a precisão da classificação de IA.
Uma matriz de confusão é uma ferramenta de medição de desempenho para problemas de classificação de aprendizagem automática em que o resultado pode ser duas ou mais classes. É uma tabela com quatro combinações diferentes de valores previstos e reais, servindo como um elemento fundamental para a visualização de dados na avaliação do modelo. Ao contrário da precisão simples, que pode ser enganosa se o conjunto de dados estiver desequilibrado, uma matriz de confusão fornece uma análise granular de onde um modelo de visão computacional (CV) está a cometer erros. Ao comparar as previsões com os rótulos de verdade fundamental, os programadores podem determinar se o sistema está a confundir duas classes específicas ou a falhar completamente na detect objeto.
A matriz em si é normalmente dividida em quatro quadrantes para classificação binária, embora se expanda para problemas multiclasse, como os tratados pelo Ultralytics . Esses quatro componentes representam a interseção entre o que o modelo previu e o que realmente existe na imagem.
Os números brutos numa matriz de confusão são usados para calcular métricas mais avançadas que descrevem o desempenho do modelo. Compreender esses derivados é essencial para otimizar redes neurais.
O custo específico dos erros definido pela matriz de confusão determina como os modelos são ajustados para diferentes setores.
No campo da IA na área da saúde, a matriz de confusão é uma questão de segurança. Ao treinar um modelo para análise de imagens médicas para detect , um falso negativo (não detetar um tumor) é muito pior do que um falso positivo (sinalizar uma mancha benigna para revisão médica). Portanto, os engenheiros priorizam a recuperação em detrimento da precisão nessas matrizes para garantir que nenhum risco potencial à saúde seja ignorada.
Por outro lado, na controle de qualidade da produção, a eficiência é fundamental. Se um sistema que classifica peças da linha de montagem gera muitos falsos positivos (marcando peças boas como defeituosas), isso causa desperdício desnecessário e retarda a produção. Aqui, a matriz de confusão ajuda os engenheiros a ajustar o modelo para maximizar a precisão, garantindo que o que é rejeitado seja realmente defeituoso, simplificando os fluxos de trabalho automatizados de aprendizagem automática .
Ao utilizar frameworks modernos, a geração dessa matriz geralmente faz parte do pipeline de validação padrão. O exemplo
abaixo demonstra como validar um
Modelo YOLO26 e aceda aos dados da matriz de confusão
usando o ultralytics pacote.
from ultralytics import YOLO
# Load a pre-trained YOLO26 model
model = YOLO("yolo26n.pt")
# Validate the model on the COCO8 dataset
# This automatically generates and plots the confusion matrix
metrics = model.val(data="coco8.yaml")
# Access the confusion matrix object directly
print(metrics.confusion_matrix.matrix)
É importante distinguir a matriz de confusão de termos de avaliação semelhantes.