Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Perda focal

Descubra como a Perda Focal lida com o desequilíbrio de classes na deteção de objectos - concentrando o treino em exemplos difíceis para melhorar a precisão em conjuntos de dados desequilibrados.

A perda focal é uma função objetiva especializada concebida para resolver o problema do desequilíbrio extremo das classes na formação de aprendizagem automática. aprendizagem automática, particularmente no domínio da visão computacional. Em muitos cenários de deteção de objectos, o número de exemplos de fundo (negativos) excede largamente o número de objectos de interesse (positivos). As funções de perda padrão podem podem ficar sobrecarregadas com o grande volume destes exemplos de fundo fáceis de classify , dificultando a capacidade do modelo para aprender os exemplos positivos mais difíceis. A perda focal atenua esse problema dimensionando dinamicamente a perda com base na confiança da previsão, reduzindo efetivamente a ponderação dos exemplos fáceis e forçando o modelo a concentrar os seus esforços de esforços de treino em negativos difíceis e objectos mal classificados.

Resolver o desequilíbrio entre classes

A principal motivação por detrás da Perda Focal é melhorar o desempenho dos detectores de objectos de uma fase, como as versões iniciais do RetinaNet e arquitecturas modernas como o Ultralytics YOLO11. Nestes sistemas, o detetor analisa uma imagem e gera milhares de localizações candidatas. Uma vez que a maior parte de uma imagem é normalmente fundo, o rácio de fundo para o objeto pode frequentemente ser de 1000:1 ou superior.

Sem intervenção, o efeito cumulativo dos pequenos erros do grande número de amostras de fundo pode dominar as actualizações do gradiente durante a retropropagação. Isto faz com que o algoritmo de otimização dê prioridade à simples classificar tudo como fundo para minimizar o erro geral, em vez de aprender as caraterísticas matizadas dos objectos reais. A perda focal remodela a curva de perda padrão para reduzir a penalidade para exemplos nos quais o modelo já está confiante, direcionando confiante, direcionando assim os direciona os pesos do modelo para se ajustar aos casos desafiadores.

Mecanismo e funcionalidade

A Perda Focal é uma extensão da perda de entropia cruzada utilizada na classificação binária. Esta introduz um fator de modulação que diminui a contribuição da perda à medida que a confiança na classe correta aumenta. Quando um modelo encontra um exemplo "fácil" - como um pedaço de céu claro que identifica corretamente como fundo com elevada probabilidade - o fator de modulação faz com que a perda se aproxime de zero. Por outro lado, para exemplos "difíceis exemplos em que a previsão do modelo é incorrecta ou incerta, a perda continua a ser significativa.

Este comportamento é controlado por um parâmetro de focagem, frequentemente designado por gama. Ao ajustar este parâmetro, os cientistas de dados podem ajustar a agressividade com que a função de perda reduz o peso dos exemplos bem classificados. Isto permite um treino mais estável estável em dados de treino altamente desequilibrados, levando a uma maior exatidão e recuperação para classes raras.

Aplicações no Mundo Real

A capacidade de lidar com o desequilíbrio torna o Focal Loss essencial em ambientes de segurança crítica e de alta precisão.

  • Condução autónoma: No contexto dos veículos autónomos, um sistema de visão deve detect peões, ciclistas e sinais de trânsito. Num vídeo típico, a grande maioria dos pixéis representa a estrada, céu ou edifícios, enquanto os obstáculos críticos aparecem de forma esparsa. A perda focal ajuda o sistema de perceção a ignorar os a abundância de dados da superfície da estrada e concentrar-se na identificação de objectos dinâmicos potencialmente perigosos perigosos, objectos dinâmicos que aparecem com pouca frequência mas mas que têm grande importância para a soluções de IA no sector automóvel.
  • Diagnóstico médico: Na análise de imagens médicas, a identificação de anomalias, como tumores ou fracturas, é um problema clássico de agulha no palheiro. Um exame de um cérebro saudável consiste consiste quase inteiramente em tecido saudável, com um tumor a ocupar uma pequena fração do volume. A utilização da perda focal permite que os modelos de permite que a IA nos modelos de cuidados de saúde aprenda com os poucos píxeis que representam a patologia sem serem influenciados pela quantidade esmagadora de tecido saudável, melhorando a sensibilidade das ferramentas de diagnóstico.

Implementação com Ultralytics

O ultralytics A biblioteca fornece uma implementação robusta da Perda Focal que pode ser facilmente integrada em em pipelines de treinamento personalizados. O exemplo a seguir demonstra como inicializar a função de perda e calcular o erro erro entre os logits de previsão e os rótulos da verdade terrestre.

import torch
from ultralytics.utils.loss import FocalLoss

# Initialize Focal Loss with a gamma of 1.5
criterion = FocalLoss(gamma=1.5)

# Example: Prediction logits (before activation) and Ground Truth labels (0 or 1)
preds = torch.tensor([[0.1], [2.5], [-1.0]], requires_grad=True)
targets = torch.tensor([[0.0], [1.0], [1.0]])

# Compute the loss
loss = criterion(preds, targets)
print(f"Focal Loss value: {loss.item():.4f}")

Relação com Outros Conceitos

É útil distinguir a Perda Focal dos termos relacionados no panorama da função de perda:

  • Perda Focal vs. Intropia Cruzada: A perda de entropia cruzada é é a função de base que trata todos os exemplos da mesma forma. A perda focal baseia-se estritamente na entropia cruzada, adicionando o fator fator modulador para tratar o desequilíbrio. Se o parâmetro de foco (gama) for definido como 0, a perda focal efetivamente reverte para a entropia cruzada padrão.
  • Perda Focal vs. Perda IoU : Enquanto a perda focal aborda a classificação (qual é o objeto?), funções como Intersecção sobre União (IoU) e as suas variantesGIoU, CIoU) abordam a localização (onde está o objeto?). Os detectores modernos como YOLO11 utilizam normalmente uma função de perda composta, combinando a perda Focal para a previsão de classes e a perda IoU para regressão da caixa delimitadora.
  • Perda Focal vs. Perda Varifocal: A perda varifocal é uma evolução adicional que trata os exemplos positivos e negativos de forma assimétrica. Utiliza a pontuação IoU para ponderar os exemplos exemplos positivos, dando prioridade àqueles com maior precisão de localização, enquanto a Perda Focal padrão trata todos os igualmente.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora