Perda focal
Descubra como a Perda Focal lida com o desequilíbrio de classes na deteção de objectos - concentrando o treino em exemplos difíceis para melhorar a precisão em conjuntos de dados desequilibrados.
A perda focal é uma função de perda especializada concebida para resolver o problema do desequilíbrio de classes durante a formação de modelos de aprendizagem automática. Este problema é particularmente comum em tarefas de deteção de objectos, em que o número de exemplos de fundo (classe negativa) pode ultrapassar largamente o número de objectos de interesse em primeiro plano (classe positiva). Ao ajustar dinamicamente o peso de cada exemplo, a Perda focal incentiva o modelo a concentrar os seus esforços de aprendizagem em exemplos difíceis de classificar, em vez de ficar sobrecarregado pelo grande número de exemplos negativos fáceis de classificar. Esta abordagem melhora significativamente a precisão e o desempenho dos modelos treinados em conjuntos de dados desequilibrados.
Como funciona a perda focal
A perda focal é uma melhoria da perda de entropia cruzada padrão, que é amplamente utilizada para tarefas de classificação de imagens. A principal inovação, introduzida no artigo RetinaNet por investigadores da Meta AI (anteriormente Facebook AI Research), é um fator de modulação que reduz a contribuição da perda de exemplos bem classificados. Isto permite que as actualizações de retropropagação do modelo sejam impulsionadas principalmente pelos erros de exemplos difíceis de classificar. A função inclui um "parâmetro de focalização" que controla a taxa a que a perda de exemplos fáceis é reduzida. Ao dar prioridade a estes exemplos difíceis, o algoritmo de otimização pode fazer ajustes mais significativos aos pesos do modelo, conduzindo a um melhor desempenho geral, especialmente para detectores de objectos de uma fase como o RetinaNet e algumas versões do YOLO. Pode explorar uma implementação técnica da perda focal na documentação do Ultralytics.
Aplicações no Mundo Real
A perda focal é fundamental para treinar modelos robustos para vários cenários do mundo real em que o desequilíbrio de classes é um desafio significativo.
- Condução autónoma: No desenvolvimento de veículos autónomos, os modelos devem detetar uma vasta gama de objectos, alguns dos quais aparecem com pouca frequência, como peões, ciclistas ou sinais de trânsito distantes. A grande maioria de uma imagem pode ser a estrada ou o céu (fundo). A perda focal ajuda o modelo a prestar mais atenção a estes objectos críticos mas raros, garantindo que não passam despercebidos. Isto é crucial para a criação de soluções de IA seguras e fiáveis no sector automóvel. Uma visão geral dos desafios neste domínio é fornecida por instituições como a Universidade Carnegie Mellon.
- Diagnóstico médico: Na análise de imagens médicas, os modelos são treinados para detetar anomalias como tumores ou lesões em exames. Muitas vezes, a região anómala é muito pequena em comparação com o tecido saudável circundante. A Perda focal permite que o modelo se concentre na identificação destas áreas subtis e difíceis de detetar, que de outra forma poderiam ser ignoradas em favor da classe de fundo esmagadoramente grande. Isto conduz a ferramentas de diagnóstico mais precisas e fiáveis, como se vê nas aplicações para deteção de tumores em conjuntos de dados médicos.
Comparação com outras funções de perda
É importante distinguir a perda focal de outras funções de perda relacionadas utilizadas na visão por computador.
- Perda de Entropia Cruzada: A perda focal é uma modificação direta da perda de entropia cruzada. Enquanto a entropia cruzada trata todos os exemplos igualmente, a perda focal introduz um termo para reduzir o impacto de exemplos fáceis, tornando-a mais adequada para dados de treinamento desequilibrados. Para uma compreensão mais profunda da entropia cruzada, as notas CS231n de Stanford oferecem uma boa explicação.
- Perda Varifocal: Esta é uma função de perda mais recente que se baseia nos princípios da Perda Focal. Enquanto a perda focal trata todos os exemplos positivos igualmente, a perda varifocal os pondera com base em sua pontuação de classificação, dando mais peso a exemplos positivos de alta qualidade. É possível saber mais sobre sua implementação específica na referência da função de perda do Ultralytics.
- Perdas baseadas em IoU: Funções como Intersecção Generalizada sobre União (IoU), DIoU e CIoU são utilizadas para medir a precisão da localização de uma caixa delimitadora prevista. Estão preocupadas com a localização de um objeto, enquanto que a Perda Focal está preocupada com o que é um objeto (a sua classificação). Nos detectores modernos, como o Ultralytics YOLOv8, a perda de classificação (como a perda focal) e a perda de regressão (como uma perda baseada em IoU) são utilizadas em conjunto para treinar o modelo.