Glossário

Supressão não máxima (NMS)

Descubra a Supressão Não Máxima (NMS) para deteção de objectos. Saiba como refina os resultados, melhora a precisão e potencia aplicações de IA como o YOLO.

A supressão não-máxima (NMS) é um algoritmo de pós-processamento fundamental utilizado na visão por computador, em especial em tarefas de deteção de objectos. O seu principal objetivo é limpar a saída de um modelo de deteção, filtrando caixas delimitadoras redundantes e sobrepostas para garantir que cada objeto é identificado apenas uma vez. Quando um modelo de deteção de objectos, como o Ultralytics YOLO, faz previsões, gera frequentemente várias caixas candidatas à volta do mesmo objeto, cada uma com uma pontuação de confiança diferente. O NMS seleciona de forma inteligente a melhor caixa delimitadora para cada objeto e suprime, ou elimina, todas as outras caixas sobrepostas que são consideradas não máximas.

Como funciona a supressão não máxima

O algoritmo NMS funciona através da iteração através das caixas delimitadoras previstas e da tomada de decisões com base em duas métricas principais: pontuações de confiança e o limiar de Intersecção sobre União (IoU). O processo pode ser resumido nas seguintes etapas:

  1. Ordenar por confiança: Todas as caixas delimitadoras previstas são primeiro ordenadas por ordem decrescente com base nas suas pontuações de confiança. A caixa com a pontuação mais elevada é considerada a mais provável de estar correta.
  2. Selecionar a melhor caixa: A caixa delimitadora com a pontuação de confiança mais elevada é selecionada, e todas as outras caixas que tenham um IoU elevado com esta caixa selecionada (ou seja, que se sobreponham significativamente) são removidas da lista.
  3. Repetir: O processo é repetido com as restantes caixas delimitadoras até que todas as caixas tenham sido selecionadas ou suprimidas.

O limiar IoU é um hiperparâmetro crítico, definido pelo utilizador. Um limiar IoU baixo resultará em menos detecções, uma vez que suprimirá caixas que tenham mesmo uma pequena sobreposição, enquanto um limiar elevado pode permitir múltiplas detecções para o mesmo objeto. O ajuste fino deste limiar faz frequentemente parte da otimização do desempenho de um modelo num conjunto de dados específico.

Aplicações da supressão não máxima

O NMS é um componente crucial em muitas aplicações de IA do mundo real que dependem da deteção precisa de objectos.

  • Veículos autónomos: Nos veículos autónomos, os sistemas de deteção de objectos devem identificar com precisão os peões, ciclistas e outros veículos a partir de várias entradas de câmara e LiDAR. O NMS garante que um único peão não é detectado como vários indivíduos, fornecendo uma entrada limpa para os sistemas de planeamento de trajetória e de tomada de decisões do automóvel. Isto evita comportamentos erráticos, como travagens desnecessárias causadas por detecções redundantes. Para mais informações, consultar a investigação sobre deteção de objectos 3D para condução autónoma.
  • Imagiologia médica: Na análise de imagens médicas, a NMS é utilizada para aperfeiçoar a deteção de anomalias como tumores ou lesões em exames de TAC ou MRI. Por exemplo, quando se utiliza um modelo como o YOLO11 para detetar tumores, a NMS ajuda a garantir que um único tumor é identificado com uma caixa delimitadora, melhorando a precisão dos diagnósticos e o planeamento do tratamento, tal como explorado na investigação de imagens médicas.

Comparação com técnicas relacionadas

O NMS é especificamente um passo de pós-processamento aplicado depois de um modelo de deteção de objectos ter gerado o seu conjunto inicial de caixas delimitadoras candidatas. Não deve ser confundido com a própria arquitetura de deteção, como a diferença entre detectores baseados em âncoras e detectores sem âncoras. Estas arquitecturas definem a forma como as caixas potenciais são propostas, enquanto o NMS aperfeiçoa essas propostas.

Curiosamente, o custo computacional e os potenciais estrangulamentos associados ao NMS estimularam a investigação de detectores de objectos sem NMS. Modelos como o YOLOv10 integram mecanismos durante a formação para evitar inerentemente a previsão de caixas redundantes, com o objetivo de reduzir a latência da inferência e permitir uma verdadeira deteção de ponta a ponta. Isto contrasta com abordagens tradicionais como o Ultralytics YOLOv8 ou YOLOv5, em que o NMS continua a ser uma parte padrão e essencial do pipeline de inferência. Pode explorar comparações técnicas, como YOLOv10 vs. YOLOv8, na nossa documentação. Variantes como o Soft-NMS oferecem abordagens alternativas que reduzem as pontuações de caixas sobrepostas em vez de eliminá-las completamente.

Integração com ferramentas Ultralytics

O NMS está perfeitamente integrado no ecossistema Ultralytics. Os modelos YOLO do Ultralytics aplicam automaticamente o NMS durante o previsão (predict) e validação (val) garantindo que os utilizadores recebem resultados de deteção limpos e precisos por defeito. Os parâmetros que controlam o comportamento do NMS (como o limiar de IoU e o limiar de confiança) podem frequentemente ser ajustados às necessidades específicas da aplicação.

Plataformas como o Ultralytics HUB abstraem ainda mais esses detalhes, permitindo que os usuários treinem modelos e os implantem onde o NMS é tratado automaticamente como parte do pipeline otimizado. Esta integração garante que os utilizadores, independentemente dos seus conhecimentos técnicos profundos em MLOps, podem beneficiar de resultados de deteção de objectos de última geração para várias tarefas de visão computacional. Os detalhes específicos de implementação na estrutura do Ultralytics podem ser explorados na referência dos utilitários do Ultralytics. Para mais definições, consulte o Glossário Ultralytics principal.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Ligue-se, colabore e cresça com inovadores globais

Aderir agora
Ligação copiada para a área de transferência