Glossário

Caixa delimitadora

Aprende como as caixas delimitadoras permitem a deteção de objectos, a IA e os sistemas de aprendizagem automática. Explora o seu papel nas aplicações de visão por computador!

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

Uma caixa delimitadora é uma moldura retangular utilizada na visão por computador (CV) para indicar a localização e a extensão aproximada de um objeto numa imagem ou num quadro de vídeo. Normalmente definidas pelas coordenadas dos seus cantos superior esquerdo e inferior direito (ou ponto central, largura e altura), estas caixas fornecem um método simples mas eficaz para especificar a localização de um objeto e o espaço que ocupa. As caixas delimitadoras são componentes fundamentais em várias tarefas de CV, incluindo a deteção de objectos, o seguimento de objectos e a anotação de imagens, constituindo uma pedra angular de muitos sistemas modernos de Inteligência Artificial (IA) e de aprendizagem automática (ML). São essenciais para permitir que as máquinas compreendam não só que objectos estão presentes, mas também onde estão localizados numa cena visual.

Importância na deteção de objectos

As caixas delimitadoras são cruciais tanto para o treino como para a avaliação de modelos de deteção de objectos. Em tarefas abordadas por modelos como o Ultralytics YOLOdo Ultralytics, as caixas delimitadoras servem de "verdade básica" durante o processo de treino. Isto significa que representam a localização e o tamanho corretos dos objectos nos dados de treino, ensinando o modelo a localizar objectos com precisão. Este processo começa frequentemente com uma anotação cuidadosa dos dados, em que os humanos ou as ferramentas automatizadas desenham estas caixas à volta dos objectos nas imagens, utilizando frequentemente plataformas como o CVAT ou integrando-se em plataformas como o Ultralytics HUB para a gestão do conjunto de dados. Durante a inferência, o modelo treinado prevê caixas delimitadoras em torno dos objectos detectados, juntamente com etiquetas de classe e pontuações de confiança. Esta capacidade de localização é vital para aplicações que requerem não só a identificação de objectos, mas também a sua posição exacta.

Conceitos-chave relacionados com as caixas delimitadoras

Várias métricas e técnicas estão intimamente associadas à utilização e avaliação de caixas delimitadoras em modelos de ML:

  • Intersecção sobre União (IoU): Uma métrica utilizada para medir a sobreposição entre a caixa delimitadora prevista e a caixa delimitadora da verdade terrestre. Quantifica a precisão da localização.
  • Supressão não máxima (NMS): Uma técnica de pós-processamento utilizada para eliminar caixas delimitadoras redundantes e sobrepostas para o mesmo objeto, mantendo apenas a previsão mais segura.
  • Precisão média (mAP): Uma métrica padrão para avaliar o desempenho dos modelos de deteção de objectos, considerando tanto a precisão da classificação como a precisão da localização (frequentemente baseada num limiar IoU). Ver métricas de desempenhoYOLO detalhadas.
  • Caixas de ancoragem: Caixas predefinidas de vários tamanhos e proporções usadas em alguns detectores (como as versões mais antigas YOLO ) para ajudar a prever as caixas delimitadoras de forma mais eficaz. Os modelos mais recentes, incluindo YOLO11são frequentemente isentos de âncoras, simplificando a cabeça de deteção.
  • Conjunto de dados COCO: Um conjunto de dados de deteção, segmentação e legendagem de objectos em grande escala, amplamente utilizado para aferir modelos de deteção de objectos. Ultralytics fornece acesso fácil ao COCO e a outros conjuntos de dados de deteção.

Caixas delimitadoras vs. termos relacionados

Enquanto as caixas delimitadoras padrão (alinhadas com o eixo) localizam objectos com rectângulos simples, outras técnicas de visão por computador oferecem diferentes níveis de detalhe ou lidam com diferentes cenários:

Aplicações em cenários do mundo real

As caixas delimitadoras são parte integrante de inúmeras aplicações práticas de IA:

  1. Veículos autónomos: Os veículos autónomos dependem fortemente da deteção de objectos para identificar e localizar peões, outros veículos, semáforos e obstáculos utilizando caixas delimitadoras. Esta consciência espacial, frequentemente conseguida através de modelos de aprendizagem profunda, é fundamental para uma navegação segura e para a tomada de decisões. Empresas como a Waymo apresentam esta tecnologia de forma extensiva. Ultralytics oferece-te informações sobre a IA nos automóveis autónomos.
  2. Análise de retalho: No retalho, as caixas delimitadoras ajudam na gestão de inventário orientada por IA, detectando produtos nas prateleiras, monitorizando os níveis de stock e analisando o comportamento dos clientes através da interação nas prateleiras ou dos padrões de tráfego pedonal(contagem de objectos).
  3. Segurança e vigilância: As caixas delimitadoras permitem que os sistemas de monitorização automatizados detectem e acompanhem indivíduos ou objectos de interesse em tempo real, accionando alertas de acesso não autorizado ou actividades suspeitas. Isto é fundamental para aplicações de construção como sistemas de alarme de segurança.
  4. Análise de imagens médicas: Nos cuidados de saúde, as caixas delimitadoras ajudam os radiologistas e os médicos ao realçarem potenciais anomalias, como tumores ou lesões em exames (raios X, TAC, RMN), ajudando a efetuar um diagnóstico mais rápido e preciso. Vê exemplos em Radiologia: Inteligência Artificial e Visão geral da Ultralytics sobre análise de imagens médicas.
  5. Agricultura: As caixas delimitadoras são utilizadas na agricultura de precisão para tarefas como a identificação de frutos para colheita(deteção de frutos), a monitorização da saúde das culturas ou a deteção de pragas.
Lê tudo