Glossário

Caixa delimitadora

Aprende como as caixas delimitadoras permitem a deteção de objectos, a IA e os sistemas de aprendizagem automática. Explora o seu papel nas aplicações de visão por computador!

Uma caixa delimitadora é uma moldura retangular utilizada na visão por computador (CV) para indicar a localização e a extensão aproximada de um objeto numa imagem ou num quadro de vídeo. Normalmente definidas pelas coordenadas dos seus cantos superior esquerdo e inferior direito (ou ponto central, largura e altura), estas caixas fornecem um método simples mas eficaz para especificar a localização de um objeto e o espaço que ocupa. As caixas delimitadoras são componentes fundamentais em várias tarefas de CV, incluindo a deteção de objectos, o seguimento de objectos e a anotação de imagens, constituindo uma pedra angular de muitos sistemas modernos de Inteligência Artificial (IA) e de aprendizagem automática (ML). São essenciais para permitir que as máquinas compreendam não só que objectos estão presentes, mas também onde estão localizados numa cena visual.

Importância na deteção de objectos

As caixas delimitadoras são cruciais tanto para o treino como para a avaliação de modelos de deteção de objectos. Em tarefas abordadas por modelos como o Ultralytics YOLOdo Ultralytics, as caixas delimitadoras servem de "verdade básica" durante o processo de treino. Isto significa que representam a localização e o tamanho corretos dos objectos nos dados de treino, ensinando o modelo a localizar objectos com precisão. Este processo começa frequentemente com uma anotação cuidadosa dos dados, em que os humanos ou as ferramentas automatizadas desenham estas caixas à volta dos objectos nas imagens, utilizando frequentemente plataformas como o CVAT ou integrando-se em plataformas como o Ultralytics HUB para a gestão do conjunto de dados. Durante a inferência, o modelo treinado prevê caixas delimitadoras em torno dos objectos detectados, juntamente com etiquetas de classe e pontuações de confiança. Esta capacidade de localização é vital para aplicações que requerem não só a identificação de objectos, mas também a sua posição exacta.

Conceitos-chave relacionados com as caixas delimitadoras

Várias métricas e técnicas estão intimamente associadas à utilização e avaliação de caixas delimitadoras em modelos de ML:

Intersecção sobre União (IoU): Uma métrica utilizada para medir a sobreposição entre a caixa delimitadora prevista e a caixa delimitadora da verdade terrestre. Quantifica a precisão da localização.
Supressão não máxima (NMS): Uma técnica de pós-processamento utilizada para eliminar caixas delimitadoras redundantes e sobrepostas para o mesmo objeto, mantendo apenas a previsão mais segura.
Precisão média (mAP): Uma métrica padrão para avaliar o desempenho dos modelos de deteção de objectos, considerando tanto a precisão da classificação como a precisão da localização (frequentemente baseada num limiar IoU). Ver métricas de desempenhoYOLO detalhadas.
Caixas de ancoragem: Caixas predefinidas de vários tamanhos e proporções usadas em alguns detectores (como as versões mais antigas YOLO ) para ajudar a prever as caixas delimitadoras de forma mais eficaz. Os modelos mais recentes, incluindo YOLO11são frequentemente isentos de âncoras, simplificando a cabeça de deteção.
Conjunto de dados COCO: Um conjunto de dados de deteção, segmentação e legendagem de objectos em grande escala, amplamente utilizado para aferir modelos de deteção de objectos. Ultralytics fornece acesso fácil ao COCO e a outros conjuntos de dados de deteção.

Caixas delimitadoras vs. termos relacionados

Enquanto as caixas delimitadoras padrão (alinhadas com o eixo) localizam objectos com rectângulos simples, outras técnicas de visão por computador oferecem diferentes níveis de detalhe ou lidam com diferentes cenários:

Segmentação de imagens: Atribui uma etiqueta de classe a cada pixel de uma imagem. Ao contrário das caixas delimitadoras que fornecem uma localização grosseira, a segmentação oferece uma localização fina.
Segmentação semântica: Atribui cada pixel a uma categoria (por exemplo, "carro", "estrada", "céu") mas não distingue entre diferentes instâncias da mesma classe de objeto.
Segmentação de Instância: Dá um passo em frente em relação à segmentação semântica, identificando instâncias de objectos individuais dentro de cada categoria ao nível do pixel. Os modelosYOLO Ultralytics suportam tarefas de segmentação de instâncias.
Caixas delimitadoras orientadas (OBB): Rectângulos rodados utilizados para delimitar mais firmemente objectos que não estão alinhados com os eixos da imagem, comuns em imagens aéreas(conjunto de dados DOTA) ou na deteção de texto. Ultralytics YOLO11 suporta a deteção de OBB.

Aplicações em cenários do mundo real

As caixas delimitadoras são parte integrante de inúmeras aplicações práticas de IA:

Veículos autónomos: Os veículos autónomos dependem fortemente da deteção de objectos para identificar e localizar peões, outros veículos, semáforos e obstáculos utilizando caixas delimitadoras. Esta consciência espacial, frequentemente conseguida através de modelos de aprendizagem profunda, é fundamental para uma navegação segura e para a tomada de decisões. Empresas como a Waymo apresentam esta tecnologia de forma extensiva. Ultralytics oferece-te informações sobre a IA nos automóveis autónomos.
Análise de retalho: No retalho, as caixas delimitadoras ajudam na gestão de inventário orientada por IA, detectando produtos nas prateleiras, monitorizando os níveis de stock e analisando o comportamento dos clientes através da interação nas prateleiras ou dos padrões de tráfego pedonal(contagem de objectos).
Segurança e vigilância: As caixas delimitadoras permitem que os sistemas de monitorização automatizados detectem e acompanhem indivíduos ou objectos de interesse em tempo real, accionando alertas de acesso não autorizado ou actividades suspeitas. Isto é fundamental para aplicações de construção como sistemas de alarme de segurança.
Análise de imagens médicas: Nos cuidados de saúde, as caixas delimitadoras ajudam os radiologistas e os médicos ao realçarem potenciais anomalias, como tumores ou lesões em exames (raios X, TAC, RMN), ajudando a efetuar um diagnóstico mais rápido e preciso. Vê exemplos em Radiologia: Inteligência Artificial e Visão geral da Ultralytics sobre análise de imagens médicas.
Agricultura: As caixas delimitadoras são utilizadas na agricultura de precisão para tarefas como a identificação de frutos para colheita(deteção de frutos), a monitorização da saúde das culturas ou a deteção de pragas.

Caixa delimitadora

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Solução flexível de licenciamento empresarial para impulsionar a tua inovação

Treina modelos de IA em segundos com Ultralytics YOLO

Treina os modelos YOLO simplesmente com Ultralytics HUB

Importância na deteção de objectos

Conceitos-chave relacionados com as caixas delimitadoras

Caixas delimitadoras vs. termos relacionados

Aplicações em cenários do mundo real

Lê mais blogues

Junta-te à comunidade Ultralytics

Caixa delimitadora

Treina os modelos YOLO simplesmentecom Ultralytics HUB

Solução flexível de licenciamento empresarial para impulsionar a tua inovação

Treina modelos de IA em segundos com Ultralytics YOLO

Treina os modelos YOLO simplesmente com Ultralytics HUB

Importância na deteção de objectos

Conceitos-chave relacionados com as caixas delimitadoras

Caixas delimitadoras vs. termos relacionados

Aplicações em cenários do mundo real

Lê mais blogues

Junta-te à comunidade Ultralytics

Treina os modelos YOLO simplesmente
com Ultralytics HUB