Aprende como as caixas delimitadoras permitem a deteção de objectos, a IA e os sistemas de aprendizagem automática. Explora o seu papel nas aplicações de visão por computador!
Uma caixa delimitadora é uma moldura retangular utilizada na visão por computador (CV) para indicar a localização e a extensão aproximada de um objeto numa imagem ou num quadro de vídeo. Normalmente definidas pelas coordenadas dos seus cantos superior esquerdo e inferior direito (ou ponto central, largura e altura), estas caixas fornecem um método simples mas eficaz para especificar a localização de um objeto e o espaço que ocupa. As caixas delimitadoras são componentes fundamentais em várias tarefas de CV, incluindo a deteção de objectos, o seguimento de objectos e a anotação de imagens, constituindo uma pedra angular de muitos sistemas modernos de Inteligência Artificial (IA) e de aprendizagem automática (ML). São essenciais para permitir que as máquinas compreendam não só que objectos estão presentes, mas também onde estão localizados numa cena visual.
As caixas delimitadoras são cruciais tanto para o treino como para a avaliação de modelos de deteção de objectos. Em tarefas abordadas por modelos como o Ultralytics YOLOdo Ultralytics, as caixas delimitadoras servem de "verdade básica" durante o processo de treino. Isto significa que representam a localização e o tamanho corretos dos objectos nos dados de treino, ensinando o modelo a localizar objectos com precisão. Este processo começa frequentemente com uma anotação cuidadosa dos dados, em que os humanos ou as ferramentas automatizadas desenham estas caixas à volta dos objectos nas imagens, utilizando frequentemente plataformas como o CVAT ou integrando-se em plataformas como o Ultralytics HUB para a gestão do conjunto de dados. Durante a inferência, o modelo treinado prevê caixas delimitadoras em torno dos objectos detectados, juntamente com etiquetas de classe e pontuações de confiança. Esta capacidade de localização é vital para aplicações que requerem não só a identificação de objectos, mas também a sua posição exacta.
Várias métricas e técnicas estão intimamente associadas à utilização e avaliação de caixas delimitadoras em modelos de ML:
Enquanto as caixas delimitadoras padrão (alinhadas com o eixo) localizam objectos com rectângulos simples, outras técnicas de visão por computador oferecem diferentes níveis de detalhe ou lidam com diferentes cenários:
As caixas delimitadoras são parte integrante de inúmeras aplicações práticas de IA: