Descubra o poder da deteção de objectos - identifique e localize objectos em imagens ou vídeos com modelos de ponta como o YOLO. Explore aplicações do mundo real!
A deteção de objectos é uma capacidade fundamental no âmbito da visão computacional (CV) que permite aos sistemas de software que permite que os sistemas de software não só reconheçam o que uma imagem representa, mas também localizem instâncias específicas de objectos dentro dela. Enquanto a classificação padrão atribui um único rótulo a toda uma entrada visual, a deteção de objectos fornece uma compreensão mais granular mais granular, prevendo uma caixa delimitadora em torno de cada entidade identificada, acompanhada por uma etiqueta de classe específica e uma pontuação de confiança. Esta tecnologia actua como a base sensorial sensorial para a inteligência artificial inteligência artificial (IA) avançada, permitindo máquinas percebam, interpretem e interajam com a complexidade do mundo físico. Desde o controlo automático da qualidade automatizado em fábricas à vigilância avançada, transforma dados de píxeis não estruturados em informações acionáveis.
Os detectores modernos baseiam-se principalmente em arquitecturas de aprendizagem profunda (DL), especificamente Redes Neuronais Convolucionais (CNN), para aprender hierarquias espaciais de caraterísticas. Uma arquitetura típica consiste numa uma espinha dorsal, como a ResNet ou a CSPNet, que extrai caraterísticas visuais essenciais da imagem de entrada. Estas caraterísticas são depois processadas por uma de deteção que produz as coordenadas das coordenadas das caixas delimitadoras e a probabilidade de pertencer a uma classe.
Para obter um elevado desempenho, os modelos são treinados em colecções massivas rotuladas, como o conjunto de dados COCO , que fornece um padrão para a avaliação comparativa. Durante a inferência, os algoritmos geram frequentemente várias caixas sobrepostas para o mesmo objeto. Técnicas como Supressão Não Máxima (NMS) são técnicas como a Supressão Não Máxima (NMS) são aplicadas para filtrar estas redundâncias, mantendo apenas a caixa com a maior confiança e a melhor Intersecção sobre União (IoU) com a verdade com a verdade terrestre.
Os modelos são geralmente classificados em dois tipos:
É crucial diferenciar a deteção de objectos de tarefas semelhantes de tarefas semelhantes de visão computacional.
A deteção de objectos é o motor por detrás de muitas tecnologias transformadoras em várias indústrias.
O seguinte fragmento de código demonstra como efetuar a deteção de objectos utilizando um modelo YOLO11 pré-treinado com o
ultralytics pacote. Este fluxo de trabalho simples carrega um modelo e executa a inferência numa imagem para identificar
objectos como autocarros e pessoas.
from ultralytics import YOLO
# Load a pretrained YOLO11 model (n-scale for speed)
model = YOLO("yolo11n.pt")
# Run inference on a remote image source
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results with bounding boxes and labels
results[0].show()