Descubra a velocidade e a eficiência dos detectores de objectos de uma fase, como o YOLO, ideais para aplicações em tempo real, como robótica e vigilância.
Os detectores de objectos de uma fase são uma categoria de modelos de aprendizagem profunda (DL) optimizados para velocidade e eficiência em tarefas de visão computacional (CV). Ao contrário dos detectores de objectos de duas fases, que que separam o processo de deteção em fases de proposta e classificação de regiões, as arquitecturas de uma fase realizam deteção de objectos numa única passagem de avaliação. Ao de avaliação. Ao enquadrar a tarefa como um problema de regressão direta, estes modelos prevêem caixas delimitadoras e probabilidades de classe simultaneamente simultaneamente a partir de imagens de entrada. Esta abordagem simplificada permite um processamento significativamente mais rápido, tornando-os a escolha preferida preferida para aplicações que requerem inferência em tempo real.
No centro de um detetor de uma fase está uma rede neural convolucional (CNN) que serve de base para a extração de extração de caraterísticas. A rede processa a imagem inteira imagem inteira de uma só vez - daí o nome "You Only Look Once" - criando uma grelha de mapas de caraterísticas. As primeiras arquitecturas antigas, como o Single Shot MultiBox Detetor (SSD), baseavam-se em em caixas de ancoragem predefinidas para lidar com objectos de objectos de várias escalas. No entanto, iterações modernas como o Ultralytics YOLO11 adoptaram largamente desenhos sem âncoras para reduzir a complexidade e complexidade e melhorar a generalização. O resultado inclui normalmente coordenadas para localização e uma e uma pontuação de confiança que indica a probabilidade da presença de um presença de um objeto.
A principal distinção entre os modelos de uma fase e de duas fases reside no compromisso entre velocidade e precisão. As arquitecturas de duas fases, como a família R-CNN, oferecem geralmente maior precisão para objectos pequenos ou ocluídos, mas incorrem em custos computacionais mais elevados devido ao seu processo de várias etapas. Por outro lado, os detectores de uma fase dão prioridade à baixa latência de inferência, permitindo a implementação em hardware com recursos limitados. Avanços recentes, incluindo a evolução do YOLOv1 e a evolução para o próximo YOLO26 (previsto para finais de 2025), utilizam formação de ponta a ponta e funções de perda avançadas para reduzir a diferença de precisão precisão, muitas vezes igualando ou excedendo os modelos de duas fases.
A eficiência dos detectores de uma fase impulsiona a inovação em numerosos sectores onde a capacidade de resposta imediata é imediata é fundamental:
Para garantir resultados precisos, estes modelos prevêem frequentemente várias caixas potenciais para um único objeto. Técnicas de pós-processamento técnicas como Supressão Não Máxima (NMS) filtram estas previsões redundantes com base na Intersecção sobre União (IoU) limiares. A implementação de um detetor de uma fase é simples com bibliotecas modernas como PyTorch e o pacote pacoteUltralytics Python .
O exemplo a seguir demonstra como executar a inferência usando um modelo YOLO11 pré-treinado:
from ultralytics import YOLO
# Load the YOLO11 model, a state-of-the-art one-stage detector
model = YOLO("yolo11n.pt")
# Run inference on a local image or URL
results = model("https://ultralytics.com/images/bus.jpg")
# Display the detected objects with bounding boxes
results[0].show()