Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Detectores de Objetos One-Stage

Descubra a velocidade e a eficiência dos detectores de objectos de uma fase, como o YOLO, ideais para aplicações em tempo real, como robótica e vigilância.

Os detectores de objectos de uma fase são uma categoria de modelos de aprendizagem profunda (DL) optimizados para velocidade e eficiência em tarefas de visão computacional (CV). Ao contrário dos detectores de objectos de duas fases, que que separam o processo de deteção em fases de proposta e classificação de regiões, as arquitecturas de uma fase realizam deteção de objectos numa única passagem de avaliação. Ao de avaliação. Ao enquadrar a tarefa como um problema de regressão direta, estes modelos prevêem caixas delimitadoras e probabilidades de classe simultaneamente simultaneamente a partir de imagens de entrada. Esta abordagem simplificada permite um processamento significativamente mais rápido, tornando-os a escolha preferida preferida para aplicações que requerem inferência em tempo real.

Princípios de funcionamento

No centro de um detetor de uma fase está uma rede neural convolucional (CNN) que serve de base para a extração de extração de caraterísticas. A rede processa a imagem inteira imagem inteira de uma só vez - daí o nome "You Only Look Once" - criando uma grelha de mapas de caraterísticas. As primeiras arquitecturas antigas, como o Single Shot MultiBox Detetor (SSD), baseavam-se em em caixas de ancoragem predefinidas para lidar com objectos de objectos de várias escalas. No entanto, iterações modernas como o Ultralytics YOLO11 adoptaram largamente desenhos sem âncoras para reduzir a complexidade e complexidade e melhorar a generalização. O resultado inclui normalmente coordenadas para localização e uma e uma pontuação de confiança que indica a probabilidade da presença de um presença de um objeto.

Comparação com modelos de duas fases

A principal distinção entre os modelos de uma fase e de duas fases reside no compromisso entre velocidade e precisão. As arquitecturas de duas fases, como a família R-CNN, oferecem geralmente maior precisão para objectos pequenos ou ocluídos, mas incorrem em custos computacionais mais elevados devido ao seu processo de várias etapas. Por outro lado, os detectores de uma fase dão prioridade à baixa latência de inferência, permitindo a implementação em hardware com recursos limitados. Avanços recentes, incluindo a evolução do YOLOv1 e a evolução para o próximo YOLO26 (previsto para finais de 2025), utilizam formação de ponta a ponta e funções de perda avançadas para reduzir a diferença de precisão precisão, muitas vezes igualando ou excedendo os modelos de duas fases.

Aplicações no Mundo Real

A eficiência dos detectores de uma fase impulsiona a inovação em numerosos sectores onde a capacidade de resposta imediata é imediata é fundamental:

  1. Veículos autónomos: Os sistemas de condução autónoma têm de processar instantaneamente as imagens de vídeo para identificar peões, veículos e sinais de trânsito. Os líderes da indústria, como a Waymo, dependem da deteção de alta velocidade para garantir a segurança dos passageiros e uma navegação tranquila.
  2. Fabrico inteligente: Estes modelos facilitam a garantia de qualidade automatizada em linhas de montagem de alta velocidade, detectando defeitos ou verificando a colocação de componentes em tempo real sem abrandar a produção.
  3. IA de borda: Devido à sua arquitetura leve, os detectores de uma fase são ideais para serem executados em dispositivos compactos, como o Raspberry Pi ou NVIDIA Jetson, trazendo inteligência para câmaras câmaras e drones.

Implementação técnica

Para garantir resultados precisos, estes modelos prevêem frequentemente várias caixas potenciais para um único objeto. Técnicas de pós-processamento técnicas como Supressão Não Máxima (NMS) filtram estas previsões redundantes com base na Intersecção sobre União (IoU) limiares. A implementação de um detetor de uma fase é simples com bibliotecas modernas como PyTorch e o pacote pacoteUltralytics Python .

O exemplo a seguir demonstra como executar a inferência usando um modelo YOLO11 pré-treinado:

from ultralytics import YOLO

# Load the YOLO11 model, a state-of-the-art one-stage detector
model = YOLO("yolo11n.pt")

# Run inference on a local image or URL
results = model("https://ultralytics.com/images/bus.jpg")

# Display the detected objects with bounding boxes
results[0].show()

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora