Saiba como um cabeçote de detecção permite a detecção de objetos em tempo real. Explore o seu papel no Ultralytics para prever caixas delimitadoras e rótulos com alta precisão.
Um cabeçote de detecção atua como a camada final de tomada de decisão em uma arquitetura de rede neural de detecção de objetos. Enquanto as camadas anteriores do modelo são responsáveis por compreender as formas, texturas e características dentro de uma imagem, o cabeçote de detecção é o componente específico que interpreta essas informações para prever exatamente quais objetos estão presentes e onde estão localizados. Ele transforma os dados abstratos e de alto nível produzidos pelo extrator de características em resultados acionáveis, normalmente produzindo um conjunto de caixas delimitadoras que envolvem os objetos identificados, juntamente com os seus rótulos de classe correspondentes e pontuações de confiança.
Para compreender totalmente a função de um cabeçote de detecção, é útil visualizar os detectores modernos como sendo compostos por três estágios principais, cada um servindo a um propósito distinto no fluxo de visão computacional (CV):
O design dos cabeçotes de detecção evoluiu significativamente para melhorar a velocidade e a precisão, particularmente com a transição dos métodos tradicionais para os modernos modelos de inferência em tempo real.
A precisão do cabeçote de detecção é fundamental para a implantação da inteligência artificial (IA) em ambientes industriais e críticos para a segurança. Os utilizadores podem facilmente anotar dados e treinar esses cabeçotes especializados usando a Ultralytics .
O exemplo a seguir demonstra como carregar um
YOLO26 modelo e inspecionar a saída da sua cabeça de deteção.
Quando a inferência é executada, a cabeça processa a imagem e retorna o resultado final. boxes contendo coordenadas e
IDs de classe.
from ultralytics import YOLO
# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")
# Run inference on an image to utilize the detection head
results = model("https://ultralytics.com/images/bus.jpg")
# The detection head outputs are stored in results[0].boxes
for box in results[0].boxes:
# Print the bounding box coordinates and the predicted class
print(f"Class: {int(box.cls)}, Coordinates: {box.xywh.numpy()}")
Essa interação destaca como o cabeçote de detecção traduz ativações complexas da rede neural em dados legíveis que os desenvolvedores podem usar para tarefas posteriores, como rastreamento ou contagem de objetos.