Scopri come una testa di rilevamento consente il rilevamento di oggetti in tempo reale. Esplora il suo ruolo in Ultralytics per la previsione di riquadri di delimitazione ed etichette con elevata precisione.
Una testa di rilevamento funge da livello decisionale finale in un'architettura di rete neurale per il rilevamento di oggetti . Mentre i livelli precedenti del modello sono responsabili della comprensione delle forme, delle texture e delle caratteristiche all'interno di un'immagine, la testa di rilevamento è il componente specifico che interpreta queste informazioni per prevedere esattamente quali oggetti sono presenti e dove si trovano. Trasforma i dati astratti e di alto livello prodotti dall' estrattore di caratteristiche in risultati utilizzabili, generando in genere una serie di riquadri che racchiudono gli oggetti identificati insieme alle relative etichette di classe e ai punteggi di confidenza.
Per comprendere appieno la funzione di una testa di rilevamento, è utile visualizzare i moderni rilevatori come composti da tre stadi principali, ciascuno dei quali svolge una funzione distinta nella pipeline di visione artificiale (CV):
Il design delle testine di rilevamento si è evoluto in modo significativo per migliorare la velocità e la precisione, in particolare con il passaggio dai metodi tradizionali ai moderni modelli di inferenza in tempo reale.
La precisione della testa di rilevamento è fondamentale per l'implementazione dell' intelligenza artificiale (AI) in ambienti industriali e critici per la sicurezza. Gli utenti possono facilmente annotare i dati e addestrare queste teste specializzate utilizzando la Ultralytics .
L'esempio seguente mostra come caricare un
YOLO26 modello e ispeziona l'output della sua testa di rilevamento.
Quando viene eseguita l'inferenza, la testa elabora l'immagine e restituisce il risultato finale. boxes contenente coordinate e
ID di classe.
from ultralytics import YOLO
# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")
# Run inference on an image to utilize the detection head
results = model("https://ultralytics.com/images/bus.jpg")
# The detection head outputs are stored in results[0].boxes
for box in results[0].boxes:
# Print the bounding box coordinates and the predicted class
print(f"Class: {int(box.cls)}, Coordinates: {box.xywh.numpy()}")
Questa interazione evidenzia come la testa di rilevamento traduca le complesse attivazioni della rete neurale in dati leggibili che gli sviluppatori possono utilizzare per attività a valle come il tracciamento o il conteggio degli oggetti.