Yolo Vision Shenzhen
Shenzhen
Iscriviti ora
Glossario

Rilevatori basati su Anchor

Scopri come i rilevatori basati su anchor rivoluzionano il rilevamento di oggetti con localizzazione precisa, adattabilità della scala e applicazioni reali.

I rilevatori basati su ancoraggi sono una classe fondamentale di modelli di rilevamento oggetti nella visione artificiale che utilizzano una serie di riquadri di delimitazione predefiniti per localizzare e classify . Anziché cercare di prevedere le coordinate di un oggetto partendo da zero, questi sistemi iniziano con modelli di riferimento fissi noti come riquadri di ancoraggio. La rete neurale viene quindi addestrata per determinare quale di questi modelli corrisponde meglio a un oggetto nell'immagine e per calcolare gli specifici offset, ovvero le regolazioni di posizione e dimensione, necessari per allineare perfettamente l'ancora con il bersaglio. Questo approccio trasforma il difficile problema della previsione arbitraria delle coordinate in un compito di regressione più stabile, che ha rappresentato una svolta fondamentale nello sviluppo delle prime architetture di deep learning (DL) come Faster R-CNN e SSD.

Come funzionano i meccanismi basati su ancore

Il funzionamento principale di un rilevatore basato su ancoraggio ruota attorno alla suddivisione dell'immagine in ingresso in una griglia densa. In ogni cella di questa griglia, il modello genera più riquadri di ancoraggio con scale e proporzioni variabili per tenere conto delle diverse forme degli oggetti, come pedoni alti o veicoli larghi. Man mano che i dati dell'immagine passano attraverso la struttura portante del modello, la rete estrae caratteristiche ricche per eseguire due attività simultanee:

  1. Classificazione: il modello assegna un punteggio di probabilità a ciascun punto di ancoraggio, prevedendo se contiene una classe specifica di oggetti (ad esempio, "auto", "cane") o se è semplicemente rumore di fondo.
  2. Regressione box: Per gli anchor identificati come contenenti un oggetto, la rete prevede fattori di correzione per perfezionare il centro dell'anchor. x, y coordinate, larghezza e altezza, con conseguente stretto bounding box.

Durante l'addestramento del modello, questi rilevatori utilizzano una metrica chiamata Intersection over Union (IoU) per abbinare gli anchor predefiniti alle etichette di ground truth fornite nel set di dati. Gli anchor con un'elevata sovrapposizione vengono trattati come campioni positivi. Poiché questo processo genera migliaia di potenziali rilevamenti, durante l'inferenza viene applicato un algoritmo di filtraggio noto come Non-Maximum Suppression (NMS) per eliminare i riquadri ridondanti e conservare solo la previsione più accurata per ciascun oggetto.

Confronto con i rilevatori senza ancoraggio

Mentre i metodi basati sull'ancoraggio hanno stabilito lo standard per anni, il campo si è evoluto verso rilevatori senza ancoraggio. Comprendere la differenza è fondamentale per i professionisti moderni.

  • Basati su anchor: modelli come YOLOv5 e l' originale RetinaNet si basano su una configurazione manuale o su algoritmi di clustering come il clustering k-means per determinare le dimensioni ottimali dell'ancora per un set di dati. Ciò offre stabilità, ma può risultare rigido se gli oggetti variano notevolmente nella forma.
  • Senza ancoraggio: le architetture moderne, tra cui YOLO26, spesso eliminano completamente la fase di ancoraggio. Esse prevedono i centri e le dimensioni degli oggetti direttamente dai pixel della mappa delle caratteristiche, riducendo il sovraccarico computazionale e semplificando la ricerca degli iperparametri. Questo approccio "end-to-end" è generalmente più veloce e più facile da addestrare su dati diversi.

Applicazioni nel mondo reale

La logica basata sugli anchor rimane rilevante in molti sistemi di produzione legacy e specializzati in cui le forme degli oggetti sono prevedibili e coerenti.

  • Monitoraggio del traffico: nei sistemi di trasporto intelligenti, le telecamere detect per gestire il flusso o identificare le violazioni. Poiché le auto e i camion hanno dimensioni standardizzate, i modelli basati su anchor possono essere ottimizzati con priorità specifiche per massimizzare la precisione e il richiamo.
  • Automazione della vendita al dettaglio: i sistemi di cassa automatizzati utilizzano la visione artificiale per identificare i prodotti. Poiché i prodotti confezionati come le scatole di cereali mantengono proporzioni fisse, gli ancoraggi forniscono un forte priore per la rete, aiutandola a distinguere tra articoli dall'aspetto simile in una scena disordinata.

Esempio di implementazione

Sebbene gli ultimi modelli YOLO26 utilizzino teste senza ancoraggi per ottenere prestazioni superiori, l'interfaccia per l'esecuzione del rilevamento rimane coerente. La Ultralytics e Python astraggono la complessità legata al fatto che un modello utilizzi ancoraggi o punti centrali, consentendo agli utenti di concentrarsi sui risultati.

Ecco come caricare un modello ed eseguire l'inferenza per detect , un flusso di lavoro che si applica indipendentemente dall'architettura di ancoraggio sottostante :

from ultralytics import YOLO

# Load the YOLO26 model (optimized for speed and accuracy)
model = YOLO("yolo26n.pt")

# Run inference on an image source
# The model handles internal logic (anchor-based or anchor-free) automatically
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the first result with bounding boxes
results[0].show()

Ulteriori letture

Per approfondire la tua comprensione dei meccanismi di rilevamento, esplora la ricerca fondamentale su Faster R-CNN che ha introdotto il Region Proposal Network (RPN), oppure leggi informazioni sul Single Shot MultiBox Detector (SSD), che ha ottimizzato il rilevamento basato su anchor per la velocità. Per una visione più ampia del settore, COCO funge da benchmark standard per la valutazione sia dei modelli basati su anchor che di quelli senza anchor. Inoltre, i corsi avanzati su Coursera trattano spesso i dettagli matematici della regressione box e dell'anchor matching.

Unitevi alla comunità di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora