Glossario

Rivelatori basati su ancore

Scoprite come i rilevatori basati su ancore rivoluzionano il rilevamento degli oggetti grazie alla localizzazione precisa, all'adattabilità alla scala e alle applicazioni reali.

I rilevatori basati su ancore sono una classe fondamentale di modelli di rilevamento degli oggetti nella computer vision. Questi modelli funzionano utilizzando un insieme predefinito di caselle, note come caselle di ancoraggio, per identificare e localizzare gli oggetti all'interno di un'immagine. I riquadri di ancoraggio sono essenzialmente una griglia di modelli di varie dimensioni e rapporti di aspetto che vengono allineati sull'immagine. Il modello prevede come spostare e scalare queste ancore per farle corrispondere alle caselle di delimitazione degli oggetti, insieme a un punteggio di confidenza che indica la presenza di un oggetto. Questo approccio semplifica il problema della ricerca di oggetti, trasformandolo in un compito di regressione e classificazione rispetto a questi ancoraggi fissi.

Esempi significativi di architetture basate su ancore sono la famiglia R-CNN, come Faster R-CNN, e i primi rilevatori a singolo stadio come SSD (Single Shot MultiBox Detector) e molti modelli YOLO, tra cui il grande successo di Ultralytics YOLOv5.

Come funzionano i rilevatori ad ancora

L'idea alla base del rilevamento basato sugli ancoraggi è quella di utilizzare un insieme di caselle di riferimento predefinite come punto di partenza. Durante il processo di formazione del modello, il rilevatore impara a svolgere due compiti principali per ogni casella di ancoraggio:

  1. Classificazione: Determinare se una casella di ancoraggio contiene un oggetto di interesse o se è solo uno sfondo.
  2. Regressione: Calcola gli offset precisi (x, y, larghezza, altezza) necessari per regolare il riquadro di ancoraggio in modo che racchiuda perfettamente l'oggetto rilevato.

Queste previsioni vengono fatte dalla testa di rilevamento del modello dopo aver elaborato le caratteristiche dell'immagine estratte dalla struttura portante. Poiché un singolo oggetto può essere rilevato da più caselle di ancoraggio, viene utilizzata una fase di post-elaborazione chiamata Non-Maximum Suppression (NMS) per filtrare i rilevamenti ridondanti e mantenere solo la casella più adatta. Le prestazioni di questi modelli sono spesso valutate utilizzando metriche come la precisione media (mAP) e l'intersezione sull'unione (IoU).

Rivelatori basati su ancore e rivelatori privi di ancore

Negli ultimi anni, i rilevatori privi di ancore sono emersi come un'alternativa popolare. A differenza dei modelli basati sulle ancore, gli approcci privi di ancore predicono direttamente le posizioni e le dimensioni degli oggetti, spesso identificando punti chiave (come i centri o gli angoli dell'oggetto) o prevedendo le distanze da un punto ai confini dell'oggetto, eliminando la necessità di forme di ancoraggio predefinite.

Le differenze principali includono:

  • Complessità: I modelli basati sulle ancore richiedono un'attenta progettazione e messa a punto dei parametri delle ancore (dimensioni, rapporti, scale), che possono dipendere dal set di dati. I modelli senza ancore semplificano la progettazione della testa di rilevamento.
  • Flessibilità: I metodi privi di ancoraggio possono adattarsi meglio a oggetti con rapporti di aspetto insoliti o forme non ben rappresentate dall'insieme di ancoraggi fissi.
  • Efficienza: L'eliminazione delle ancore può ridurre il numero di previsioni che il modello deve fare, portando potenzialmente a un'inferenza più veloce e a una post-elaborazione più semplice.

Mentre i rilevatori basati su ancore come YOLOv4 hanno avuto un grande successo, molte architetture moderne, tra cui Ultralytics YOLO11, hanno adottato design privi di ancore per sfruttarne i vantaggi in termini di semplicità ed efficienza. È possibile esplorare i vantaggi del rilevamento senza ancore in YOLO11 e vedere i confronti tra i diversi modelli YOLO.

Applicazioni del mondo reale

I rilevatori basati su ancore sono ampiamente utilizzati in varie applicazioni in cui gli oggetti hanno forme e dimensioni relativamente standard.

  • Guida autonoma: Nelle soluzioni per l'industria automobilistica, questi rilevatori sono eccellenti per identificare veicoli, pedoni e segnali stradali. Le forme prevedibili di questi oggetti si allineano bene con gli ancoraggi predefiniti, consentendo un rilevamento affidabile per aziende come NVIDIA e Tesla.
  • Analitica del commercio al dettaglio: Per la gestione dell'inventario guidata dall'intelligenza artificiale, i modelli basati sulle ancore possono scansionare in modo efficiente gli scaffali per contare i prodotti. Le dimensioni e la forma uniformi dei prodotti confezionati li rendono candidati ideali per questo approccio, contribuendo ad automatizzare il monitoraggio delle scorte.
  • Sicurezza e sorveglianza: L'identificazione di persone o veicoli nei filmati delle telecamere di sorveglianza fisse è un altro caso d'uso importante. Questo è fondamentale per applicazioni come la guida ai sistemi di allarme di sicurezza Ultralytics.

Strumenti e formazione

Lo sviluppo e la distribuzione di modelli di rilevamento degli oggetti, sia basati su ancore che senza ancore, comporta l'utilizzo di framework come PyTorch o TensorFlow e librerie come OpenCV. Piattaforme come Ultralytics HUB offrono flussi di lavoro semplificati per l'addestramento di modelli personalizzati, la gestione di set di dati e la distribuzione di soluzioni, supportando varie architetture di modelli. Per un ulteriore apprendimento, risorse come Papers With Code elencano modelli all'avanguardia e i corsi di piattaforme come DeepLearning.AI coprono i concetti fondamentali.

Unitevi alla comunità di Ultralytics

Entrate a far parte del futuro dell'IA. Connettetevi, collaborate e crescete con gli innovatori globali.

Iscriviti ora
Link copiato negli appunti