Glossario

Rivelatori basati su ancore

Scopri come i rilevatori basati sulle ancore rivoluzionano il rilevamento degli oggetti grazie alla localizzazione precisa, all'adattabilità alla scala e alle applicazioni reali.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

I rilevatori basati su ancore rappresentano un approccio significativo e fondamentale nell'ambito della computer vision (CV) per affrontare il compito di rilevare gli oggetti. Questi modelli funzionano utilizzando un insieme predefinito di caselle di riferimento, comunemente chiamate "ancore" o "priori", che hanno dimensioni e rapporti di aspetto specifici. Le ancore sono distribuite nell'immagine e agiscono come ipotesi iniziali o modelli, consentendo al modello di prevedere in modo più efficace la posizione e la classe degli oggetti, soprattutto quando si tratta di oggetti di dimensioni e forme diverse. Molti dei primi modelli influenti di rilevamento degli oggetti, come alcune versioni di Ultralytics YOLO utilizzavano questa tecnica.

Come funzionano i rilevatori ad ancora

Il concetto fondamentale dei rilevatori basati sulle ancore consiste nel sovrapporre una fitta griglia di queste caselle di ancoraggio predefinite sull'immagine di input in diverse posizioni e scale. Ogni casella di ancoraggio corrisponde a un potenziale oggetto con dimensioni e forme specifiche. Durante il processo di addestramento del modello, il rilevatore impara due cose principali per ogni ancoraggio: in primo luogo, classifica se il riquadro di ancoraggio contiene un oggetto rilevante o uno sfondo; in secondo luogo, perfeziona la posizione e le dimensioni dell'ancoraggio (un processo chiamato regressione) in modo che corrisponda esattamente al riquadro di delimitazione dell'oggetto reale.

Consideriamo il rilevamento di vari veicoli in un'immagine di una strada trafficata. Invece di analizzare ogni gruppo di pixel, un modello basato sulle ancore utilizza modelli predefiniti di box: più piccoli per i pedoni, quadrati medi per le auto e rettangoli più grandi per gli autobus. Questi modelli (ancore) vengono posizionati in tutta l'immagine. Se un'ancora si sovrappone in modo significativo a un'auto, il modello impara a classificarla come "auto" e regola le coordinate e le dimensioni dell'ancora per adattarla perfettamente all'auto. Le ancore che coprono solo la strada o gli edifici vengono classificate come "sfondo". Questo approccio sistematico, guidato da forme predefinite, aiuta a gestire la complessità del rilevamento degli oggetti. Le prestazioni vengono tipicamente valutate utilizzando metriche come Intersection over Union (IoU) e mean Average Precision (mAP).

Caratteristiche e vantaggi principali

I rilevatori basati su ancore, che spesso sfruttano potenti reti neurali convoluzionali (CNN) come spina dorsale, offrono vantaggi distinti:

  • Gestione delle variazioni di scala e di rapporto d'aspetto: Gli ancoraggi predefiniti coprono esplicitamente varie forme e dimensioni, rendendo questi modelli intrinsecamente buoni nel rilevare gli oggetti indipendentemente dalle loro dimensioni o dal loro orientamento.
  • Previsione strutturata: Le ancore forniscono un modo strutturato per generare proposte di oggetti sull'intera immagine, garantendo una copertura completa.
  • Alto richiamo: Generando un gran numero di potenziali posizioni di oggetti tramite le ancore, questi metodi raggiungono spesso un elevato richiamo, il che significa che sono in grado di trovare gli oggetti più rilevanti, anche se a volte richiedono fasi di post-elaborazione come la Soppressione Non Massima (NMS) per filtrare i duplicati.
  • Prestazioni comprovate: Architetture come Faster R-CNN e SSD (Single Shot MultiBox Detector) hanno dimostrato ottime prestazioni su dataset di riferimento standard come COCO.

Applicazioni del mondo reale

I rilevatori basati su ancore sono stati impiegati con successo in numerosi scenari reali:

  1. Veicoli autonomi: Rilevare veicoli, pedoni, ciclisti e segnali stradali di varie dimensioni e distanze è fondamentale per una navigazione sicura. I metodi basati sull'ancoraggio aiutano a garantire che gli oggetti vicini e lontani, grandi e piccoli, siano identificati in modo affidabile. Aziende come Waymo si basano molto sul rilevamento degli oggetti. Scopri di più sull'intelligenza artificiale nelle auto a guida autonoma.
  2. Retail Analytics: Nei negozi, questi rilevatori possono monitorare gli scaffali per identificare i prodotti, controllare i livelli delle scorte o analizzare i modelli di traffico dei clienti rilevando le persone. La capacità di gestire le dimensioni e le forme delle confezioni dei prodotti è essenziale per applicazioni come la gestione dell'inventario guidata dall'intelligenza artificiale.

Rilevatori basati su ancore e rilevatori senza ancore

Negli ultimi anni, i rilevatori senza ancore sono emersi come un'alternativa popolare. A differenza dei modelli basati sulle ancore (ad es, Ultralytics YOLOv5), gli approcci privi di ancore predicono le posizioni e le dimensioni degli oggetti direttamente, spesso identificando punti chiave (come i centri o gli angoli dell'oggetto) o prevedendo le distanze da un punto ai confini dell'oggetto, eliminando la necessità di forme di ancoraggio predefinite.

Le differenze principali includono:

  • Complessità: I modelli basati sulle ancore richiedono un'attenta progettazione e messa a punto dei parametri delle ancore (dimensioni, rapporti, scale), che possono dipendere dal set di dati. I modelli senza ancore semplificano la progettazione della testa di rilevamento.
  • Flessibilità: I metodi senza ancore possono adattarsi meglio a oggetti con rapporti d'aspetto insoliti o con forme non ben rappresentate dall'insieme di ancore fisse.
  • Efficienza: L'eliminazione delle ancore può ridurre il numero di previsioni che il modello deve fare, portando potenzialmente a un'inferenza più veloce e a una post-elaborazione più semplice.

Mentre i rilevatori basati su ancore come YOLOv4 hanno avuto un grande successo, molte architetture moderne, come ad esempio Ultralytics YOLO11hanno adottato design privi di ancore per sfruttarne i vantaggi in termini di semplicità ed efficienza. Puoi esplorare i vantaggi del rilevamento senza ancore in YOLO11 e vedere i confronti tra i diversi modelli YOLO .

Strumenti e formazione

Lo sviluppo e l'implementazione di modelli di rilevamento degli oggetti, sia basati su ancore che privi di ancore, comporta l'utilizzo di framework come PyTorch o TensorFlow e librerie come OpenCV. Piattaforme come Ultralytics HUB offrono flussi di lavoro semplificati per l'addestramento di modelli personalizzati, la gestione di set di dati e la distribuzione di soluzioni, supportando diverse architetture di modelli. Per approfondire la conoscenza, risorse come Papers With Code elencano i modelli più avanzati e i corsi di piattaforme come DeepLearning.AI trattano i concetti fondamentali.

Leggi tutto