Scoprite come i rilevatori basati su ancore rivoluzionano il rilevamento degli oggetti grazie alla localizzazione precisa, all'adattabilità alla scala e alle applicazioni reali.
I rilevatori basati su ancore sono una classe fondamentale di modelli di rilevamento degli oggetti nella computer vision. Questi modelli funzionano utilizzando un insieme predefinito di caselle, note come caselle di ancoraggio, per identificare e localizzare gli oggetti all'interno di un'immagine. I riquadri di ancoraggio sono essenzialmente una griglia di modelli di varie dimensioni e rapporti di aspetto che vengono allineati sull'immagine. Il modello prevede come spostare e scalare queste ancore per farle corrispondere alle caselle di delimitazione degli oggetti, insieme a un punteggio di confidenza che indica la presenza di un oggetto. Questo approccio semplifica il problema della ricerca di oggetti, trasformandolo in un compito di regressione e classificazione rispetto a questi ancoraggi fissi.
Esempi significativi di architetture basate su ancore sono la famiglia R-CNN, come Faster R-CNN, e i primi rilevatori a singolo stadio come SSD (Single Shot MultiBox Detector) e molti modelli YOLO, tra cui il grande successo di Ultralytics YOLOv5.
L'idea alla base del rilevamento basato sugli ancoraggi è quella di utilizzare un insieme di caselle di riferimento predefinite come punto di partenza. Durante il processo di formazione del modello, il rilevatore impara a svolgere due compiti principali per ogni casella di ancoraggio:
Queste previsioni vengono fatte dalla testa di rilevamento del modello dopo aver elaborato le caratteristiche dell'immagine estratte dalla struttura portante. Poiché un singolo oggetto può essere rilevato da più caselle di ancoraggio, viene utilizzata una fase di post-elaborazione chiamata Non-Maximum Suppression (NMS) per filtrare i rilevamenti ridondanti e mantenere solo la casella più adatta. Le prestazioni di questi modelli sono spesso valutate utilizzando metriche come la precisione media (mAP) e l'intersezione sull'unione (IoU).
Negli ultimi anni, i rilevatori privi di ancore sono emersi come un'alternativa popolare. A differenza dei modelli basati sulle ancore, gli approcci privi di ancore predicono direttamente le posizioni e le dimensioni degli oggetti, spesso identificando punti chiave (come i centri o gli angoli dell'oggetto) o prevedendo le distanze da un punto ai confini dell'oggetto, eliminando la necessità di forme di ancoraggio predefinite.
Le differenze principali includono:
Mentre i rilevatori basati su ancore come YOLOv4 hanno avuto un grande successo, molte architetture moderne, tra cui Ultralytics YOLO11, hanno adottato design privi di ancore per sfruttarne i vantaggi in termini di semplicità ed efficienza. È possibile esplorare i vantaggi del rilevamento senza ancore in YOLO11 e vedere i confronti tra i diversi modelli YOLO.
I rilevatori basati su ancore sono ampiamente utilizzati in varie applicazioni in cui gli oggetti hanno forme e dimensioni relativamente standard.
Lo sviluppo e la distribuzione di modelli di rilevamento degli oggetti, sia basati su ancore che senza ancore, comporta l'utilizzo di framework come PyTorch o TensorFlow e librerie come OpenCV. Piattaforme come Ultralytics HUB offrono flussi di lavoro semplificati per l'addestramento di modelli personalizzati, la gestione di set di dati e la distribuzione di soluzioni, supportando varie architetture di modelli. Per un ulteriore apprendimento, risorse come Papers With Code elencano modelli all'avanguardia e i corsi di piattaforme come DeepLearning.AI coprono i concetti fondamentali.