Sintonizzati su YOLO Vision 2025!
25 settembre 2025
10:00 — 18:00 BST
Evento ibrido
Yolo Vision 2024
Glossario

Scatole di ancoraggio

Scoprite come le scatole di ancoraggio consentono il rilevamento di oggetti basati sulle ancore, i priori per la classificazione, la regressione e l'NMS, con applicazioni nella guida autonoma e nella vendita al dettaglio.

I riquadri di ancoraggio sono un componente fondamentale in molti modelli di rilevamento degli oggetti basati sull'ancoraggio e servono come insieme predefinito di riquadri di riferimento con altezze e larghezze specifiche. Queste caselle agiscono come priori, o ipotesi istruite, sulla potenziale posizione e scala degli oggetti in un'immagine. Invece di cercare gli oggetti alla cieca, i modelli utilizzano queste ancore come punti di partenza, prevedendo gli offset per affinare la loro posizione e le loro dimensioni in modo che corrispondano agli oggetti reali. Questo approccio trasforma il complesso compito della localizzazione degli oggetti in un problema di regressione più gestibile, in cui il modello impara a regolare questi modelli piuttosto che generare caselle da zero.

Come funzionano le scatole di ancoraggio

Il meccanismo centrale consiste nel rivestire un'immagine con una fitta griglia di caselle di ancoraggio in varie posizioni. In ogni posizione, vengono utilizzate più ancore con scale e rapporti d'aspetto diversi, per garantire il rilevamento efficace di oggetti di forme e dimensioni diverse. Durante il processo di addestramento del modello, la struttura portante del rilevatore estrae innanzitutto una mappa di caratteristiche dall'immagine di ingresso. La testa di rilevamento utilizza quindi queste caratteristiche per eseguire due compiti per ogni casella di ancoraggio:

  • Classificazione: Prevede la probabilità che una casella di ancoraggio contenga un oggetto di interesse, assegnando un'etichetta di classe e un punteggio di confidenza.
  • Regressione: Calcola gli aggiustamenti (o offset) necessari per trasformare il riquadro di ancoraggio in un riquadro di delimitazione finale che racchiuda perfettamente l'oggetto.

Il modello utilizza metriche come Intersection over Union (IoU) per determinare quali caselle di ancoraggio corrispondono meglio agli oggetti della verità a terra durante l'addestramento. Dopo la predizione, viene applicata una fase di post-elaborazione chiamata Non-Maximum Suppression (NMS) per eliminare le caselle ridondanti e sovrapposte per lo stesso oggetto.

Scatole di ancoraggio e altri concetti

È importante distinguere le caselle di ancoraggio dai termini correlati nella computer vision:

  • Riquadro di delimitazione: Un riquadro di ancoraggio è un modello predefinito utilizzato durante il processo di rilevamento, mentre un riquadro di delimitazione è l'output finale e raffinato che localizza con precisione un oggetto rilevato.
  • Rilevatori senza ancore: Mentre i modelli basati sulle ancore, come YOLOv5 e la famiglia Faster R-CNN, si basano su queste preimpostazioni, le architetture moderne si sono sempre più orientate verso rilevatori privi di ancore. Modelli come Ultralytics YOLO11 prevedono la posizione degli oggetti direttamente identificando i punti chiave o i centri, il che semplifica la progettazione del modello e può migliorare le prestazioni su oggetti con forme non convenzionali. Per saperne di più sui vantaggi di un design privo di ancoraggi in YOLO11.

Applicazioni nel mondo reale

L'approccio strutturato delle caselle di ancoraggio le rende efficaci in scenari in cui gli oggetti hanno forme e dimensioni prevedibili.

  1. Guida autonoma: Nelle soluzioni per il settore automobilistico, i rilevatori basati su ancoraggi eccellono nell'identificazione di auto, pedoni e segnali stradali. I rapporti di aspetto relativamente coerenti di questi oggetti si allineano bene con gli ancoraggi predefiniti, consentendo un rilevamento affidabile per i sistemi sviluppati da aziende come NVIDIA e Tesla.
  2. Analitica del commercio al dettaglio: Per la gestione dell'inventario guidata dall'intelligenza artificiale, questi modelli possono scansionare in modo efficiente gli scaffali per contare i prodotti. Le dimensioni e la forma uniformi dei prodotti confezionati li rendono candidati ideali per un approccio basato sulle ancore, aiutando ad automatizzare il monitoraggio delle scorte e a ridurre lo sforzo manuale.

Questi modelli sono in genere sviluppati utilizzando potenti framework di deep learning come PyTorch e TensorFlow. Per continuare a imparare, piattaforme come DeepLearning.AI offrono corsi completi sui fondamenti della computer vision.

Unisciti alla community di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora
Link copiato negli appunti