Sintonizzati su YOLO Vision 2025!
25 settembre 2025
10:00 — 18:00 BST
Evento ibrido
Yolo Vision 2024
Glossario

Bounding Box

Scopri come le bounding box abilitano i sistemi di object detection, IA e machine learning. Esplora il loro ruolo nelle applicazioni di computer vision!

Una bounding box è un'annotazione rettangolare utilizzata nella computer vision per indicare la posizione di un oggetto all'interno di un'immagine o di un fotogramma video. Serve come componente fondamentale del rilevamento di oggetti, fornendo un modo semplice ma efficace per definire la posizione e la scala di un oggetto. Nel machine learning, i modelli vengono addestrati su grandi dataset di immagini con bounding box etichettate per imparare a identificare e localizzare gli oggetti da soli. L'output di questi modelli include le coordinate della casella, un'etichetta di classe (ad esempio, "auto", "persona") e un punteggio di confidenza che indica la certezza del modello nella sua previsione.

Come funzionano i Bounding Box

Una bounding box è tipicamente definita da un insieme di coordinate che ne specificano la posizione e le dimensioni. Le rappresentazioni più comuni sono:

  • Coordinate dell'angolo superiore sinistro con larghezza e altezza (x, y, w, h): Questo formato specifica le coordinate x e y dell'angolo superiore sinistro, insieme alla larghezza e all'altezza della casella.
  • Punti d'angolo (x_min, y_min, x_max, y_max): Questo formato definisce le coordinate degli angoli superiore sinistro e inferiore destro del rettangolo.

Queste coordinate vengono utilizzate per addestrare modelli di deep learning, che imparano a prevedere questi valori per immagini nuove e mai viste prima. L'accuratezza di un bounding box previsto viene spesso valutata utilizzando una metrica chiamata Intersection over Union (IoU), che misura la sovrapposizione tra il box previsto e il ground-truth box. I modelli moderni di object detection, come Ultralytics YOLO11, sono altamente ottimizzati per generare bounding box precisi in tempo reale.

Tipi di bounding box

Esistono due tipi principali di bounding box:

  1. Bounding Box Allineata agli Assi: Questo è il tipo più comune, in cui i lati del rettangolo sono allineati con gli assi orizzontale e verticale dell'immagine. Sono semplici da rappresentare ed elaborare, ma possono essere inefficienti per oggetti ruotati o di forma irregolare, poiché la casella può includere un'area di sfondo significativa.
  2. Bounding Box orientato (OBB): Questo tipo di box include un parametro aggiuntivo per la rotazione, consentendogli di adattarsi più precisamente agli oggetti inclinati. Gli OBB sono particolarmente utili in applicazioni specializzate come l'analisi di immagini satellitari o immagini aeree da droni, dove gli oggetti sono spesso visti da varie angolazioni. Modelli come YOLO11 supportano l'object detection orientato per gestire questi scenari in modo più efficace.

Relazione con altri concetti

I bounding box sono strettamente correlati ad altre attività di computer vision, ma hanno uno scopo distinto.

  • Rilevamento di oggetti vs. Segmentazione delle immagini: Mentre il rilevamento di oggetti utilizza riquadri di delimitazione per localizzare gli oggetti, la segmentazione delle immagini offre una comprensione più dettagliata della forma di un oggetto. La segmentazione delle istanze, ad esempio, fa un ulteriore passo avanti delineando l'esatto confine a livello di pixel di ogni oggetto distinto, piuttosto che limitarsi a disegnare un rettangolo attorno ad esso. Questo è utile per le applicazioni che richiedono informazioni precise sulla forma. Ulteriori informazioni sono disponibili in questa guida alla segmentazione delle istanze.
  • Bounding Box vs. Anchor Box: In alcuni modelli di object detection, noti come rilevatori basati su anchor, vengono utilizzate delle box predefinite chiamate "anchor box" come riferimento per aiutare il modello a prevedere la bounding box finale. Al contrario, i rilevatori anchor-free prevedono le bounding box direttamente senza queste preimpostazioni, semplificando spesso l'architettura del modello.

Applicazioni in Scenari del Mondo Reale

Le bounding box sono parte integrante di numerose applicazioni pratiche di IA:

  1. Veicoli Autonomi: Le auto a guida autonoma si affidano fortemente al rilevamento di oggetti per identificare e localizzare pedoni, altri veicoli e semafori utilizzando bounding box. Questa consapevolezza spaziale, spesso ottenuta tramite modelli di deep learning, è fondamentale per una navigazione sicura. Aziende come Waymo mostrano ampiamente questa tecnologia. Ultralytics offre approfondimenti sull'IA nelle auto a guida autonoma.
  2. Analisi al dettaglio: Nel retail, i bounding box aiutano nella gestione dell'inventario basata sull'intelligenza artificiale rilevando i prodotti sugli scaffali, monitorando i livelli di stock e analizzando il comportamento dei clienti attraverso i modelli di traffico pedonale (conteggio degli oggetti).
  3. Sicurezza e Sorveglianza: I bounding box consentono ai sistemi di monitoraggio automatizzati di rilevare e tracciare individui o oggetti in tempo reale, attivando avvisi per attività sospette. Questo è fondamentale per la creazione di applicazioni come i sistemi di allarme di sicurezza.
  4. Analisi di immagini mediche: In ambito sanitario, i bounding box assistono i medici evidenziando potenziali anomalie come tumori nelle scansioni, aiutando a una diagnosi più rapida. Puoi vedere esempi di questo in Radiology: Artificial Intelligence research e sulla nostra pagina di analisi di immagini mediche.
  5. Agricoltura: I bounding box vengono utilizzati nell'agricoltura di precisione per attività come l'identificazione dei frutti per la raccolta, il monitoraggio della salute delle colture o il rilevamento di parassiti, come descritto in dettaglio nel nostro blog sulla computer vision in agricoltura.

Unisciti alla community di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora
Link copiato negli appunti