Che cos'è il rilevamento oriented bounding box (OBB)?

5 minuti di lettura

9 giugno 2025

Scoprite come il rilevamento di bounding box orientati (OBB) migliora il rilevamento degli oggetti, identificando con precisione gli oggetti ruotati nelle immagini in applicazioni reali.

Riconoscere gli oggetti, indipendentemente da come sono disposti o da che parte sono rivolti, ci viene naturale come esseri umani. Che si tratti di automobili a un incrocio o di barche in un porto, possiamo facilmente capire cosa sono e in che direzione sono rivolte. Tuttavia, per i sistemi di intelligenza artificiale (AI) non è così semplice.

Ad esempio, la computer vision, una branca dell'intelligenza artificiale che si occupa della comprensione di immagini e video, consente di svolgere attività come il rilevamento degli oggetti, che aiuta le macchine a identificare e localizzare gli oggetti all'interno di una scena. Il rilevamento tradizionale degli oggetti si basa sui riquadri di delimitazione allineati agli assi per disegnare i riquadri intorno agli oggetti. Queste caselle hanno lati dritti e angoli retti fissi. Questo approccio funziona bene quando gli oggetti sono in posizione verticale e non troppo vicini. 

Ma quando gli oggetti sono inclinati, ruotati o vicini, il rilevamento tradizionale degli oggetti spesso fatica a catturarli con precisione. Per gestire queste situazioni più complesse, sono state introdotte tecniche come il rilevamento oriented bounding box (OBB). A differenza dei rettangoli di selezione standard, gli OBB possono ruotare per adattarsi all'angolo e alla forma dell'oggetto, consentendo un adattamento più stretto e accurato.

I modelli di visione artificiale come Ultralytics YOLO11, che supportano il rilevamento delle OBB, consentono una serie di applicazioni in tempo reale, soprattutto in scenari in cui l'orientamento degli oggetti è importante, come la sorveglianza aerea. Inoltre, il rilevamento delle OBB è utilizzato anche in campo sanitario, agricolo e nell'analisi dei documenti.

In questo articolo analizzeremo cos'è il rilevamento OBB, come funziona e dove viene applicato in scenari reali. Iniziamo!

__wf_reserved_inherit
Figura 1. Un esempio di utilizzo di YOLO11 per il rilevamento di OBB di imbarcazioni.

Che cos'è un rettangolo di selezione orientato?

Un riquadro di delimitazione orientato è un tipo di riquadro rettangolare utilizzato nella computer vision per rappresentare gli oggetti rilevati in un'immagine. Mentre i rettangoli di selezione standard sono allineati con gli assi orizzontali e verticali dell'immagine, gli OBB possono ruotare per adattarsi all'angolo effettivo dell'oggetto.

Questa capacità di rotazione offre diversi vantaggi. Gli OBB possono allinearsi più strettamente con l'orientamento di un oggetto, consentendo al riquadro di adattarsi strettamente alla forma e alla direzione dell'oggetto. Di conseguenza, il rilevamento diventa più accurato e preciso.

Le OBB sono particolarmente utili quando gli oggetti non sono perfettamente verticali, come un'auto che gira su una strada curva nelle riprese aeree, un libro inclinato su una scrivania o un tumore ruotato in una scansione medica. Grazie alla corrispondenza più accurata con l'angolo di un oggetto, le OBB migliorano le prestazioni di rilevamento, riducono le interferenze di sfondo e sono particolarmente indicate per le applicazioni in cui l'orientamento di un oggetto è importante quanto la sua posizione.

__wf_reserved_inherit
Figura 2. Confronto tra rilevamento di oggetti e rilevamento di OBB.

Rilevamento OBB vs. rilevamento di oggetti

Il rilevamento OBB e il rilevamento tradizionale degli oggetti possono sembrare simili a prima vista, ma vengono utilizzati in modi diversi e per situazioni diverse. Vediamo più da vicino come si confrontano con un esempio.

I modelli di visione artificiale, come YOLO11, possono essere addestrati per rilevare e classificare gli oggetti in varie applicazioni del mondo reale, come l'ispezione industriale. Si consideri una linea di assemblaggio di una fabbrica in cui diverse parti di macchine si muovono lungo un nastro trasportatore. Alcune parti possono essere posizionate in modo ordinato, ma altre possono essere leggermente ruotate, inclinate o sovrapposte a causa delle vibrazioni o della velocità.

Il rilevamento tradizionale degli oggetti utilizza caselle rettangolari verticali che si allineano ai bordi orizzontali e verticali dell'immagine. Pertanto, quando una parte viene ruotata, il riquadro potrebbe non adattarsi correttamente, lasciando fuori una parte dell'oggetto o includendo una parte eccessiva dello sfondo. Questo può rendere i rilevamenti meno accurati e più difficile per il sistema identificare con sicurezza il pezzo.

Supponiamo invece di utilizzare il rilevamento OBB. In questo caso, il modello può disegnare una scatola che ruota per adattarsi all'angolo esatto di ogni parte. Un ingranaggio inclinato o un componente angolato sarà strettamente racchiuso da una scatola che si adatta alla sua forma e direzione. Ciò significa maggiore precisione, meno errori e risultati più affidabili, soprattutto per quanto riguarda casi d'uso come il controllo qualità automatizzato o lo smistamento robotizzato.

Modelli di rilevamento OBB più diffusi

Ora che abbiamo capito meglio cos'è il rilevamento OBB, diamo un'occhiata ad alcuni dei modelli Vision AI più utilizzati che lo supportano.

Sono stati sviluppati diversi modelli avanzati di visione computerizzata specifici per il rilevamento di oggetti ruotati o inclinati. Tra questi, i modelli Ultralytics YOLO sono particolarmente noti per le loro capacità di rilevamento di OBB affidabili ed efficienti.

Le versioni precedenti, come Ultralytics YOLOv5, erano progettate per il rilevamento di oggetti standard. Le versioni successive, come Ultralytics YOLOv8 e la più recente YOLO11, hanno introdotto il supporto nativo per il rilevamento di OBB. YOLO11, in particolare, offre una precisione all'avanguardia senza compromettere la velocità, rendendolo un'opzione efficace per le applicazioni in tempo reale.

I modelli YOLO11 OBB pre-addestrati, come YOLO11n-obb, sono addestrati su set di dati come DOTAv1, che consiste in immagini aeree annotate con una serie di classi di oggetti come aerei, navi e campi da tennis che appaiono in varie angolazioni e orientamenti. 

Inoltre, questi modelli sono disponibili in cinque diverse dimensioni, da nano (n-obb) a extra-large (x-obb), per soddisfare le diverse esigenze di prestazioni. Questa versatilità ne consente l'applicazione in diversi settori, dal monitoraggio delle infrastrutture urbane all'ispezione dei macchinari, fino alla lettura di testi obliqui nei documenti scansionati.

Formazione personalizzata YOLO11 per il rilevamento dei rettangoli di selezione orientati

In molte situazioni reali, gli oggetti da rilevare possono essere completamente diversi da quelli presenti nei set di dati di addestramento standard. Ad esempio, oggetti come gli utensili di una linea di produzione, le confezioni di un prodotto o i componenti di una scheda elettronica possono essere ruotati, posizionati in modo irregolare o avere una forma diversa. 

Per rilevare con precisione questi oggetti personalizzati, soprattutto quando l'orientamento è importante, è importante addestrare modelli come YOLO11 utilizzando le immagini e le etichette dell'utente. Questo processo è noto come addestramento personalizzato

Ecco un'analisi più approfondita del processo di formazione di YOLO11 per il rilevamento di OBB, passo dopo passo:

  • Raccolta di immagini: Raccogliere immagini che mostrino gli oggetti di destinazione da diverse angolazioni, posizioni e ambienti reali.
  • Annotazione degli oggetti: Etichettare ogni oggetto utilizzando caselle di delimitazione ruotate (OBB) per catturarne la posizione e l'orientamento utilizzando strumenti di annotazione con supporto OBB.
  • Preparazione del set di dati: Organizzare le immagini e le etichette nella struttura di directory di YOLO e creare un file di configurazione YAML con i nomi delle classi e i percorsi dei set di dati.
  • Formazione del modello: Scegliere una versione del modello YOLO11 adatta alle proprie esigenze ed eseguire il processo di addestramento in modo che il modello possa imparare dalle immagini etichettate.
  • Valutazione e impiego: Testate il modello addestrato su nuove immagini, valutatene l'accuratezza e impiegatelo in applicazioni pratiche come la produzione, la sorveglianza aerea o l'analisi di documenti.

Applicazioni abilitate dal rilevamento OBB

Gli oggetti decentrati o inclinati sono piuttosto comuni negli scenari reali. Vediamo alcuni esempi in cui il rilevamento OBB fa davvero la differenza, rilevando con precisione questi oggetti.

Analisi di immagini a raggi X con rilevamento OBB

Il rilevamento delle OBB può fare un passo avanti nell'analisi delle immagini mediche, migliorando la precisione. Le immagini mediche spesso includono strutture anatomiche come tumori, organi o ossa. Queste strutture appaiono spesso in forme irregolari e con orientamenti diversi. Poiché le OBB possono ruotare per adattarsi all'angolo di un oggetto, forniscono una localizzazione e una misurazione più accurate, fondamentali per la diagnosi e la pianificazione del trattamento.

Questo approccio è particolarmente efficace quando si tratta di analizzare immagini radiografiche di fratture ossee, dove la posizione e l'allineamento delle ossa sono fattori chiave. Ad esempio, il rilevamento OBB è stato utilizzato per analizzare le radiografie del gomito in età pediatrica. Adattandosi all'orientamento delle ossa, ha contribuito a migliorare l'accuratezza del rilevamento. 

__wf_reserved_inherit
Figura 3. Raggi X (a, d) con rilevamento di oggetti (b, e) e rilevamento di bounding box orientati (c, f).

Sorveglianza aerea alimentata dal rilevamento OBB

La sorveglianza aerea è uno strumento essenziale in settori come la sicurezza pubblica, il monitoraggio ambientale e la pianificazione urbana. Le immagini catturate da droni o satelliti possono aiutare a identificare oggetti come navi, veicoli ed edifici. Tuttavia, in queste immagini, gli oggetti appaiono spesso piccoli e con angolazioni insolite, il che ne rende più difficile l'individuazione accurata.

Il rilevamento OBB risolve questo problema inclinando i riquadri di delimitazione in modo che corrispondano all'angolo di ciascun oggetto. Questo porta a misurazioni più accurate delle dimensioni e dell'orientamento di un oggetto, supportando un migliore processo decisionale in aree come la pianificazione urbana, la difesa, la risposta ai disastri e il monitoraggio ambientale.

Un esempio interessante di rilevamento OBB è il tracciamento delle navi nella sorveglianza marittima. Le immagini satellitari spesso riprendono le navi con angolazioni e dimensioni diverse a causa delle condizioni atmosferiche, dell'illuminazione o del movimento. Le OBB possono adattarsi a questi cambiamenti, migliorando il rilevamento, soprattutto per le navi più piccole o parzialmente oscurate.

__wf_reserved_inherit
Figura 4. Uno sguardo all'utilizzo del rilevamento OBB per la sorveglianza marittima.

Utilizzo del rilevamento OBB in agricoltura

La cernita delle colture dopo il raccolto è una fase cruciale per garantire la qualità prima del confezionamento e dell'invio al mercato. Mentre molti sistemi funzionano bene per i frutti rotondi come mele e arance, le colture lunghe e strette, come le carote o i germogli di Zizania, possono essere molto più difficili da gestire. Le loro forme variano e spesso si trovano ad angoli diversi, il che rende difficile individuarle e selezionarle con precisione.

Per risolvere questo problema, i ricercatori hanno sviluppato un sistema che utilizza il rilevamento della bounding box orientata (OBB) per identificare e classificare queste colture con maggiore precisione. Il sistema è in grado di rilevare più colture in un'immagine, anche se inclinate o sovrapposte, e di valutarne la qualità e la posizione in tempo reale.

Pro e contro del rilevamento OBB

Ecco alcuni dei vantaggi dell'utilizzo del rilevamento OBB:

  • Miglioramento dell'input per le attività a valle: Icompiti di visione artificiale, come la segmentazione delle istanze e il tracciamento degli oggetti, possono essere eseguiti meglio quando vengono rilevati oggetti più precisi.

  • Miglioramento del ragionamento spaziale: Catturando l'angolo di orientamento, le OBB permettono di capire l'allineamento e la direzione di un oggetto.

  • Riduzione della sovrapposizione in scene affollate: Gli OBB riducono l'ambiguità adattando gli oggetti in modo più stretto, anche in scene affollate o disordinate.

Sebbene contribuisca a migliorare l'accuratezza del rilevamento in scene complesse, il rilevamento OBB presenta alcune limitazioni da considerare:

  • Maggiore sensibilità al rumore: Piccoli errori nella previsione dell'angolo possono avere un impatto maggiore sull'accuratezza del rilevamento, in particolare per gli oggetti strettamente impacchettati o allungati.
  • Sono necessari strumenti specializzati: Poiché non tutte le piattaforme di etichettatura e formazione supportano in modo nativo gli OBB, il loro utilizzo può richiedere strumenti o configurazioni aggiuntive.

  • Disponibilità limitata di set di dati: Rispetto al rilevamento di oggetti standard, attualmente sono disponibili meno set di dati pubblici con annotazioni OBB, il che può rendere un po' più difficile iniziare o confrontare i risultati.

Punti di forza

Il rilevamento dei riquadri di delimitazione orientati facilita il riconoscimento di oggetti non perfettamente dritti o allineati da parte delle soluzioni di visione artificiale. Catturando sia la posizione che l'orientamento degli oggetti, il rilevamento OBB aumenta la precisione in casi d'uso reali come la scansione di immagini mediche, il monitoraggio di terreni agricoli o l'analisi di foto satellitari.

Con modelli come YOLO11 che rendono il rilevamento OBB più accessibile, sta diventando una scelta pratica per molti settori. Se si ha a che fare con oggetti inclinati, sovrapposti o di forma strana, il rilevamento OBB aggiunge un ulteriore livello di precisione che spesso i metodi standard non riescono a raggiungere.

Siete curiosi di conoscere l'intelligenza artificiale? Esplorate il nostro repository GitHub, entrate in contatto con la nostra comunità e controllate le nostre opzioni di licenza per avviare il vostro progetto di computer vision. Per saperne di più su innovazioni come l'IA nella vendita al dettaglio e la computer vision nel settore della logistica, consultate le nostre pagine dedicate alle soluzioni.

Costruiamo insieme il futuro
dell'IA!

Iniziate il vostro viaggio nel futuro dell'apprendimento automatico

Iniziare gratuitamente
Link copiato negli appunti