Scoprite come il rilevamento di bounding box orientati (OBB) migliora il rilevamento degli oggetti, identificando con precisione gli oggetti ruotati nelle immagini in applicazioni reali.

Scoprite come il rilevamento di bounding box orientati (OBB) migliora il rilevamento degli oggetti, identificando con precisione gli oggetti ruotati nelle immagini in applicazioni reali.
Riconoscere gli oggetti, indipendentemente da come sono disposti o da che parte sono rivolti, ci viene naturale come esseri umani. Che si tratti di automobili a un incrocio o di barche in un porto, possiamo facilmente capire cosa sono e in che direzione sono rivolte. Tuttavia, per i sistemi di intelligenza artificiale (AI) non è così semplice.
Ad esempio, la computer vision, una branca dell'intelligenza artificiale che si occupa della comprensione di immagini e video, consente di svolgere attività come il rilevamento degli oggetti, che aiuta le macchine a identificare e localizzare gli oggetti all'interno di una scena. Il rilevamento tradizionale degli oggetti si basa sui riquadri di delimitazione allineati agli assi per disegnare i riquadri intorno agli oggetti. Queste caselle hanno lati dritti e angoli retti fissi. Questo approccio funziona bene quando gli oggetti sono in posizione verticale e non troppo vicini.
Ma quando gli oggetti sono inclinati, ruotati o vicini, il rilevamento tradizionale degli oggetti spesso fatica a catturarli con precisione. Per gestire queste situazioni più complesse, sono state introdotte tecniche come il rilevamento oriented bounding box (OBB). A differenza dei rettangoli di selezione standard, gli OBB possono ruotare per adattarsi all'angolo e alla forma dell'oggetto, consentendo un adattamento più stretto e accurato.
I modelli di visione artificiale come Ultralytics YOLO11, che supportano il rilevamento delle OBB, consentono una serie di applicazioni in tempo reale, soprattutto in scenari in cui l'orientamento degli oggetti è importante, come la sorveglianza aerea. Inoltre, il rilevamento delle OBB è utilizzato anche in campo sanitario, agricolo e nell'analisi dei documenti.
In questo articolo analizzeremo cos'è il rilevamento OBB, come funziona e dove viene applicato in scenari reali. Iniziamo!
Un riquadro di delimitazione orientato è un tipo di riquadro rettangolare utilizzato nella computer vision per rappresentare gli oggetti rilevati in un'immagine. Mentre i rettangoli di selezione standard sono allineati con gli assi orizzontali e verticali dell'immagine, gli OBB possono ruotare per adattarsi all'angolo effettivo dell'oggetto.
Questa capacità di rotazione offre diversi vantaggi. Gli OBB possono allinearsi più strettamente con l'orientamento di un oggetto, consentendo al riquadro di adattarsi strettamente alla forma e alla direzione dell'oggetto. Di conseguenza, il rilevamento diventa più accurato e preciso.
Le OBB sono particolarmente utili quando gli oggetti non sono perfettamente verticali, come un'auto che gira su una strada curva nelle riprese aeree, un libro inclinato su una scrivania o un tumore ruotato in una scansione medica. Grazie alla corrispondenza più accurata con l'angolo di un oggetto, le OBB migliorano le prestazioni di rilevamento, riducono le interferenze di sfondo e sono particolarmente indicate per le applicazioni in cui l'orientamento di un oggetto è importante quanto la sua posizione.
Il rilevamento OBB e il rilevamento tradizionale degli oggetti possono sembrare simili a prima vista, ma vengono utilizzati in modi diversi e per situazioni diverse. Vediamo più da vicino come si confrontano con un esempio.
I modelli di visione artificiale, come YOLO11, possono essere addestrati per rilevare e classificare gli oggetti in varie applicazioni del mondo reale, come l'ispezione industriale. Si consideri una linea di assemblaggio di una fabbrica in cui diverse parti di macchine si muovono lungo un nastro trasportatore. Alcune parti possono essere posizionate in modo ordinato, ma altre possono essere leggermente ruotate, inclinate o sovrapposte a causa delle vibrazioni o della velocità.
Il rilevamento tradizionale degli oggetti utilizza caselle rettangolari verticali che si allineano ai bordi orizzontali e verticali dell'immagine. Pertanto, quando una parte viene ruotata, il riquadro potrebbe non adattarsi correttamente, lasciando fuori una parte dell'oggetto o includendo una parte eccessiva dello sfondo. Questo può rendere i rilevamenti meno accurati e più difficile per il sistema identificare con sicurezza il pezzo.
Supponiamo invece di utilizzare il rilevamento OBB. In questo caso, il modello può disegnare una scatola che ruota per adattarsi all'angolo esatto di ogni parte. Un ingranaggio inclinato o un componente angolato sarà strettamente racchiuso da una scatola che si adatta alla sua forma e direzione. Ciò significa maggiore precisione, meno errori e risultati più affidabili, soprattutto per quanto riguarda casi d'uso come il controllo qualità automatizzato o lo smistamento robotizzato.
Ora che abbiamo capito meglio cos'è il rilevamento OBB, diamo un'occhiata ad alcuni dei modelli Vision AI più utilizzati che lo supportano.
Sono stati sviluppati diversi modelli avanzati di visione computerizzata specifici per il rilevamento di oggetti ruotati o inclinati. Tra questi, i modelli Ultralytics YOLO sono particolarmente noti per le loro capacità di rilevamento di OBB affidabili ed efficienti.
Le versioni precedenti, come Ultralytics YOLOv5, erano progettate per il rilevamento di oggetti standard. Le versioni successive, come Ultralytics YOLOv8 e la più recente YOLO11, hanno introdotto il supporto nativo per il rilevamento di OBB. YOLO11, in particolare, offre una precisione all'avanguardia senza compromettere la velocità, rendendolo un'opzione efficace per le applicazioni in tempo reale.
I modelli YOLO11 OBB pre-addestrati, come YOLO11n-obb, sono addestrati su set di dati come DOTAv1, che consiste in immagini aeree annotate con una serie di classi di oggetti come aerei, navi e campi da tennis che appaiono in varie angolazioni e orientamenti.
Inoltre, questi modelli sono disponibili in cinque diverse dimensioni, da nano (n-obb) a extra-large (x-obb), per soddisfare le diverse esigenze di prestazioni. Questa versatilità ne consente l'applicazione in diversi settori, dal monitoraggio delle infrastrutture urbane all'ispezione dei macchinari, fino alla lettura di testi obliqui nei documenti scansionati.
In molte situazioni reali, gli oggetti da rilevare possono essere completamente diversi da quelli presenti nei set di dati di addestramento standard. Ad esempio, oggetti come gli utensili di una linea di produzione, le confezioni di un prodotto o i componenti di una scheda elettronica possono essere ruotati, posizionati in modo irregolare o avere una forma diversa.
Per rilevare con precisione questi oggetti personalizzati, soprattutto quando l'orientamento è importante, è importante addestrare modelli come YOLO11 utilizzando le immagini e le etichette dell'utente. Questo processo è noto come addestramento personalizzato.
Ecco un'analisi più approfondita del processo di formazione di YOLO11 per il rilevamento di OBB, passo dopo passo:
Gli oggetti decentrati o inclinati sono piuttosto comuni negli scenari reali. Vediamo alcuni esempi in cui il rilevamento OBB fa davvero la differenza, rilevando con precisione questi oggetti.
Il rilevamento delle OBB può fare un passo avanti nell'analisi delle immagini mediche, migliorando la precisione. Le immagini mediche spesso includono strutture anatomiche come tumori, organi o ossa. Queste strutture appaiono spesso in forme irregolari e con orientamenti diversi. Poiché le OBB possono ruotare per adattarsi all'angolo di un oggetto, forniscono una localizzazione e una misurazione più accurate, fondamentali per la diagnosi e la pianificazione del trattamento.
Questo approccio è particolarmente efficace quando si tratta di analizzare immagini radiografiche di fratture ossee, dove la posizione e l'allineamento delle ossa sono fattori chiave. Ad esempio, il rilevamento OBB è stato utilizzato per analizzare le radiografie del gomito in età pediatrica. Adattandosi all'orientamento delle ossa, ha contribuito a migliorare l'accuratezza del rilevamento.
La sorveglianza aerea è uno strumento essenziale in settori come la sicurezza pubblica, il monitoraggio ambientale e la pianificazione urbana. Le immagini catturate da droni o satelliti possono aiutare a identificare oggetti come navi, veicoli ed edifici. Tuttavia, in queste immagini, gli oggetti appaiono spesso piccoli e con angolazioni insolite, il che ne rende più difficile l'individuazione accurata.
Il rilevamento OBB risolve questo problema inclinando i riquadri di delimitazione in modo che corrispondano all'angolo di ciascun oggetto. Questo porta a misurazioni più accurate delle dimensioni e dell'orientamento di un oggetto, supportando un migliore processo decisionale in aree come la pianificazione urbana, la difesa, la risposta ai disastri e il monitoraggio ambientale.
Un esempio interessante di rilevamento OBB è il tracciamento delle navi nella sorveglianza marittima. Le immagini satellitari spesso riprendono le navi con angolazioni e dimensioni diverse a causa delle condizioni atmosferiche, dell'illuminazione o del movimento. Le OBB possono adattarsi a questi cambiamenti, migliorando il rilevamento, soprattutto per le navi più piccole o parzialmente oscurate.
La cernita delle colture dopo il raccolto è una fase cruciale per garantire la qualità prima del confezionamento e dell'invio al mercato. Mentre molti sistemi funzionano bene per i frutti rotondi come mele e arance, le colture lunghe e strette, come le carote o i germogli di Zizania, possono essere molto più difficili da gestire. Le loro forme variano e spesso si trovano ad angoli diversi, il che rende difficile individuarle e selezionarle con precisione.
Per risolvere questo problema, i ricercatori hanno sviluppato un sistema che utilizza il rilevamento della bounding box orientata (OBB) per identificare e classificare queste colture con maggiore precisione. Il sistema è in grado di rilevare più colture in un'immagine, anche se inclinate o sovrapposte, e di valutarne la qualità e la posizione in tempo reale.
Ecco alcuni dei vantaggi dell'utilizzo del rilevamento OBB:
Sebbene contribuisca a migliorare l'accuratezza del rilevamento in scene complesse, il rilevamento OBB presenta alcune limitazioni da considerare:
Il rilevamento dei riquadri di delimitazione orientati facilita il riconoscimento di oggetti non perfettamente dritti o allineati da parte delle soluzioni di visione artificiale. Catturando sia la posizione che l'orientamento degli oggetti, il rilevamento OBB aumenta la precisione in casi d'uso reali come la scansione di immagini mediche, il monitoraggio di terreni agricoli o l'analisi di foto satellitari.
Con modelli come YOLO11 che rendono il rilevamento OBB più accessibile, sta diventando una scelta pratica per molti settori. Se si ha a che fare con oggetti inclinati, sovrapposti o di forma strana, il rilevamento OBB aggiunge un ulteriore livello di precisione che spesso i metodi standard non riescono a raggiungere.
Siete curiosi di conoscere l'intelligenza artificiale? Esplorate il nostro repository GitHub, entrate in contatto con la nostra comunità e controllate le nostre opzioni di licenza per avviare il vostro progetto di computer vision. Per saperne di più su innovazioni come l'IA nella vendita al dettaglio e la computer vision nel settore della logistica, consultate le nostre pagine dedicate alle soluzioni.