Scopri come il rilevamento di bounding box orientati (OBB) migliora il rilevamento di oggetti identificando con precisione oggetti ruotati nelle immagini in diverse applicazioni reali.

Scopri come il rilevamento di bounding box orientati (OBB) migliora il rilevamento di oggetti identificando con precisione oggetti ruotati nelle immagini in diverse applicazioni reali.
Riconoscere gli oggetti, indipendentemente da come sono disposti o da che parte sono rivolti, è naturale per noi esseri umani. Che si tratti di auto a un incrocio o di barche in un porto, possiamo facilmente capire cosa sono e in quale direzione sono rivolte. Tuttavia, per i sistemi di intelligenza artificiale (IA), non è così semplice.
Ad esempio, la computer vision, un ramo dell'IA focalizzato sulla comprensione di immagini e video, consente attività come il rilevamento di oggetti, che aiuta le macchine a identificare e localizzare oggetti all'interno di una scena. Il rilevamento di oggetti tradizionale si basa su bounding box allineati agli assi per disegnare riquadri attorno agli oggetti. Questi riquadri hanno lati diritti e angoli retti fissi. Questo approccio funziona bene quando gli oggetti sono verticali e non troppo vicini tra loro.
Ma quando gli oggetti sono inclinati, ruotati o vicini tra loro, il rilevamento oggetti tradizionale spesso fatica a catturarli con precisione. Per gestire queste situazioni più complesse, sono state introdotte tecniche come il rilevamento di bounding box orientati (OBB). A differenza dei bounding box standard, gli OBB possono ruotare per adattarsi all'angolo e alla forma dell'oggetto, consentendo un adattamento più preciso e accurato.
I modelli di computer vision come Ultralytics YOLO11, che supportano il rilevamento OBB, consentono una vasta gamma di applicazioni in tempo reale, specialmente in scenari in cui l'orientamento degli oggetti è importante, come la sorveglianza aerea. Oltre a ciò, il rilevamento OBB viene utilizzato anche in ambito sanitario, agricoltura e analisi dei documenti.
In questo articolo, esploreremo cos'è il rilevamento OBB, come funziona e dove viene applicato in scenari reali. Iniziamo!
Un bounding box orientato è un tipo di riquadro rettangolare utilizzato nella computer vision per rappresentare gli oggetti rilevati in un'immagine. Mentre i bounding box standard sono allineati con gli assi orizzontale e verticale dell'immagine, gli OBB possono ruotare per adattarsi all'angolazione effettiva dell'oggetto.
Questa capacità di ruotare offre diversi vantaggi. Le OBB possono allinearsi più strettamente con l'orientamento di un oggetto, consentendo alla casella di adattarsi perfettamente alla forma e alla direzione dell'oggetto. Di conseguenza, il rilevamento diventa più accurato e preciso.
Gli OBB sono particolarmente utili quando gli oggetti non sono perfettamente verticali, come un'auto che svolta su una strada curva in riprese aeree, un libro inclinato su una scrivania o un tumore ruotato in una scansione medica. Adattandosi all'angolazione di un oggetto in modo più accurato, gli OBB migliorano le prestazioni di rilevamento, riducono le interferenze di sfondo e sono particolarmente adatti per applicazioni in cui l'orientamento di un oggetto è importante quanto la sua posizione.
Il rilevamento OBB e il rilevamento oggetti tradizionale potrebbero sembrare simili a prima vista, ma vengono utilizzati in modi diversi e per situazioni diverse. Diamo un'occhiata più da vicino a come si confrontano con un esempio.
I modelli di computer vision, come YOLO11, possono essere addestrati per rilevare e classificare oggetti in varie applicazioni del mondo reale, come l'ispezione industriale. Si consideri una linea di assemblaggio in fabbrica dove diverse parti di macchine si muovono lungo un nastro trasportatore. Alcune parti potrebbero essere posizionate in modo ordinato, ma altre potrebbero essere leggermente ruotate, inclinate o sovrapposte a causa di vibrazioni o velocità.
Il rilevamento oggetti tradizionale utilizza riquadri rettangolari verticali che si allineano ai bordi orizzontali e verticali dell'immagine. Quindi, quando una parte viene ruotata, il riquadro potrebbe non adattarsi correttamente: potrebbe escludere parte dell'oggetto o includere troppo sfondo. Ciò può rendere i rilevamenti meno accurati e rendere più difficile per il sistema identificare la parte con sicurezza.
Ora, supponiamo che tu stia utilizzando invece il rilevamento OBB. In questo caso, il modello può disegnare una casella che ruota per corrispondere all'angolo esatto di ogni parte. Un ingranaggio inclinato o un componente angolato saranno racchiusi saldamente da una casella che si adatta alla sua forma e direzione. Ciò significa maggiore precisione, meno errori e risultati più affidabili, soprattutto per quanto riguarda casi d'uso come il controllo qualità automatizzato o lo smistamento robotizzato.
Ora che abbiamo una migliore comprensione di cosa sia il rilevamento OBB, diamo un'occhiata ad alcuni dei modelli Vision AI più utilizzati che lo supportano.
Sono stati sviluppati diversi modelli avanzati di computer vision specificamente per il rilevamento di oggetti ruotati o inclinati. Tra questi, i modelli Ultralytics YOLO sono particolarmente noti per le loro capacità di rilevamento OBB affidabili ed efficienti.
Le versioni precedenti come Ultralytics YOLOv5 erano progettate per il rilevamento oggetti standard. Le iterazioni successive, come Ultralytics YOLOv8 e il più recente YOLO11, hanno introdotto il supporto nativo per il rilevamento OBB. In particolare, YOLO11 offre una precisione all'avanguardia senza compromettere la velocità, rendendolo un'opzione di grande impatto per le applicazioni in tempo reale.
I modelli YOLO11 OBB pre-addestrati, come YOLO11n-obb, sono addestrati su dataset come DOTAv1, che consiste in immagini aeree annotate con una serie di classi di oggetti come aerei, navi e campi da tennis che appaiono a varie angolazioni e orientamenti.
Inoltre, questi modelli sono disponibili in cinque diverse dimensioni, da nano (n-obb) a extra-large (x-obb), per soddisfare diverse esigenze di prestazioni. Questa versatilità consente di applicarli in vari settori, dal monitoraggio delle infrastrutture urbane e l'ispezione di macchinari alla lettura di testi distorti in documenti scansionati.
In molte situazioni del mondo reale, gli oggetti che devi rilevare potrebbero essere completamente diversi da quelli nei dataset di addestramento standard. Ad esempio, oggetti come utensili su una linea di produzione, confezioni di prodotti o componenti su un circuito stampato potrebbero essere ruotati, posizionati in modo irregolare o avere forme diverse.
Per rilevare accuratamente questi oggetti personalizzati, soprattutto quando l'orientamento è importante, è fondamentale addestrare modelli come YOLO11 utilizzando le proprie immagini ed etichette. Questo processo è noto come addestramento personalizzato.
Ecco uno sguardo più da vicino al processo passo-passo per il training di YOLO11 per il rilevamento OBB:
Gli oggetti fuori centro o inclinati sono piuttosto comuni negli scenari reali. Analizziamo alcuni esempi in cui l'OBB detection fa davvero la differenza rilevando accuratamente questi oggetti.
Il rilevamento OBB può portare l'analisi delle immagini mediche a un livello superiore migliorando la precisione. Le immagini mediche spesso includono strutture anatomiche come tumori, organi o ossa. Queste strutture appaiono spesso in forme irregolari e orientamenti diversi. Poiché gli OBB possono ruotare per adattarsi all'angolazione di un oggetto, forniscono una localizzazione e una misurazione più accurate, il che è fondamentale per la diagnosi e la pianificazione del trattamento.
Questo approccio è particolarmente efficace quando si tratta di analizzare immagini a raggi X di fratture ossee, dove la posizione e l'allineamento delle ossa sono fattori chiave. Ad esempio, il rilevamento OBB è stato utilizzato per analizzare le radiografie del gomito pediatriche. Adattandosi all'orientamento delle ossa, ha contribuito a migliorare l'accuratezza del rilevamento.
La sorveglianza aerea è uno strumento essenziale in settori come la sicurezza pubblica, il monitoraggio ambientale e la pianificazione urbana. Le immagini acquisite da droni o satelliti possono aiutare a identificare oggetti come navi, veicoli ed edifici. Tuttavia, in queste immagini, gli oggetti appaiono spesso piccoli e con angolazioni insolite, rendendo più difficile il rilevamento accurato.
Il rilevamento OBB risolve questo problema inclinando i bounding box per adattarsi all'angolazione di ciascun oggetto. Ciò porta a misurazioni più accurate delle dimensioni e dell'orientamento di un oggetto, supportando un processo decisionale migliore in aree quali la pianificazione urbana, la difesa, la risposta ai disastri e il monitoraggio ambientale.
Un interessante esempio di rilevamento OBB è il tracciamento delle navi nella sorveglianza marittima. Le immagini satellitari spesso catturano le navi a diverse angolazioni e dimensioni a causa del tempo, dell'illuminazione o del movimento. Gli OBB possono adattarsi a questi cambiamenti, migliorando il rilevamento, soprattutto per le navi più piccole o parzialmente oscurate.
La selezione dei raccolti dopo il raccolto è un passaggio cruciale per garantire la qualità prima che vengano confezionati e inviati al mercato. Mentre molti sistemi funzionano bene per i frutti rotondi come mele e arance, i raccolti lunghi e stretti, come carote o germogli di Zizania, possono essere molto più difficili da gestire. Le loro forme variano e spesso finiscono con angolazioni diverse, rendendoli difficili da rilevare e ordinare con precisione.
Per affrontare questo problema, i ricercatori hanno sviluppato un sistema che utilizza il rilevamento di bounding box orientati (OBB) per identificare e classificare questi raccolti in modo più accurato. Il sistema è in grado di rilevare più raccolti in un'unica immagine, anche se sono inclinati o sovrapposti, e di valutarne la qualità e la posizione in tempo reale.
Ecco alcuni dei vantaggi dell'utilizzo del rilevamento OBB:
Nonostante contribuisca a migliorare l'accuratezza del rilevamento in scene complesse, il rilevamento OBB presenta alcune limitazioni da considerare:
Il rilevamento di bounding box orientati semplifica il riconoscimento di oggetti non perfettamente diritti o allineati per le soluzioni di computer vision. Acquisendo sia la posizione che l'orientamento degli oggetti, il rilevamento OBB aumenta la precisione in casi d'uso reali come la scansione di immagini mediche, il monitoraggio di terreni agricoli o l'analisi di foto satellitari.
Con modelli come YOLO11 che rendono più accessibile il rilevamento OBB, sta diventando una scelta pratica per molti settori. Che tu abbia a che fare con oggetti inclinati, sovrapposti o di forma strana, il rilevamento OBB aggiunge un ulteriore livello di precisione che i metodi standard spesso non raggiungono.
Sei curioso di AI? Esplora il nostro repository GitHub, entra in contatto con la nostra community e dai un'occhiata alle nostre opzioni di licenza per dare il via al tuo progetto di computer vision. Scopri di più sulle innovazioni come l'AI nel retail e la computer vision nella logistica sulle nostre pagine delle soluzioni.