Che cos'è il rilevamento oriented bounding box (OBB)?

Riconoscere gli oggetti, indipendentemente da come sono disposti o da che parte sono rivolti, è naturale per noi esseri umani. Che si tratti di auto a un incrocio o di barche in un porto, possiamo facilmente capire cosa sono e in quale direzione sono rivolte. Tuttavia, per i sistemi di intelligenza artificiale (IA), non è così semplice.

Ad esempio, la computer vision, un ramo dell'IA focalizzato sulla comprensione di immagini e video, consente attività come il rilevamento di oggetti, che aiuta le macchine a identificare e localizzare oggetti all'interno di una scena. Il rilevamento di oggetti tradizionale si basa su bounding box allineati agli assi per disegnare riquadri attorno agli oggetti. Questi riquadri hanno lati diritti e angoli retti fissi. Questo approccio funziona bene quando gli oggetti sono verticali e non troppo vicini tra loro.

Ma quando gli oggetti sono inclinati, ruotati o vicini tra loro, il rilevamento oggetti tradizionale spesso fatica a catturarli con precisione. Per gestire queste situazioni più complesse, sono state introdotte tecniche come il rilevamento di bounding box orientati (OBB). A differenza dei bounding box standard, gli OBB possono ruotare per adattarsi all'angolo e alla forma dell'oggetto, consentendo un adattamento più preciso e accurato.

Modelli di visione artificiale come Ultralytics YOLO11che supportano il rilevamento delle OBB, consentono una serie di applicazioni in tempo reale, soprattutto in scenari in cui l'orientamento degli oggetti è importante, come la sorveglianza aerea. Inoltre, il rilevamento delle OBB è utilizzato anche in campo sanitario, agricolo e nell'analisi dei documenti.

In questo articolo, esploreremo cos'è il rilevamento OBB, come funziona e dove viene applicato in scenari reali. Iniziamo!

__wf_reserved_inherit — Figura 1. Un esempio di utilizzo di YOLO11 per il rilevamento di OBB di imbarcazioni.

‍

Cos'è un bounding box orientato?

Un bounding box orientato è un tipo di riquadro rettangolare utilizzato nella computer vision per rappresentare gli oggetti rilevati in un'immagine. Mentre i bounding box standard sono allineati con gli assi orizzontale e verticale dell'immagine, gli OBB possono ruotare per adattarsi all'angolazione effettiva dell'oggetto.

Questa capacità di ruotare offre diversi vantaggi. Le OBB possono allinearsi più strettamente con l'orientamento di un oggetto, consentendo alla casella di adattarsi perfettamente alla forma e alla direzione dell'oggetto. Di conseguenza, il rilevamento diventa più accurato e preciso.

Gli OBB sono particolarmente utili quando gli oggetti non sono perfettamente verticali, come un'auto che svolta su una strada curva in riprese aeree, un libro inclinato su una scrivania o un tumore ruotato in una scansione medica. Adattandosi all'angolazione di un oggetto in modo più accurato, gli OBB migliorano le prestazioni di rilevamento, riducono le interferenze di sfondo e sono particolarmente adatti per applicazioni in cui l'orientamento di un oggetto è importante quanto la sua posizione.

‍

Rilevamento OBB vs. rilevamento oggetti

Il rilevamento OBB e il rilevamento oggetti tradizionale potrebbero sembrare simili a prima vista, ma vengono utilizzati in modi diversi e per situazioni diverse. Diamo un'occhiata più da vicino a come si confrontano con un esempio.

I modelli di visione artificiale, come YOLO11, possono essere addestrati per detect e classify gli oggetti in varie applicazioni del mondo reale, come l'ispezione industriale. Si consideri una catena di montaggio in cui diverse parti di macchine si muovono lungo un nastro trasportatore. Alcune parti possono essere posizionate in modo ordinato, ma altre possono essere leggermente ruotate, inclinate o sovrapposte a causa delle vibrazioni o della velocità.

Il rilevamento oggetti tradizionale utilizza riquadri rettangolari verticali che si allineano ai bordi orizzontali e verticali dell'immagine. Quindi, quando una parte viene ruotata, il riquadro potrebbe non adattarsi correttamente: potrebbe escludere parte dell'oggetto o includere troppo sfondo. Ciò può rendere i rilevamenti meno accurati e rendere più difficile per il sistema identificare la parte con sicurezza.

Ora, supponiamo che tu stia utilizzando invece il rilevamento OBB. In questo caso, il modello può disegnare una casella che ruota per corrispondere all'angolo esatto di ogni parte. Un ingranaggio inclinato o un componente angolato saranno racchiusi saldamente da una casella che si adatta alla sua forma e direzione. Ciò significa maggiore precisione, meno errori e risultati più affidabili, soprattutto per quanto riguarda casi d'uso come il controllo qualità automatizzato o lo smistamento robotizzato.

Modelli di OBB detection più diffusi

Ora che abbiamo una migliore comprensione di cosa sia il rilevamento OBB, diamo un'occhiata ad alcuni dei modelli Vision AI più utilizzati che lo supportano.

Sono stati sviluppati diversi modelli avanzati di visione computerizzata specifici per il rilevamento di oggetti ruotati o inclinati. Tra questi, i modelli Ultralytics YOLO sono particolarmente noti per le loro capacità di rilevamento delle OBB affidabili ed efficienti.

Le versioni precedenti, come Ultralytics YOLOv5 erano progettate per il rilevamento di oggetti standard. Le versioni successive, come Ultralytics YOLOv8 e il più recente YOLO11, hanno introdotto il supporto nativo per il rilevamento di OBB. YOLO11, in particolare, offre una precisione all'avanguardia senza compromettere la velocità, rendendolo un'opzione efficace per le applicazioni in tempo reale.

I modelliYOLO11 OBB pre-addestrati, come obb, sono addestrati su set di dati come DOTAv1, che consiste in immagini aeree annotate con una serie di classi di oggetti come aerei, navi e campi da tennis che appaiono in varie angolazioni e orientamenti.

Inoltre, questi modelli sono disponibili in cinque diverse dimensioni, da nano (obb) a extra-large (obb), per soddisfare le diverse esigenze di prestazioni. Questa versatilità ne consente l'applicazione in diversi settori, dal monitoraggio delle infrastrutture urbane all'ispezione dei macchinari, fino alla lettura di testi obliqui nei documenti scansionati.

Formazione personalizzata YOLO11 per il rilevamento dei rettangoli di selezione orientati

In molte situazioni reali, gli oggetti da detect possono essere completamente diversi da quelli presenti nei set di dati di addestramento standard. Ad esempio, oggetti come gli utensili di una linea di produzione, le confezioni di un prodotto o i componenti di una scheda elettronica possono essere ruotati, posizionati in modo irregolare o avere una forma diversa.

Per detect con precisione questi oggetti personalizzati, soprattutto quando l'orientamento è importante, è importante addestrare modelli come YOLO11 utilizzando le immagini e le etichette dell'utente. Questo processo è noto come addestramento personalizzato.

Ecco un'analisi più approfondita del processo di formazione di YOLO11 per il rilevamento di OBB, passo dopo passo:

Raccolta di immagini: Raccogli immagini che mostrino gli oggetti target da diverse angolazioni, posizioni e ambienti reali.
‍
Annotazione degli oggetti: Etichetta ogni oggetto utilizzando bounding box ruotati (OBB) per catturare sia la loro posizione che il loro orientamento utilizzando strumenti di annotazione con supporto OBB.
‍
Preparazione del set di dati: Organizzare le immagini e le etichette nella struttura di directory di YOLO e creare un file di configurazione YAML con i nomi delle classi e i percorsi dei set di dati.
‍
Formazione del modello: Scegliere una versione del modello YOLO11 adatta alle proprie esigenze ed eseguire il processo di addestramento in modo che il modello possa imparare dalle immagini etichettate.
‍
Valutazione e implementazione: Testare il modello addestrato su nuove immagini, valutarne l'accuratezza e implementarlo in applicazioni pratiche come la produzione, la sorveglianza aerea o l'analisi dei documenti.

Applicazioni rese possibili dal rilevamento OBB

Gli oggetti fuori centro o inclinati sono piuttosto comuni negli scenari reali. Analizziamo alcuni esempi in cui l'OBB detection fa davvero la differenza rilevando accuratamente questi oggetti.

Analisi di immagini a raggi X utilizzando il rilevamento OBB

Il rilevamento OBB può portare l'analisi delle immagini mediche a un livello superiore migliorando la precisione. Le immagini mediche spesso includono strutture anatomiche come tumori, organi o ossa. Queste strutture appaiono spesso in forme irregolari e orientamenti diversi. Poiché gli OBB possono ruotare per adattarsi all'angolazione di un oggetto, forniscono una localizzazione e una misurazione più accurate, il che è fondamentale per la diagnosi e la pianificazione del trattamento.

Questo approccio è particolarmente efficace quando si tratta di analizzare immagini a raggi X di fratture ossee, dove la posizione e l'allineamento delle ossa sono fattori chiave. Ad esempio, il rilevamento OBB è stato utilizzato per analizzare le radiografie del gomito pediatriche. Adattandosi all'orientamento delle ossa, ha contribuito a migliorare l'accuratezza del rilevamento.

‍

Sorveglianza aerea potenziata dal rilevamento OBB

La sorveglianza aerea è uno strumento essenziale in settori come la sicurezza pubblica, il monitoraggio ambientale e la pianificazione urbana. Le immagini catturate da droni o satelliti possono aiutare a identificare oggetti come navi, veicoli ed edifici. Tuttavia, in queste immagini, gli oggetti appaiono spesso piccoli e con angolazioni insolite, il che ne rende più difficile l'detect accurata.

Il rilevamento OBB risolve questo problema inclinando i bounding box per adattarsi all'angolazione di ciascun oggetto. Ciò porta a misurazioni più accurate delle dimensioni e dell'orientamento di un oggetto, supportando un processo decisionale migliore in aree quali la pianificazione urbana, la difesa, la risposta ai disastri e il monitoraggio ambientale.

Un interessante esempio di rilevamento OBB è il tracciamento delle navi nella sorveglianza marittima. Le immagini satellitari spesso catturano le navi a diverse angolazioni e dimensioni a causa del tempo, dell'illuminazione o del movimento. Gli OBB possono adattarsi a questi cambiamenti, migliorando il rilevamento, soprattutto per le navi più piccole o parzialmente oscurate.

‍

Utilizzo del rilevamento OBB in agricoltura

La cernita delle colture dopo il raccolto è una fase cruciale per garantire la qualità prima del confezionamento e dell'invio al mercato. Mentre molti sistemi funzionano bene per i frutti rotondi come mele e arance, le colture lunghe e strette, come le carote o i germogli di Zizania, possono essere molto più difficili da gestire. Le loro forme variano e spesso si trovano ad angoli diversi, il che rende difficile detect e selezionarle con precisione.

Per risolvere questo problema, i ricercatori hanno sviluppato un sistema che utilizza il rilevamento della bounding box orientata (OBB) per identificare e classificare queste colture con maggiore precisione. Il sistema è in grado di detect più colture in un'immagine, anche se inclinate o sovrapposte, e di valutarne la qualità e la posizione in tempo reale.

Pro e contro del rilevamento OBB

Ecco alcuni dei vantaggi dell'utilizzo del rilevamento OBB:

Migliore input per le attività a valle: Le attività di computer vision come la segmentazione delle istanze e il rilevamento degli oggetti possono funzionare meglio se vengono fornite rilevamenti degli oggetti più accurati.
Ragionamento spaziale avanzato: Acquisendo l'angolo di orientamento, gli OBB consentono di comprendere l'allineamento e la direzione di un oggetto.
Sovrapposizione ridotta in scene affollate: Gli OBB riducono l'ambiguità adattando gli oggetti in modo più preciso, anche in scene affollate o ingombre.

Nonostante contribuisca a migliorare l'accuratezza del rilevamento in scene complesse, il rilevamento OBB presenta alcune limitazioni da considerare:

Maggiore sensibilità al rumore: Piccoli errori nella previsione dell'angolo possono avere un impatto maggiore sull'accuratezza del rilevamento, specialmente per oggetti strettamente impacchettati o allungati.
‍
Strumenti specializzati richiesti: Poiché non tutte le piattaforme di etichettatura e addestramento supportano nativamente le OBB, lavorare con esse potrebbe richiedere strumenti o configurazioni aggiuntive.
Disponibilità limitata di dataset: Rispetto alla object detection standard, attualmente ci sono meno dataset disponibili pubblicamente con annotazioni OBB, il che può rendere leggermente più difficile iniziare o confrontare i risultati.

Punti chiave

Il rilevamento di bounding box orientati semplifica il riconoscimento di oggetti non perfettamente diritti o allineati per le soluzioni di computer vision. Acquisendo sia la posizione che l'orientamento degli oggetti, il rilevamento OBB aumenta la precisione in casi d'uso reali come la scansione di immagini mediche, il monitoraggio di terreni agricoli o l'analisi di foto satellitari.

Con modelli come YOLO11 che rendono il rilevamento OBB più accessibile, sta diventando una scelta pratica per molti settori. Se si ha a che fare con oggetti inclinati, sovrapposti o di forma strana, il rilevamento OBB aggiunge un ulteriore livello di precisione che spesso i metodi standard non riescono a raggiungere.

Sei curioso di AI? Esplora il nostro repository GitHub, entra in contatto con la nostra community e dai un'occhiata alle nostre opzioni di licenza per dare il via al tuo progetto di computer vision. Scopri di più sulle innovazioni come l'AI nel retail e la computer vision nella logistica sulle nostre pagine delle soluzioni.

Cos'è il rilevamento di bounding box orientati (OBB)?

Cos'è un bounding box orientato?

Rilevamento OBB vs. rilevamento oggetti

Modelli di OBB detection più diffusi

Formazione personalizzata YOLO11 per il rilevamento dei rettangoli di selezione orientati

Applicazioni rese possibili dal rilevamento OBB

Analisi di immagini a raggi X utilizzando il rilevamento OBB

Sorveglianza aerea potenziata dal rilevamento OBB

Utilizzo del rilevamento OBB in agricoltura

Pro e contro del rilevamento OBB

Punti chiave

Leggi di più in questa categoria

Apprendimento auto-supervisionato per il denoising: un'analisi dettagliata passo dopo passo

Che cos'è la corrispondenza delle immagini nella Vision AI? Una rapida introduzione

Un'introduzione al campo emergente dell'IA neuro-simbolica

Costruiamo insieme il futuro
dell'AI!

Cos'è il rilevamento di bounding box orientati (OBB)?

Cos'è un bounding box orientato?

Rilevamento OBB vs. rilevamento oggetti

Modelli di OBB detection più diffusi

Formazione personalizzata YOLO11 per il rilevamento dei rettangoli di selezione orientati

Applicazioni rese possibili dal rilevamento OBB

Analisi di immagini a raggi X utilizzando il rilevamento OBB

Sorveglianza aerea potenziata dal rilevamento OBB

Utilizzo del rilevamento OBB in agricoltura

Pro e contro del rilevamento OBB

Punti chiave

Leggi di più in questa categoria

Apprendimento auto-supervisionato per il denoising: un'analisi dettagliata passo dopo passo

Che cos'è la corrispondenza delle immagini nella Vision AI? Una rapida introduzione

Un'introduzione al campo emergente dell'IA neuro-simbolica

Costruiamo insieme il futuro dell'AI!

Costruiamo insieme il futuro
dell'AI!