Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Guide

Cos'è il rilevamento con Oriented Bounding Box (OBB)?

Esplora come il rilevamento con Oriented Bounding Box (OBB) migliora il rilevamento degli oggetti identificando con precisione gli oggetti ruotati nelle immagini in applicazioni del mondo reale.

NUNuvola Ladi
5 min read
Rilevamento con Oriented Bounding Box (OBB) di oggetti ruotati

Riconoscere gli oggetti, indipendentemente da come sono disposti o verso quale direzione sono rivolti, ci viene naturale come esseri umani. Che si tratti di auto a un incrocio o di barche in un porto, possiamo facilmente capire cosa sono e in quale direzione sono rivolte. Tuttavia, per i sistemi di intelligenza artificiale (AI), non è così semplice.

Ad esempio, la computer vision, un ramo dell'AI focalizzato sulla comprensione di immagini e video, abilita attività come il rilevamento di oggetti, che aiuta le macchine a identificare e localizzare gli oggetti all'interno di una scena. Il rilevamento di oggetti tradizionale si basa su bounding box allineati agli assi per disegnare riquadri attorno agli oggetti. Questi riquadri hanno lati dritti e angoli retti fissi. Questo approccio funziona bene quando gli oggetti sono in posizione verticale e non troppo vicini tra loro.

Ma quando gli oggetti sono inclinati, ruotati o vicini tra loro, il rilevamento di oggetti tradizionale spesso fatica a catturarli accuratamente. Per gestire queste situazioni più complesse, sono state introdotte tecniche come il rilevamento con oriented bounding box (OBB). A differenza dei bounding box standard, gli OBB possono ruotare per adattarsi all'angolo e alla forma dell'oggetto, consentendo una delimitazione più precisa e accurata.

I modelli di computer vision come Ultralytics YOLO11, che supportano il rilevamento OBB, abilitano una serie di applicazioni in tempo reale, specialmente in scenari in cui l'orientamento dell'oggetto è importante, come nella sorveglianza aerea. Oltre a ciò, il rilevamento OBB viene utilizzato anche nel settore sanitario, nell'agricoltura e nell'analisi di documenti.

In questo articolo, esploreremo cos'è il rilevamento OBB, come funziona e dove viene applicato in scenari del mondo reale. Cominciamo!

Utilizzo di YOLO11 per il rilevamento OBB di imbarcazioni

Fig 1. Un esempio demo dell'utilizzo di YOLO11 per il rilevamento OBB di barche.

Link to this sectionCos'è un oriented bounding box?#

Un bounding box orientato è un tipo di riquadro rettangolare utilizzato nella computer vision per rappresentare gli oggetti rilevati in un'immagine. Mentre i bounding box standard sono allineati agli assi orizzontali e verticali dell'immagine, gli OBB possono ruotare per corrispondere all'angolo effettivo dell'oggetto.

Questa capacità di ruotare porta diversi vantaggi. Gli OBB possono allinearsi più strettamente all'orientamento di un oggetto, consentendo al riquadro di adattarsi perfettamente alla forma e alla direzione dell'oggetto. Di conseguenza, il rilevamento diventa più accurato e preciso.

Gli OBB sono particolarmente utili quando gli oggetti non sono perfettamente in verticale, come un'auto che gira su una strada curva in riprese aeree, un libro inclinato su una scrivania o un tumore ruotato in una scansione medica. Facendo corrispondere più accuratamente l'angolo di un oggetto, gli OBB migliorano le prestazioni di rilevamento, riducono l'interferenza dello sfondo e sono particolarmente indicati per applicazioni in cui l'orientamento di un oggetto conta tanto quanto la sua posizione.

Confronto tra object detection e rilevamento OBB

Fig 2. Confronto tra rilevamento di oggetti e rilevamento OBB.

Link to this sectionRilevamento OBB vs. rilevamento di oggetti#

Il rilevamento OBB e il rilevamento di oggetti tradizionale potrebbero sembrare simili a prima vista, ma vengono utilizzati in modi diversi e per situazioni diverse. Diamo un'occhiata più da vicino a come si confrontano con un esempio.

I modelli di computer vision, come YOLO11, possono essere addestrati per rilevare e classificare oggetti in varie applicazioni del mondo reale, come l'ispezione industriale. Considera una catena di montaggio in fabbrica dove diverse parti meccaniche si muovono lungo un nastro trasportatore. Alcune parti potrebbero essere posizionate ordinatamente, ma altre potrebbero essere ruotate leggermente, inclinate o sovrapposte a causa di vibrazioni o velocità.

Il rilevamento di oggetti tradizionale utilizza riquadri rettangolari verticali che si allineano con i bordi orizzontali e verticali dell'immagine. Quindi, quando una parte è ruotata, il riquadro potrebbe non adattarsi correttamente: potrebbe escludere parte dell'oggetto o includere troppo sfondo. Ciò può rendere i rilevamenti meno accurati e più difficili da identificare con sicurezza per il sistema.

Ora, diciamo che stai usando il rilevamento OBB. In questo caso, il modello può disegnare un riquadro che ruota per corrispondere all'angolo esatto di ogni parte. Un ingranaggio inclinato o un componente angolato sarà strettamente racchiuso da un riquadro che si adatta alla sua forma e direzione. Ciò significa maggiore precisione, meno errori e risultati più affidabili, specialmente rispetto a casi d'uso come il controllo qualità automatizzato o lo smistamento robotizzato.

Link to this sectionModelli di rilevamento OBB popolari#

Ora che abbiamo una migliore comprensione di cosa sia il rilevamento OBB, diamo un'occhiata ad alcuni dei modelli di AI per la visione più utilizzati che lo supportano.

Diversi modelli avanzati di computer vision sono stati sviluppati specificamente per rilevare oggetti ruotati o inclinati. Tra questi, i modelli Ultralytics YOLO sono particolarmente noti per le loro capacità di rilevamento OBB affidabili ed efficienti.

Versioni precedenti come Ultralytics YOLOv5 sono state progettate per il rilevamento di oggetti standard. Iterazioni successive, come Ultralytics YOLOv8 e il più recente YOLO11, hanno introdotto il supporto nativo per il rilevamento OBB. YOLO11, in particolare, offre un'accuratezza all'avanguardia senza compromettere la velocità, rendendolo un'opzione di grande impatto per le applicazioni in tempo reale.

I modelli YOLO11 OBB preaddestrati, come YOLO11n-obb, sono addestrati su dataset come DOTAv1, che consiste in immagini aeree annotate con una gamma di classi di oggetti come aerei, navi e campi da tennis che appaiono con varie angolazioni e orientamenti.

Inoltre, questi modelli sono disponibili in cinque dimensioni diverse, da nano (n-obb) a extra-large (x-obb), per soddisfare diverse esigenze di prestazioni. Questa versatilità consente loro di essere applicati in vari settori, dal monitoraggio delle infrastrutture urbane e l'ispezione di macchinari alla lettura di testo inclinato in documenti scansionati.

Link to this sectionAddestramento personalizzato di YOLO11 per il rilevamento con oriented bounding box#

In molte situazioni del mondo reale, gli oggetti che devi rilevare possono essere completamente diversi da quelli presenti nei dataset di addestramento standard. Ad esempio, oggetti come strumenti su una linea di produzione, confezioni di prodotti o componenti su un circuito stampato potrebbero essere ruotati, posizionati in modo irregolare o avere forme diverse.

Per rilevare accuratamente questi oggetti personalizzati, specialmente quando l'orientamento è importante, è importante addestrare modelli come YOLO11 utilizzando le tue immagini e le tue etichette. Questo processo è noto come addestramento personalizzato.

Ecco uno sguardo più da vicino al processo passo dopo passo per addestrare YOLO11 al rilevamento OBB:

  • Raccolta di immagini: Raccogli immagini che mostrano i tuoi oggetti target da diverse angolazioni, posizioni e ambienti del mondo reale.
  • Annotazione degli oggetti: Etichetta ogni oggetto utilizzando bounding box ruotati (OBB) per catturare sia la loro posizione che l'orientamento usando strumenti di annotazione con supporto OBB.
  • Preparazione del dataset: Organizza le tue immagini ed etichette nella struttura di directory di YOLO e crea un file di configurazione YAML con i nomi delle tue classi e i percorsi del dataset.
  • Addestramento del modello: Scegli una versione del modello YOLO11 che si adatta alle tue esigenze e avvia il processo di addestramento in modo che il modello possa imparare dalle tue immagini etichettate.
  • Valutazione e distribuzione: Testa il tuo modello addestrato su nuove immagini, valuta la sua accuratezza e distribuiscilo in applicazioni pratiche come la produzione, la sorveglianza aerea o l'analisi di documenti.

Link to this sectionApplicazioni abilitate dal rilevamento OBB#

Gli oggetti che sono fuori centro o inclinati sono abbastanza comuni negli scenari di vita reale. Esaminiamo alcuni esempi in cui il rilevamento OBB fa davvero la differenza rilevando accuratamente questi oggetti.

Link to this sectionAnalisi di immagini a raggi X tramite rilevamento OBB#

Il rilevamento OBB può portare l' analisi di immagini mediche a un livello superiore migliorando la precisione. Le immagini mediche includono spesso strutture anatomiche come tumori, organi o ossa. Queste strutture appaiono spesso con forme irregolari e orientamenti vari. Poiché gli OBB possono ruotare per corrispondere all'angolo di un oggetto, forniscono una localizzazione e una misurazione più accurate, fondamentali per la diagnosi e la pianificazione del trattamento.

Questo approccio è particolarmente efficace quando si tratta di analizzare immagini a raggi X di fratture ossee, dove la posizione e l'allineamento delle ossa sono fattori chiave. Ad esempio, il rilevamento OBB è stato utilizzato per analizzare raggi X al gomito pediatrico. Adattandosi all'orientamento delle ossa, ha aiutato a migliorare l'accuratezza del rilevamento.

Radiografie con object detection e rilevamento oriented bounding box

Fig 3. Raggi X (a, d) con rilevamento di oggetti (b, e) e rilevamento con oriented bounding box (c, f).

Link to this sectionSorveglianza aerea potenziata dal rilevamento OBB#

La sorveglianza aerea è uno strumento essenziale in settori come la sicurezza pubblica, il monitoraggio ambientale e la pianificazione urbana. Le immagini catturate da droni o satelliti possono aiutare a identificare oggetti come navi, veicoli ed edifici. Tuttavia, in queste immagini, gli oggetti appaiono spesso piccoli e con angolazioni insolite, rendendoli più difficili da rilevare accuratamente.

Il rilevamento OBB risolve questo problema inclinando i bounding box per adattarsi all'angolo di ogni oggetto. Ciò porta a misurazioni più accurate delle dimensioni e dell'orientamento di un oggetto, supportando un migliore processo decisionale in aree come la pianificazione urbana, la difesa, la risposta alle catastrofi e il monitoraggio ambientale.

Un esempio interessante di rilevamento OBB è il tracciamento delle navi nella sorveglianza marittima. Le immagini satellitari spesso catturano navi con angolazioni e dimensioni variabili a causa del meteo, dell'illuminazione o del movimento. Gli OBB possono adattarsi a questi cambiamenti, migliorando il rilevamento, specialmente per le imbarcazioni più piccole o parzialmente oscurate.

Utilizzo del rilevamento OBB per la sorveglianza marittima

Fig 4. Uno sguardo all'uso del rilevamento OBB per la sorveglianza marittima.

Link to this sectionUtilizzo del rilevamento OBB in agricoltura#

Lo smistamento dei raccolti dopo la raccolta è un passaggio cruciale per garantire la qualità prima che vengano confezionati e inviati al mercato. Mentre molti sistemi funzionano bene per frutti rotondi come mele e arance, i raccolti lunghi e stretti, come le carote o i germogli di Zizania, possono essere molto più difficili da gestire. Le loro forme variano e spesso finiscono con angolazioni diverse, rendendoli difficili da rilevare e smistare accuratamente.

Per affrontare questo problema, i ricercatori hanno sviluppato un sistema che utilizza il rilevamento con oriented bounding box (OBB) per identificare e classificare questi raccolti in modo più accurato. Il sistema può rilevare più raccolti in un'unica immagine, anche se sono inclinati o sovrapposti, e valutare la loro qualità e posizione in tempo reale.

Link to this sectionPro e contro del rilevamento OBB#

Ecco alcuni dei vantaggi dell'utilizzo del rilevamento OBB:

  • Migliore input per le attività a valle: Le attività di computer vision come la segmentazione di istanze e il tracciamento di oggetti possono funzionare meglio se fornite con rilevamenti di oggetti più accurati.
  • Ragionamento spaziale migliorato: Catturando l'angolo di orientamento, gli OBB rendono possibile comprendere l'allineamento e la direzione di un oggetto.
  • Riduzione della sovrapposizione in scene affollate: Gli OBB riducono l'ambiguità adattandosi più strettamente agli oggetti, anche in scene occupate o disordinate.

Nonostante aiuti a migliorare l'accuratezza del rilevamento in scene complesse, il rilevamento OBB presenta alcune limitazioni da considerare:

  • Maggiore sensibilità al rumore: Piccoli errori nella previsione dell'angolo possono avere un impatto maggiore sull'accuratezza del rilevamento, specialmente per oggetti densamente imballati o allungati.
  • Strumenti specializzati richiesti: Poiché non tutte le piattaforme di etichettatura e addestramento supportano nativamente gli OBB, lavorare con essi potrebbe richiedere strumenti o configurazioni aggiuntivi.
  • Disponibilità limitata del dataset: Rispetto al rilevamento di oggetti standard, ci sono attualmente meno dataset disponibili pubblicamente con annotazioni OBB, il che può rendere leggermente più difficile iniziare o confrontare i risultati.

Link to this sectionPunti chiave#

Il rilevamento con oriented bounding box rende più facile per le soluzioni di computer vision riconoscere oggetti che non sono perfettamente dritti o allineati. Catturando sia la posizione che l'orientamento degli oggetti, il rilevamento OBB aumenta l'accuratezza in casi d'uso del mondo reale come la scansione di immagini mediche, il monitoraggio di terreni agricoli o l'analisi di foto satellitari.

Con modelli come YOLO11 che rendono il rilevamento OBB più accessibile, sta diventando una scelta pratica per molte industrie. Che tu abbia a che fare con oggetti inclinati, sovrapposti o dalla forma strana, il rilevamento OBB aggiunge un ulteriore livello di precisione che i metodi standard spesso mancano.

Curioso riguardo all'AI? Esplora il nostro GitHub repository, connettiti con la nostra community e dai un'occhiata alle nostre opzioni di licenza per dare il via al tuo progetto di computer vision. Scopri di più su innovazioni come l'AI nel retail e la computer vision nella logistica sulle nostre pagine delle soluzioni.

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning