Guide

Una guida per un approfondimento sul rilevamento oggetti nel 2025

Scopri il rilevamento degli oggetti, la sua importanza nell'AI e come modelli come YOLO11 stiano trasformando settori come le auto a guida autonoma, la sanità e la sicurezza.

ABAbirami Vina

6 min readFebruary 6, 2025

Rilevamento oggetti: localizzare e classificare oggetti con YOLO11

Molti settori stanno integrando rapidamente soluzioni di intelligenza artificiale (AI) nelle loro operazioni. Tra le tante tecnologie AI disponibili oggi, la computer vision è una delle più popolari. La computer vision è una branca dell'AI che aiuta i computer a vedere e comprendere i contenuti di immagini e video, proprio come fanno gli esseri umani. Rende possibile alle macchine riconoscere oggetti, identificare schemi e dare un senso a ciò che stanno guardando.

Si stima che il valore di mercato globale della computer vision crescerà fino a 175,72 miliardi di dollari entro il 2032. La computer vision comprende varie attività che consentono ai sistemi di vision AI di analizzare e interpretare i dati visivi. Una delle attività più diffuse ed essenziali della computer vision è il rilevamento oggetti.

Il rilevamento oggetti si concentra sulla localizzazione e sulla classificazione di oggetti all'interno di dati visivi. Ad esempio, se mostri a un computer l'immagine di una mucca, esso può rilevare l'animale e disegnare una BBox attorno ad esso. Questa capacità è utile in applicazioni reali come il monitoraggio degli animali, le auto a guida autonoma e la sorveglianza.

Quindi, come può essere eseguito il rilevamento oggetti? Un modo è attraverso i modelli di computer vision. Ad esempio, Ultralytics YOLO11 è un modello di computer vision che supporta attività come il rilevamento oggetti.

In questa guida, esploreremo il rilevamento oggetti e il suo funzionamento. Discuteremo anche alcune applicazioni reali del rilevamento oggetti e di Ultralytics YOLO11.

Monitoraggio del rilevamento oggetti YOLO11 del bestiame

Fig 1. Uso del supporto YOLO11 per il rilevamento oggetti nel monitoraggio del bestiame.

Link to this sectionCos'è il rilevamento di oggetti?#

Il rilevamento oggetti è un'attività di computer vision che identifica e localizza oggetti in immagini o video. Risponde a due domande chiave: 'Quali oggetti sono presenti nell'immagine?' e 'Dove sono situati?'

Puoi considerare il rilevamento oggetti come un processo che coinvolge due passaggi fondamentali. Il primo, la classificazione oggetti, consente al sistema di riconoscere ed etichettare gli oggetti, come identificare un gatto, un'auto o una persona in base a schemi appresi. Il secondo, la localizzazione, determina la posizione dell'oggetto disegnando una BBox attorno ad esso, indicando dove appare nell'immagine. Insieme, questi passaggi consentono alle macchine di rilevare e comprendere gli oggetti in una scena.

L'aspetto che rende unico il rilevamento oggetti è la sua capacità di riconoscere gli oggetti e individuarne la posizione con precisione. Altre attività di computer vision si concentrano su obiettivi diversi.

Ad esempio, la classificazione immagini assegna un'etichetta a un'intera immagine. Allo stesso tempo, la segmentazione immagini fornisce una comprensione a livello di pixel di diversi elementi. D'altra parte, il rilevamento oggetti combina il riconoscimento con la localizzazione. Questo lo rende particolarmente utile per compiti come il conteggio di più oggetti in tempo reale.

Confronto di attività di computer vision come classificazione, rilevamento e segmentazione

Fig 2. Confronto tra le attività di computer vision.

Link to this sectionRiconoscimento oggetti vs. rilevamento oggetti#

Mentre esplori i vari termini della computer vision, potresti pensare che riconoscimento oggetti e rilevamento oggetti siano intercambiabili, ma servono a scopi diversi. Un ottimo modo per comprendere la differenza è osservare il rilevamento volti e il riconoscimento facciale.

Il rilevamento volti è un tipo di rilevamento oggetti. Identifica la presenza di un volto in un'immagine e ne segna la posizione usando una BBox. Risponde alla domanda: “Dov'è il volto nell'immagine?”. Questa tecnologia è comunemente usata nelle fotocamere degli smartphone che mettono a fuoco automaticamente i volti o nelle telecamere di sicurezza che rilevano la presenza di una persona.

Il riconoscimento facciale, d'altra parte, è una forma di riconoscimento oggetti. Non si limita a rilevare un volto; identifica di chi si tratta analizzando caratteristiche uniche e confrontandole con un database. Risponde alla domanda: “Chi è questa persona?”. Questa è la tecnologia alla base dello sblocco del telefono con Face ID o dei sistemi di sicurezza aeroportuali che verificano le identità.

In poche parole, il rilevamento oggetti trova e localizza gli oggetti, mentre il riconoscimento oggetti li classifica e li identifica.

Confronto tra rilevamento oggetti e riconoscimento oggetti

Fig 3. Rilevamento oggetti vs riconoscimento oggetti. Immagine dell'autore.

Molti modelli di rilevamento oggetti, come YOLO11, sono progettati per supportare il rilevamento volti ma non il riconoscimento facciale. YOLO11 può identificare in modo efficiente la presenza di un volto in un'immagine e disegnare una BBox attorno ad esso, rendendolo utile per applicazioni come sistemi di sorveglianza, monitoraggio della folla e tag automatici nelle foto. Tuttavia, non può determinare di chi sia il volto. YOLO11 può essere integrato con modelli specificamente addestrati per il riconoscimento facciale, come Facenet o DeepFace, per consentire sia il rilevamento che l'identificazione in un unico sistema.

Link to this sectionComprendere come funziona il rilevamento degli oggetti#

Prima di discutere come funziona il rilevamento oggetti, osserviamo più da vicino come un computer analizza un'immagine. Invece di vedere un'immagine come facciamo noi, un computer la scompone in una griglia di minuscoli quadrati chiamati pixel. Ogni pixel contiene informazioni su colore e luminosità che i computer possono elaborare per interpretare i dati visivi.

Per dare un senso a questi pixel, gli algoritmi li raggruppano in regioni significative in base a forma, colore e vicinanza reciproca. I modelli di rilevamento oggetti, come YOLO11, possono riconoscere schemi o caratteristiche in questi gruppi di pixel.

Ad esempio, un'auto a guida autonoma non vede un pedone come facciamo noi: rileva forme e schemi che corrispondono alle caratteristiche di un pedone. Questi modelli si basano su un ampio addestramento con dataset di immagini etichettati, consentendo loro di apprendere le caratteristiche distintive di oggetti come auto, segnali stradali e persone.

Un tipico modello di rilevamento oggetti ha tre componenti chiave: backbone, neck e head. Il backbone estrae caratteristiche importanti da un'immagine. Il neck elabora e rifinisce queste caratteristiche, mentre l'head è responsabile della previsione delle posizioni degli oggetti e della loro classificazione.

Link to this sectionPerfezionamento dei rilevamenti e presentazione dei risultati#

Una volta effettuati i rilevamenti iniziali, vengono applicate tecniche di post-elaborazione per migliorare l'accuratezza e filtrare le previsioni ridondanti. Ad esempio, le BBox sovrapposte vengono rimosse, assicurando che vengano conservati solo i rilevamenti più rilevanti. Inoltre, a ogni oggetto rilevato vengono assegnati punteggi di confidenza (valori numerici che rappresentano quanto il modello è sicuro che un oggetto rilevato appartenga a una certa classe) per indicare la certezza del modello nelle sue previsioni.

Infine, l'output viene presentato con BBox disegnate attorno agli oggetti rilevati, insieme alle etichette di classe previste e ai punteggi di confidenza. Questi risultati possono quindi essere utilizzati per applicazioni reali.

Link to this sectionModelli di rilevamento oggetti popolari#

Al giorno d'oggi sono disponibili molti modelli di computer vision e alcuni dei più popolari sono i modelli Ultralytics YOLO. Sono noti per velocità, accuratezza e versatilità. Nel corso degli anni, questi modelli sono diventati più veloci, più precisi e capaci di gestire una gamma più ampia di attività. Il rilascio di Ultralytics YOLOv5 ha semplificato il deployment con framework come PyTorch, consentendo a più persone di utilizzare l'AI visiva avanzata senza bisogno di profonde competenze tecniche.

Basandosi su questa base, Ultralytics YOLOv8 ha introdotto nuove funzionalità come la segmentazione di istanze, la stima della posa e la classificazione delle immagini. Ora, YOLO11 sta spingendo ancora oltre con prestazioni migliori su più attività. Con il 22% di parametri in meno rispetto a YOLOv8m, YOLO11m raggiunge una precisione media (mAP) più elevata sul dataset COCO. In parole semplici, YOLO11 può riconoscere gli oggetti con maggiore precisione utilizzando meno risorse, rendendolo più veloce e affidabile.

Che tu sia un esperto di AI o che tu abbia appena iniziato, YOLO11 offre una soluzione potente ma user-friendly per applicazioni di computer vision.

Link to this sectionAddestramento personalizzato di un modello per il rilevamento oggetti#

Addestrare modelli di vision AI comporta aiutare i computer a riconoscere e comprendere immagini e video. Tuttavia, l'addestramento può essere un processo che richiede tempo. Invece di partire da zero, il transfer learning accelera le cose utilizzando modelli pre-addestrati che riconoscono già schemi comuni.

Ad esempio, YOLO11 è già stato addestrato sul dataset COCO, che contiene una serie diversificata di oggetti quotidiani. Questo modello pre-addestrato può essere ulteriormente addestrato in modo personalizzato per rilevare oggetti specifici che potrebbero non essere inclusi nel dataset originale.

Per addestrare in modo personalizzato YOLO11, hai bisogno di un dataset etichettato che contenga immagini degli oggetti che vuoi rilevare. Ad esempio, se vuoi costruire un modello per identificare diversi tipi di frutta in un supermercato, creeresti un dataset con immagini etichettate di mele, banane, arance, ecc. Una volta preparato il dataset, YOLO11 può essere addestrato, regolando parametri come batch size, learning rate ed epoche per ottimizzare le prestazioni.

Con questo approccio, le aziende possono addestrare YOLO11 a rilevare qualsiasi cosa, dai componenti difettosi nella produzione alle specie selvatiche in progetti di conservazione, adattando il modello alle loro esatte esigenze.

Link to this sectionApplicazioni del rilevamento oggetti#

Successivamente, diamo uno sguardo ad alcuni casi d'uso reali del rilevamento oggetti e a come sta trasformando vari settori.

Link to this sectionRilevamento di pericoli per la guida autonoma#

Le auto a guida autonoma utilizzano attività di computer vision come il rilevamento oggetti per navigare in sicurezza ed evitare ostacoli. Questa tecnologia li aiuta a riconoscere pedoni, altri veicoli, buche e pericoli stradali, rendendo possibile una migliore comprensione dell'ambiente circostante. Possono prendere decisioni rapide e muoversi in sicurezza nel traffico analizzando costantemente l'ambiente.

Rilevamento oggetti che identifica buche con YOLO11

Fig 4. Un esempio di utilizzo del rilevamento oggetti per identificare buche con YOLO11.

Link to this sectionAnalisi di immagini mediche nel settore sanitario#

Tecniche di imaging medico come raggi X, risonanze magnetiche, scansioni TC ed ecografie creano immagini altamente dettagliate del corpo umano per aiutare a diagnosticare e trattare le malattie. Queste scansioni producono grandi quantità di dati che i medici, come radiologi e patologi, devono analizzare attentamente per rilevare malattie. Tuttavia, rivedere ogni immagine in dettaglio può richiedere tempo e gli esperti umani possono talvolta perdere dettagli a causa di stanchezza o vincoli temporali.

I modelli di rilevamento oggetti come YOLO11 possono aiutare identificando automaticamente caratteristiche chiave nelle scansioni mediche, come organi, tumori o anomalie, con un'elevata accuratezza. I modelli addestrati su misura possono evidenziare le aree critiche con BBox, aiutando i medici a concentrarsi più rapidamente su potenziali problemi. Ciò riduce il carico di lavoro, migliora l'efficienza e fornisce approfondimenti rapidi.

Analisi di immagini mediche usando YOLO11

Fig 5. Analisi di immagini mediche utilizzando YOLO11.

Link to this sectionAumentare la sicurezza con il rilevamento di persone e anomalie#

Il tracking oggetti è un'attività di computer vision supportata da YOLO11, che abilita il monitoraggio in tempo reale e il miglioramento della sicurezza. Si basa sul rilevamento oggetti identificando gli elementi e tracciando continuamente il loro movimento tra i frame. Questa tecnologia è ampiamente utilizzata nei sistemi di sorveglianza per migliorare la sicurezza in vari ambienti.

Ad esempio, nelle scuole e negli asili, il tracking oggetti può aiutare a monitorare i bambini ed evitare che si allontanino. Nelle applicazioni di sicurezza, svolge un ruolo chiave nel rilevare intrusi in aree riservate, monitorare la folla per sovraffollamento o comportamenti sospetti e inviare avvisi in tempo reale quando viene rilevata un'attività non autorizzata. Tenendo traccia degli oggetti mentre si muovono, i sistemi di tracciamento basati su YOLO11 migliorano la sicurezza, automatizzano il monitoraggio e consentono risposte più rapide a potenziali minacce.

Link to this sectionPro e contro del rilevamento oggetti#

Ecco alcuni dei principali benefici che il rilevamento oggetti può portare a vari settori:

Automazione: Il rilevamento oggetti può aiutare a ridurre la necessità di supervisione umana in attività come il monitoraggio dei filmati CCTV.
Funziona con altri modelli AI: Può essere integrato con sistemi di riconoscimento facciale, riconoscimento delle azioni e tracciamento per migliorare accuratezza e funzionalità.
Elaborazione in tempo reale: Molti modelli di rilevamento oggetti, come YOLO11, sono veloci ed efficienti, rendendoli ideali per applicazioni in tempo reale che richiedono risultati istantanei.

Sebbene questi benefici evidenzino come il rilevamento oggetti influenzi diversi casi d'uso, è anche importante considerare le sfide coinvolte nella sua implementazione. Ecco alcune delle sfide principali:

Privacy dei dati: L'uso di dati visivi, specialmente in aree sensibili come la sorveglianza o l'assistenza sanitaria, può sollevare problemi di privacy e preoccupazioni per la sicurezza.
Occlusione: L'occlusione nel rilevamento oggetti si verifica quando gli oggetti sono parzialmente bloccati o nascosti alla vista, rendendo difficile per il modello rilevarli e classificarli accuratamente.
Costo computazionale: I modelli ad alte prestazioni richiedono spesso potenti GPU per l'elaborazione, rendendo costoso il deployment in tempo reale.

Link to this sectionPunti chiave#

Il rilevamento oggetti è uno strumento rivoluzionario nella computer vision che aiuta le macchine a rilevare e localizzare oggetti in immagini e video. Viene utilizzato in settori che spaziano dalle auto a guida autonoma all'assistenza sanitaria, rendendo le attività più semplici, sicure ed efficienti. Con modelli più recenti come YOLO11, le aziende possono facilmente creare modelli di rilevamento oggetti personalizzati per realizzare applicazioni di computer vision specializzate.

Sebbene esistano alcune sfide, come le preoccupazioni per la privacy e gli oggetti nascosti alla vista, il rilevamento oggetti è una tecnologia affidabile. La sua capacità di automatizzare le attività, elaborare dati visivi in tempo reale e integrarsi con altri strumenti di vision AI lo rende una parte essenziale delle innovazioni all'avanguardia.

Per saperne di più, visita il nostro repository GitHub e interagisci con la nostra community. Esplora le innovazioni in settori come AI nelle auto a guida autonoma e computer vision in agricoltura sulle nostre pagine delle soluzioni. Dai un'occhiata alle nostre opzioni di licenza YOLO e dai vita ai tuoi progetti di vision AI. 🚀

Explore solutions

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Una guida per un approfondimento sul rilevamento oggetti nel 2025

Link to this sectionCos'è il rilevamento di oggetti?#

Link to this sectionRiconoscimento oggetti vs. rilevamento oggetti#

Link to this sectionComprendere come funziona il rilevamento degli oggetti#

Link to this sectionPerfezionamento dei rilevamenti e presentazione dei risultati#

Link to this sectionModelli di rilevamento oggetti popolari#

Link to this sectionAddestramento personalizzato di un modello per il rilevamento oggetti#

Link to this sectionApplicazioni del rilevamento oggetti#

Link to this sectionRilevamento di pericoli per la guida autonoma#

Link to this sectionAnalisi di immagini mediche nel settore sanitario#

Link to this sectionAumentare la sicurezza con il rilevamento di persone e anomalie#

Link to this sectionPro e contro del rilevamento oggetti#

Link to this sectionPunti chiave#

Explore solutions

AI nella Robotica

IA nella logistica

AI nel settore Retail

IA nel settore sanitario

IA nella produzione

AI nel settore automobilistico

AI in Agricoltura

AI nella Robotica

IA nella logistica

AI nel settore Retail

IA nel settore sanitario

IA nella produzione

AI nel settore automobilistico

AI in Agricoltura

AI nella Robotica

IA nella logistica

AI nel settore Retail

IA nel settore sanitario

IA nella produzione

AI nel settore automobilistico

AI in Agricoltura

Costruiamo insieme il futuro dell'AI!