Ultralytics YOLO

Costruire prodotti intelligenti con Ultralytics YOLO26 e la vision AI

Scopri come costruire prodotti intelligenti con YOLO26 e la vision AI consenta rilevamento in tempo reale, automazione intelligente ed esperienze di prodotto scalabili e reattive.

ABAbirami Vina

6 min readMarch 4, 2026

Costruire prodotti intelligenti con Ultralytics YOLO26 e la vision AI

Migliaia di ore di video vengono acquisite ogni giorno da telecamere integrate in dispositivi, macchinari e infrastrutture pubbliche. La maggior parte di queste riprese viene archiviata, visionata superficialmente o esaminata solo quando qualcosa va storto.

Spesso i dati visivi sono disponibili, ma manca la capacità di interpretarli in tempo reale. Poiché i prodotti diventano sempre più connessi e basati sui dati, questa limitazione sta diventando sempre più evidente.

Gli utenti si aspettano che i sistemi facciano molto più che limitarsi a registrare eventi o seguire istruzioni fisse. Ad esempio, si aspettano che i prodotti intelligenti riconoscano ciò che sta accadendo e reagiscano immediatamente, senza dover attendere revisioni manuali o fare affidamento su rigidi set di regole.

I recenti progressi nell'intelligenza artificiale stanno aiutando a colmare questo divario. In particolare, la computer vision consente alle macchine di interpretare immagini e video, permettendo ai sistemi di analizzare le scene e rispondere in tempo reale.

Tuttavia, integrare questa capacità in un prodotto richiede modelli che siano al contempo veloci e affidabili. Modelli di computer vision all'avanguardia come Ultralytics YOLO26 sono realizzati proprio per questo scopo, offrendo la velocità e la precisione necessarie per l'implementazione in tempo reale.

YOLO26 supporta attività di visione fondamentali come object detection, instance segmentation e object tracking, rendendo possibile per i prodotti interpretare i dati visivi e rispondere in modo intelligente.

Rilevamento di oggetti in un'immagine tramite YOLO26

Fig 1. Rilevamento di oggetti in un'immagine tramite YOLO26 (Fonte)

In questo articolo esploreremo come la computer vision e Ultralytics YOLO26 possano essere utilizzati per costruire prodotti più intelligenti e supportare l'automazione intelligente in applicazioni del mondo reale. Cominciamo!

Link to this sectionLe lacune nello sviluppo tradizionale dei prodotti#

Prima di addentrarci in come la computer vision stia aiutando a costruire prodotti più intelligenti, diamo un'occhiata da vicino alle sfide che i team devono affrontare quando si affidano a sistemi tradizionali basati su regole e ad algoritmi più datati.

Ecco alcune delle sfide principali dello sviluppo tradizionale dei prodotti:

Sistemi rigidi basati su regole: La logica hard-coded può funzionare in ambienti controllati, ma le situazioni del mondo reale sono raramente prevedibili. Piccoli cambiamenti nell'illuminazione, nell'angolazione della telecamera o nell'aspetto degli oggetti possono rapidamente far fallire le regole predefinite e ridurre la precisione.
Scarsa adattabilità alla variabilità del mondo reale: I sistemi tradizionali non si adattano bene a scenari nuovi o imprevisti. Gli aggiornamenti spesso richiedono una calibrazione manuale e una ripetuta ottimizzazione, il che rallenta i miglioramenti del prodotto e aumenta l'impegno di manutenzione.
Limiti di scalabilità: Man mano che il volume di dati di immagini e video aumenta, le pipeline di elaborazione delle immagini più vecchie faticano a tenere il passo. L'elaborazione diventa più lenta, rendendo difficile mantenere prestazioni in tempo reale attraverso i flussi video.
Elevata latenza in scenari real-time: Molti approcci tradizionali non riescono a elaborare flussi visivi continui con sufficiente rapidità. Gli output ritardati indeboliscono l'automazione e riducono la reattività complessiva.
Requisiti di calcolo costosi: Raggiungere una precisione accettabile spesso richiede notevoli risorse hardware, comprese unità di elaborazione grafica (GPU) dedicate, il che aumenta i costi dell'infrastruttura.

Link to this sectionIl ruolo della computer vision nella costruzione di prodotti più intelligenti#

Vediamo ora come la computer vision può supportare un comportamento più intelligente del prodotto.

La maggior parte dei prodotti connessi oggi raccoglie già dati visivi come parte dei propri normali processi operativi. Le telecamere sono integrate in vari dispositivi, installate in spazi fisici e collegate tramite sistemi Internet of Things (IoT).

Di conseguenza, immagini e video vengono costantemente acquisiti in background. La sfida non è raccogliere questi dati.

La parte complicata è dare un senso ai dati raccolti in tempo reale. Senza intelligenza visiva, i filmati vengono semplicemente archiviati e revisionati in seguito, spesso dopo che un problema si è già verificato.

La computer vision cambia le cose. Utilizzando reti neurali addestrate a riconoscere pattern, i sistemi possono analizzare immagini e video in tempo reale. Invece di affidarsi a regole fisse o controlli manuali, i prodotti possono interpretare ciò che accade in una scena e rispondere mentre gli eventi si svolgono.

Per integrare questa capacità visiva nei prodotti, i team possono fare affidamento su efficienti modelli di computer vision come Ultralytics YOLO26. YOLO26 supporta attività di visione chiave e può aiutare i prodotti a interpretare le informazioni visive abbastanza velocemente da consentire decisioni in tempo reale.

Link to this sectionI mattoni fondamentali dei prodotti basati sulla visione#

Ecco una rapida analisi di come le attività di computer vision possano contribuire a prodotti più intelligenti:

Object detection: Questa attività può identificare e localizzare oggetti rilevanti all'interno di ogni fotogramma utilizzando un bounding box e assegnare un punteggio di confidenza, fornendo una chiara comprensione di ciò che è presente in un'immagine.
Object tracking: Può essere utilizzato per seguire oggetti specifici attraverso più fotogrammi, permettendo a un sistema di visione di comprendere il movimento e i cambiamenti nel tempo.
Image classification: Questa attività assegna un'etichetta a un'intera immagine in base al suo contenuto principale. Categorizza scene o identifica condizioni specifiche all'interno del fotogramma.
Instance segmentation: Può delineare con precisione gli oggetti a livello di pixel, consentendo ai prodotti di interpretare meglio forme, confini e relazioni spaziali.
Pose estimation: Questa attività rileva i punti chiave sul corpo umano o altri oggetti articolati. Cattura postura, movimento e interazioni fisiche in tempo reale.
Oriented bounding box (OBB) detection: Può rilevare oggetti utilizzando bounding box ruotati invece di quelli orizzontali standard. Migliora la precisione di localizzazione quando gli oggetti appaiono ad angolazioni diverse o in ambienti densamente popolati.

Quando queste capacità vengono applicate a dati visivi continui, i prodotti possono rispondere più velocemente, automatizzare in modo più affidabile e offrire esperienze che risultano consapevoli piuttosto che reattive. Invece di aspettare che gli eventi vengano revisionati in seguito, i sistemi possono comprendere e agire sul momento.

Link to this sectionCome i modelli di visione in tempo reale abilitano un comportamento intelligente del prodotto#

Mentre impari di più sui prodotti basati sulla visione, potresti chiederti come un sistema passi dal semplice registrare video al rispondere effettivamente in tempo reale.

Tutto inizia con il riconoscimento di ciò che si trova davanti alla telecamera. Man mano che il flusso video arriva, un modello di visione analizza ogni fotogramma e identifica gli elementi importanti, come oggetti o persone specifici. Invece di reagire a ogni movimento, il sistema si concentra solo sui segnali rilevanti.

Un altro aspetto chiave è la velocità. I sistemi in tempo reale devono elaborare ogni fotogramma rapidamente e in modo coerente, assicurando che il rilevamento e il processo decisionale avvengano senza ritardi percepibili.

Ad esempio, la famiglia di modelli Ultralytics YOLO (You Only Look Once) è stata creata per elaborare dati visivi in tempo reale. Modelli come Ultralytics YOLO26 si basano su versioni precedenti come Ultralytics YOLOv5, Ultralytics YOLOv8 e Ultralytics YOLO11, incorporando perfezionamenti architetturali, ottimizzazioni delle prestazioni e miglioramenti dell'efficienza. Il risultato è una maggiore velocità e precisione, anche in condizioni reali impegnative.

Quando integrati in un prodotto, questi modelli vengono eseguiti continuamente in background, analizzando ogni fotogramma non appena arriva. Il sistema controlla le condizioni predefinite e, una volta soddisfatte, può attivare istantaneamente un avviso, aggiornare un flusso di lavoro o avviare un'azione.

Questo rende i sistemi basati sulla visione più reattivi, scalabili e pratici per l'integrazione in ambienti che vanno dalla robotica e i veicoli autonomi fino alla smart home e ai sistemi di sicurezza. Per i leader aziendali, ciò si traduce in risposte più rapide, meno controlli manuali e un'automazione che appare affidabile anziché reattiva.

Link to this sectionUtilizzare YOLO26 per potenziare l'intelligenza visiva in tempo reale nei prodotti#

I modelli Ultralytics YOLO, incluso YOLO26, sono disponibili immediatamente come modelli pre-addestrati. Ciò significa che sono già stati addestrati su dataset ampi e ampiamente utilizzati come il dataset COCO.

Grazie a questo pre-addestramento, YOLO26 può riconoscere immediatamente oggetti comuni del mondo reale. Questo fornisce ai team di prodotto un punto di partenza pratico, il che significa che possono costruire funzionalità visive senza dover addestrare un modello da zero.

Per esigenze di prodotto più specifiche, questi modelli pre-addestrati possono essere ulteriormente ottimizzati (fine-tuned) utilizzando dati specifici del dominio con annotazioni di alta qualità.

Ad esempio, considera un ristorante dotato di telecamere a soffitto. Un modello di AI di visione addestrato su misura come YOLO26 può rilevare quante persone sono all'interno dello spazio. Può identificare quali tavoli sono occupati e quali sedie sono vuote.

YOLO26 rileva persone, spazi aperti e casse presidiate in un negozio al dettaglio

Fig 2. YOLO26 abilita il rilevamento in tempo reale di persone, spazi aperti e casse presidiate nei negozi al dettaglio. (Fonte)

In questo tipo di scenario, YOLO26 funge da motore visivo in esecuzione continua in background. I team possono anche distribuire tali modelli su dispositivi edge, a seconda delle esigenze di prestazioni e degli obiettivi di efficienza energetica.

Link to this sectionApplicazioni reali dei modelli YOLO nei prodotti intelligenti#

Ora che abbiamo una comprensione migliore di come funzionano i modelli di visione in tempo reale, diamo un'occhiata a come i modelli Ultralytics YOLO possano essere applicati all'interno di prodotti intelligenti per diversi casi d'uso, per renderli più consapevoli, reattivi e capaci di agire in base a ciò che vedono.

Link to this sectionIntelligenza del prodotto nel settore sanitario con YOLO#

Quando si parla di formazione chirurgica nel settore sanitario, ore di filmati di procedure vengono spesso revisionate manualmente per valutare la gestione degli strumenti e il flusso di lavoro. Questo processo può richiedere molto tempo ed essere fortemente dipendente dall'osservazione umana.

Con un modello di visione basato su YOLO integrato nel sistema, i feed video possono essere analizzati automaticamente mentre le procedure hanno luogo. Il modello può rilevare gli strumenti chirurgici in tempo reale e identificare dove e quando vengono utilizzati.

Ciò consente una registrazione strutturata, analisi migliorate e approfondimenti sulle prestazioni di alta qualità senza una revisione manuale costante. Infatti, una ricerca che utilizza il modello YOLO11, predecessore dell'ultimo modello YOLO26, ha dimostrato che il rilevamento di strumenti laparoscopici in tempo reale potrebbe funzionare efficacemente anche su sistemi embedded.

Rilevamento in tempo reale di strumenti laparoscopici tramite YOLO

Fig 3. Rilevamento in tempo reale di strumenti laparoscopici tramite YOLO (Fonte)

Il modello ha mantenuto un'elevata precisione pur funzionando abbastanza velocemente per contesti chirurgici dal vivo. Questo dimostra come il deep learning possa supportare un feedback visivo affidabile in tempo reale durante le procedure.

Link to this sectionCreare esperienze di vendita al dettaglio intelligenti basate su YOLO#

Siamo stati tutti davanti allo scaffale affollato di un supermercato cercando di trovare il prodotto giusto. Molti articoli si assomigliano, le etichette sono piccole e i prodotti sono spesso messi nel posto sbagliato.

Per i rivenditori, questo rende difficile la visibilità degli scaffali in tempo reale. L'AI di visione e i modelli di object detection YOLO possono aiutare i sistemi del negozio a comprendere cosa c'è effettivamente sullo scaffale tramite feed di telecamere e flussi video dal vivo. Ciò riduce la dipendenza dalle scansioni di codici a barre e dai controlli manuali, rendendo il monitoraggio degli scaffali più accurato e reattivo.

Rilevamento e segmentazione di prodotti sugli scaffali dei supermercati con YOLO26

Fig 4. Rilevamento e segmentazione di prodotti sugli scaffali dei supermercati con YOLO26

Con questo tipo di precisione, i rivenditori non devono più fare affidamento solo su controlli manuali periodici. Gli scaffali possono essere monitorati continuamente tramite video in diretta.

La scarsità di scorte può essere segnalata subito, i prodotti fuori posto possono essere individuati più velocemente e i processi di checkout possono essere più fluidi. Ciò offre ai rivenditori un migliore controllo operativo, creando al contempo un'esperienza di acquisto più fluida per i clienti.

Link to this sectionVision AI e navigazione autonoma#

I sistemi autonomi possono essere altamente efficienti, ma spesso si affidano a percorsi fissi o coordinate preimpostate. Sebbene ciò funzioni in ambienti stabili, le condizioni del mondo reale raramente rimangono invariate.

Le soluzioni di AI di visione, potenziate da modelli di deep learning, consentono alle macchine di comprendere l'ambiente circostante e adattarsi in tempo reale. Grazie alla combinazione di computer vision e algoritmi adattivi, i sistemi possono rispondere ai cambiamenti non appena si verificano, invece di affidarsi a rigide istruzioni preprogrammate.

Quindi, come funziona in contesti reali? Prendiamo l'esempio di un robot che opera in un magazzino. Le telecamere catturano l'ambiente circostante continuamente e un modello di visione esegue il rilevamento di oggetti in tempo reale per identificare ostacoli, scaffali e percorsi.

Questi rilevamenti supportano la localizzazione, aiutando il robot a determinare la sua posizione precisa all'interno della struttura. Sulla base di questo input visivo, gli algoritmi di ottimizzazione regolano istantaneamente il suo percorso, consentendogli di navigare in modo efficiente e mantenere un'automazione fluida anche quando le condizioni cambiano.

Link to this sectionMonitoraggio delle infrastrutture e rilevamento più intelligente dei difetti#

Le linee elettriche e le apparecchiature di rete necessitano di ispezioni regolari per rimanere sicure e affidabili. Il più delle volte, queste ispezioni di utilità comportano ancora controlli manuali, che richiedono tempo e sono difficili da gestire su aree vaste o remote.

L'AI di visione offre un modo più semplice per tenere d'occhio le infrastrutture senza dipendere solo da visite in loco programmate. Modelli come YOLO26 possono rilevare difetti sugli isolatori delle linee elettriche, inclusi crepe, corrosione o danni visibili, direttamente da immagini acquisite in condizioni esterne reali.

Analizzando i dati visivi in tempo reale, tali sistemi possono segnalare potenziali problemi che altrimenti passerebbero inosservati. Identificare precocemente questi problemi riduce il rischio di guasti alle apparecchiature, minimizza interruzioni impreviste e supporta operazioni di manutenzione più proattive.

Link to this sectionMisurare il ROI dei prodotti intelligenti basati sulla visione#

Per i leader aziendali, l'AI di visione non riguarda solo le prestazioni tecniche. Riguarda l'impatto aziendale misurabile.

Se implementati con cura, i sistemi basati sulla visione possono migliorare l'efficienza, ridurre i costi e aumentare la precisione. Questi guadagni contribuiscono anche a migliori esperienze utente e a prestazioni complessive più forti.

Ecco alcune aree in cui tale impatto diventa evidente:

Riduzione dello sforzo manuale: I sistemi di visione automatizzano attività ripetitive di ispezione, monitoraggio e verifica, diminuendo la dipendenza da processi manuali e liberando i team affinché possano concentrarsi su lavori più strategici.
Cicli decisionali più rapidi: L'analisi visiva in tempo reale consente ai sistemi di rilevare problemi o attivare azioni istantaneamente, accorciando i tempi di risposta e mantenendo le operazioni fluide.
Meno errori operativi: Il rilevamento automatizzato porta coerenza. Riducendo la supervisione umana nelle attività di routine, le organizzazioni spesso riscontrano meno errori e risultati più affidabili.
Migliore coinvolgimento dell'utente: I prodotti in grado di vedere e rispondere in modo intelligente risultano più interattivi e pertinenti. Ciò porta a una maggiore fiducia degli utenti, esperienze migliori e un'adozione più elevata a lungo termine.

Link to this sectionPunti chiave#

L'AI di visione consente ai prodotti di interpretare le informazioni visive in tempo reale, supportando un'automazione più intelligente ed esperienze più reattive. Con funzionalità come rilevamento, tracking e segmentazione, i sistemi vanno oltre le regole di base verso decisioni consapevoli del contesto. Modelli efficienti come Ultralytics YOLO26 rendono pratico costruire prodotti scalabili e competitivi basati sulla visione.

Unisciti alla nostra community attiva e scopri innovazioni come l'AI nella produzione e l'AI di visione nel retail. Visita il nostro repository GitHub e inizia oggi stesso con la computer vision consultando le nostre opzioni di licenza.

Explore solutions

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Costruire prodotti intelligenti con Ultralytics YOLO26 e la vision AI

Link to this sectionLe lacune nello sviluppo tradizionale dei prodotti#

Link to this sectionIl ruolo della computer vision nella costruzione di prodotti più intelligenti#

Link to this sectionI mattoni fondamentali dei prodotti basati sulla visione#

Link to this sectionCome i modelli di visione in tempo reale abilitano un comportamento intelligente del prodotto#

Link to this sectionUtilizzare YOLO26 per potenziare l'intelligenza visiva in tempo reale nei prodotti#

Link to this sectionApplicazioni reali dei modelli YOLO nei prodotti intelligenti#

Link to this sectionIntelligenza del prodotto nel settore sanitario con YOLO#

Link to this sectionCreare esperienze di vendita al dettaglio intelligenti basate su YOLO#

Link to this sectionVision AI e navigazione autonoma#

Link to this sectionMonitoraggio delle infrastrutture e rilevamento più intelligente dei difetti#

Link to this sectionMisurare il ROI dei prodotti intelligenti basati sulla visione#

Link to this sectionPunti chiave#

Explore solutions

AI nella Robotica

IA nella logistica

AI nel settore Retail

IA nel settore sanitario

IA nella produzione

AI nel settore automobilistico

AI in Agricoltura

AI nella Robotica

IA nella logistica

AI nel settore Retail

IA nel settore sanitario

IA nella produzione

AI nel settore automobilistico

AI in Agricoltura

AI nella Robotica

IA nella logistica

AI nel settore Retail

IA nel settore sanitario

IA nella produzione

AI nel settore automobilistico

AI in Agricoltura

Costruiamo insieme il futuro dell'AI!