Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Vision AI

5 motivi per cui i modelli di computer vision falliscono in produzione

Scopri perché i modelli di computer vision falliscono in produzione, dalla discrepanza dei dati alla latenza, e come i team possono migliorare le prestazioni dei modelli nei sistemi di vision AI reali.

ABAbirami Vina4 min read
Motivi per cui i modelli di computer vision falliscono in produzione

La computer vision è oggi una tecnologia chiave dell'intelligenza artificiale adottata nella maggior parte dei settori, consentendo alle macchine di interpretare e analizzare dati visivi per una vasta gamma di attività. Questi sistemi supportano molte applicazioni del mondo reale, dall'imaging medicale e la robotica all'automazione industriale e della vendita al dettaglio.

Tuttavia, costruire un sistema di computer vision non è sempre semplice. Di solito comporta lo sviluppo di un vision AI model addestrato a identificare schemi in immagini e video per supportare attività come il rilevamento e il tracciamento di oggetti.

Un esempio di rilevamento e tracciamento di oggetti

Fig 1. Un esempio di rilevamento e tracciamento di oggetti (Source)

Nonostante siano diventati più avanzati nel corso degli anni, i modelli di computer vision possono ancora comportarsi diversamente durante lo sviluppo rispetto a quando vengono distribuiti in ambienti del mondo reale. Questo perché distribuire i modelli al di fuori di ambienti di sviluppo controllati introduce sfide nuove e spesso inaspettate.

Fattori come la mancanza di diversità nei dataset, un monitoraggio scadente dei modelli e vincoli infrastrutturali possono causare comportamenti differenti dello stesso modello nel mondo reale dopo la distribuzione.

In questo articolo, esploreremo cinque motivi comuni per cui i modelli di computer vision potrebbero non funzionare bene in produzione. Cominciamo!

Link to this sectionIl divario tra l'addestramento del modello e la produzione#

L'addestramento del modello avviene solitamente in un ambiente controllato. Durante questa fase, gli sviluppatori AI lavorano con dataset di addestramento preparati con cura.

Queste vaste raccolte di dati visivi includono annotazioni ben strutturate, ovvero etichette che descrivono i contenuti di ogni immagine. L'addestramento avviene anche in condizioni coerenti, rendendo possibile ai modelli di vision AI imparare schemi visivi in modo efficace.

Per assicurarti che questi schemi siano appresi correttamente, i modelli possono essere valutati sistematicamente durante lo sviluppo utilizzando metriche di valutazione standard e dataset di benchmark. Simili ai dataset di addestramento, anche questi dataset di benchmark sono preparati con attenzione.

Tuttavia, i dati incontrati dai sistemi di computer vision nel mondo reale possono essere molto diversi dai dati utilizzati durante l'addestramento e la valutazione. Una volta distribuiti, questi modelli operano raramente in condizioni controllate.

Possono finire per elaborare immagini e video provenienti da ambienti imprevedibili in cui l'illuminazione cambia costantemente, gli angoli della telecamera si spostano e gli sfondi variano nel tempo. Ad esempio, un modello di vision AI addestrato per il rilevamento del traffico potrebbe avere difficoltà a rilevare veicoli di notte se è stato addestrato e valutato principalmente su immagini diurne.

Le immagini notturne rimangono difficili per i modelli addestrati su immagini diurne

Fig 2. Anche dopo il miglioramento, le immagini notturne sono difficili da interpretare per i modelli addestrati su immagini diurne. (Source)

Questa differenza tra lo sviluppo e la distribuzione nel mondo reale è il divario tra addestramento e produzione. A causa di questo divario, molti fallimenti del modello diventano visibili solo dopo la distribuzione, rendendo la consapevolezza precoce essenziale per costruire sistemi di computer vision più affidabili e robusti.

Link to this section5 motivi comuni per cui i modelli di computer vision falliscono in produzione#

Successivamente, esaminiamo più da vicino cinque motivi comuni per cui i modelli di computer vision falliscono in produzione.

Link to this sectionDataset di addestramento di bassa qualità#

I dataset svolgono un ruolo centrale nell'addestramento dei modelli di computer vision perché determinano ciò che il modello apprende durante l'addestramento e come risponde agli input del mondo reale dopo la distribuzione. Questo è particolarmente importante nell'apprendimento supervisionato, dove i modelli imparano da esempi etichettati che mostrano cosa rappresenta ogni immagine.

Molti modelli di deep learning, incluse le reti neurali convoluzionali (CNN), si basano su questi esempi etichettati per riconoscere schemi nei dati visivi. Tuttavia, quando il dataset di addestramento non riflette le condizioni del mondo reale, il modello può imparare schemi che non rappresentano pienamente come appaiono gli oggetti al di fuori dei dati di addestramento.

Ad esempio, un modello addestrato su un dataset di grandi difetti di incrinatura potrebbe non rilevare un raro tipo di piccola incrinatura nei flussi di lavoro di produzione del mondo reale. Allo stesso modo, la qualità dell'annotazione può influenzare il comportamento del modello. Etichette incoerenti o dettagli mancanti nei dati etichettati possono causare l'apprendimento di informazioni errate da parte del modello durante l'addestramento.

Uno sguardo alle annotazioni delle immagini

Fig 3. Uno sguardo alle annotazioni delle immagini (Source)

Nel complesso, la qualità e la diversità dei dati di addestramento sono critiche e possono determinare quanto bene un modello performa nelle applicazioni del mondo reale. Quando i dataset sono rappresentativi e accuratamente etichettati, un modello generalmente performa in modo più affidabile una volta distribuito.

Link to this sectionOverfitting e generalizzazione#

I modelli di machine learning come i modelli di visione imparano schemi dai dataset di addestramento. Ma a volte un modello può fare troppo affidamento su pochi schemi.

Invece di imparare relazioni visive più ampie, può finire per memorizzare i limitati schemi dei dati di addestramento. Questo comportamento è noto come overfitting.

L'overfitting si verifica solitamente quando i dataset di addestramento sono piccoli o mancano di sufficiente diversità di dati. In tali casi, il modello diventa bravo a riconoscere immagini che ha già visto ma ha difficoltà a interpretare nuovi dati o input non familiari.

A causa di ciò, un modello potrebbe performare bene su input di test (poiché sono simili ai dati di addestramento) ma potrebbe comportarsi diversamente in nuove condizioni dopo la distribuzione. Ecco perché il concetto di generalizzazione è vitale. In parole povere, è quanto bene i modelli riescono ad applicare ciò che hanno imparato durante l'addestramento a nuovi scenari.

Per ridurre l'overfitting, gli appassionati di AI spesso addestrano i modelli su dataset più diversificati e applicano l'aumento dei dati, un metodo che modifica leggermente le immagini di addestramento per creare maggiore variazione nei dati. Senza queste considerazioni, le prestazioni del modello possono calare rapidamente una volta che il sistema inizia a operare in ambienti del mondo reale.

Data augmentation che crea variazioni della stessa immagine all'interno di un dataset

Fig 4. L'aumento dei dati può aiutare a creare variazioni della stessa immagine all'interno di un dataset. (Source)

Link to this sectionCasi limite nascosti negli ambienti del mondo reale#

Anche quando i modelli di computer vision generalizzano bene a nuovi dati, gli ambienti del mondo reale possono comunque introdurre casi limite inaspettati. Si tratta di situazioni insolite che differiscono dagli schemi tipici che il modello apprende durante l'addestramento.

Molti di questi scenari sono difficili da catturare durante lo sviluppo perché si verificano raramente, sono difficili da ricreare o possono essere costosi da raccogliere come dati di addestramento. Ad esempio, gli oggetti possono apparire in forme insolite, muoversi in modo imprevedibile o essere parzialmente nascosti dietro altri oggetti.

Cambiamenti nell'illuminazione, negli angoli della telecamera o nelle condizioni di sfondo possono anche creare situazioni che rendono il riconoscimento più impegnativo. Questi casi limite diventano spesso evidenti solo dopo che il sistema è stato distribuito nelle applicazioni del mondo reale.

Nella robotica e nell'automazione industriale, ad esempio, gli articoli potrebbero essere posizionati in modo diverso dal previsto, creando situazioni che il modello non era progettato per gestire. In definitiva, le previsioni che sembravano affidabili durante i test potrebbero diventare meno coerenti una volta che il sistema opera in ambienti del mondo reale.

Link to this sectionMancanza di monitoraggio e debug post-distribuzione#

Oltre a sviluppare un modello di vision AI, è essenziale monitorarne e migliorarne le prestazioni. Tuttavia, una volta che un sistema è in funzione, l'attenzione si sposta spesso semplicemente sul mantenerlo operativo piuttosto che sul tracciare attentamente come performa nel tempo. Di conseguenza, i cambiamenti nel comportamento del modello possono passare inosservati.

Allo stesso tempo, fattori come cambiamenti nei dati in ingresso, configurazioni delle telecamere o ambienti operativi possono influenzare gradualmente l'accuratezza con cui il modello rileva o classifica gli oggetti. Questi cambiamenti non sono sempre ovvi e possono rimanere inosservati durante l'operazione quotidiana.

Monitorare gli output del modello e il comportamento generale del sistema può aiutare i team a identificare questi problemi prima. Controlli regolari, routine di convalida e flussi di lavoro di debug consentono ai team di indagare su risultati insoliti e capire cosa potrebbe causarli.

In aree come la manifattura, un modello potrebbe improvvisamente identificare erroneamente oggetti su una catena di montaggio dopo un cambiamento nella configurazione della telecamera. Tenere traccia di come si comporta un sistema di vision AI distribuito rende più semplice rispondere a questi cambiamenti e mantenere prestazioni stabili negli ambienti del mondo reale.

Link to this sectionVincoli infrastrutturali e latenza#

Molti sistemi di computer vision devono funzionare in tempo reale, il che può esercitare una pressione significativa su hardware, reti e pipeline di elaborazione. Quando le risorse sono limitate, possono verificarsi ritardi di calcolo o latenza di rete, facendo arrivare le previsioni troppo lentamente e influenzando le prestazioni generali del sistema.

In alcuni casi, modelli di deep learning avanzati possono anche creare sfide infrastrutturali. Ad esempio, le architetture basate su Transformer sono progettate per elaborare grandi quantità di dati visivi e imparare relazioni complesse all'interno delle immagini, ma spesso richiedono risorse computazionali sostanziali. L'esecuzione di questi modelli può richiedere hardware più potente o costoso.

Senza un'ottimizzazione adeguata, anche i modelli che funzionano rapidamente durante i test possono rallentare o comportarsi in modo incoerente dopo la distribuzione. Per risolvere questo problema, i team ottimizzano spesso le pipeline, riducono la complessità del modello ove possibile e bilanciano precisione e velocità.

Ciò può comportare la compressione di grandi modelli in versioni più leggere, l'utilizzo di architetture più efficienti o l'elaborazione di immagini a risoluzioni inferiori in modo che il sistema funzioni senza intoppi sull'hardware disponibile. In molti casi, i team scelgono anche modelli leggeri e più veloci come Ultralytics YOLO26 per aiutare a soddisfare i vincoli di distribuzione.

Link to this sectionBest practice per prevenire il fallimento dei modelli di computer vision#

Ecco alcune best practice che possono aiutare a ridurre i fallimenti durante la distribuzione di modelli di computer vision in produzione:

  • Usa strategie di distribuzione graduale: introduci gradualmente i modelli in produzione in modo che i team possano osservare il loro comportamento e apportare modifiche quando necessario.
  • Incorpora cicli di feedback: raccogli nuove immagini e rivedi le previsioni errate per riaddestrare i modelli con dataset aggiornati e migliorare le prestazioni nel tempo.
  • Documenta le limitazioni del modello: registra chiaramente le situazioni in cui il modello potrebbe avere difficoltà in modo che i team possano anticipare potenziali problemi durante la distribuzione.
  • Progetta per la variabilità del mondo reale: pianificare in anticipo le variazioni di illuminazione, angoli della telecamera, posizionamento degli oggetti o condizioni di sfondo può aiutare i modelli a essere stabili in diversi scenari operativi.

Link to this sectionPunti chiave#

I modelli di computer vision falliscono raramente perché gli algoritmi stessi sono deboli. Nella maggior parte dei casi, la vera sfida deriva dagli ambienti in cui operano questi sistemi. I modelli che performano bene durante l'addestramento incontrano spesso condizioni del mondo reale imprevedibili che possono influenzare il loro comportamento.

Ecco perché costruire sistemi di vision AI affidabili richiede molto più che limitarsi ad addestrare un modello. Comporta anche la preparazione accurata dei dataset, il monitoraggio delle prestazioni del modello dopo la distribuzione e l'adattamento continuo dei sistemi alle condizioni del mondo reale.

Vuoi esplorare ulteriormente la vision AI? Unisciti alla nostra community e leggi applicazioni come l'AI nell'automotive e la computer vision nella logistica. Dai un'occhiata alle nostre opzioni di licenza per iniziare con i progetti di computer vision. Visita il nostro repository GitHub per saperne di più.

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning