Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Torna al glossario Ultralytics

Inference Engine

Scopri come un inference engine ottimizza modelli di machine learning come Ultralytics YOLO26 per il deployment in tempo reale. Esplora suggerimenti sulle prestazioni per l'Edge AI oggi stesso.

Un motore di inferenza è un componente software specializzato progettato per eseguire modelli di machine learning addestrati e generare previsioni da nuovi dati. A differenza della fase di addestramento, che si concentra sull'apprendimento di pattern attraverso processi computazionalmente intensivi come la backpropagation, un motore di inferenza è rigorosamente ottimizzato per la fase operativa nota come distribuzione del modello. Il suo obiettivo principale è eseguire i calcoli nel modo più efficiente possibile, riducendo al minimo la latenza di inferenza e massimizzando il throughput sull'hardware target, che si tratti di un server cloud scalabile o di un dispositivo Edge AI alimentato a batteria. Eliminando il sovraccarico necessario per l'addestramento, questi motori consentono a complesse reti neurali di funzionare in applicazioni in tempo reale.

Link to this sectionCome i motori di inferenza ottimizzano le prestazioni#

La transizione da un ambiente di addestramento a un motore di inferenza comporta in genere diversi passaggi di ottimizzazione per semplificare la struttura del modello. Poiché il modello non ha più bisogno di apprendere, il motore può scartare i dati necessari per gli aggiornamenti del gradiente, bloccando di fatto i pesi del modello. Le tecniche comuni utilizzate dai motori di inferenza includono la fusione dei layer, in cui più operazioni vengono combinate in un unico passaggio per ridurre l'accesso alla memoria, e la quantizzazione del modello, che converte i pesi da formati a virgola mobile ad alta precisione a interi a precisione inferiore (ad esempio, INT8).

Queste ottimizzazioni consentono ad architetture avanzate come Ultralytics YOLO26 di funzionare a velocità incredibilmente elevate senza una significativa perdita di accuratezza. Diversi motori sono spesso adattati a specifici ecosistemi hardware per sbloccare le massime prestazioni:

  • NVIDIA TensorRT: Offre inferenza ad alte prestazioni su GPU NVIDIA utilizzando kernel specifici per l'hardware e ottimizzando il grafo di rete.
  • Intel OpenVINO: Ottimizza le prestazioni di deep learning su architetture Intel, inclusi CPU e grafica integrata, rendendolo ideale per l'edge computing.
  • ONNX Runtime: Un acceleratore multipiattaforma che supporta modelli nel formato ONNX, fornendo un ponte tra diversi framework e backend hardware.

Link to this sectionApplicazioni nel mondo reale#

I motori di inferenza sono i driver silenziosi dietro molte moderne comodità dell'IA, consentendo ai sistemi di computer vision di reagire istantaneamente al proprio ambiente.

  1. Veicoli autonomi: Nelle auto a guida autonoma, i modelli di object detection devono identificare pedoni, segnali stradali e altri veicoli in pochi millisecondi. Un motore di inferenza che gira localmente sull'hardware dell'auto garantisce che questa elaborazione avvenga con velocità di inferenza in tempo reale, poiché fare affidamento su una connessione cloud introdurrebbe ritardi pericolosi.

  2. Smart Manufacturing: Le fabbriche utilizzano telecamere industrial IoT per ispezionare i prodotti sulle linee di assemblaggio. Un motore di inferenza elabora i feed video per eseguire anomaly detection, segnalando istantaneamente i difetti. Questa automazione riduce gli sprechi e garantisce un rigoroso controllo di qualità senza rallentare la produzione.

Link to this sectionMotore di inferenza vs. Framework di addestramento#

È utile distinguere tra il software utilizzato per creare il modello e il motore utilizzato per eseguirlo. Un Training Framework (come PyTorch o TensorFlow) fornisce gli strumenti per progettare architetture, calcolare la perdita e aggiornare i parametri tramite apprendimento supervisionato. Dà priorità alla flessibilità e alle funzionalità di debug.

Al contrario, il Motore di inferenza prende l'artefatto finito dal framework di addestramento e dà la priorità alla velocità di esecuzione e all'efficienza della memoria. Sebbene tu possa eseguire l'inferenza all'interno di un framework di addestramento, raramente è efficiente come l'utilizzo di un motore dedicato, specialmente per la distribuzione su telefoni cellulari o dispositivi embedded tramite strumenti come TensorFlow Lite o Apple Core ML.

Link to this sectionUtilizzo di un motore di inferenza con YOLO26#

Il pacchetto ultralytics astrae gran parte della complessità dei motori di inferenza, consentendo agli utenti di eseguire previsioni senza problemi. Sotto il cofano, gestisce la pre-elaborazione delle immagini e l'esecuzione del modello. Per gli utenti che desiderano scalare, la piattaforma Ultralytics semplifica il processo di addestramento ed esportazione dei modelli in formati ottimizzati compatibili con vari motori di inferenza.

Il seguente esempio mostra come caricare un modello YOLO26 pre-addestrato ed eseguire l'inferenza su un'immagine:

from ultralytics import YOLO

# Load the YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")

# Run inference on an image from a URL
# The 'predict' method acts as the interface to the inference process
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning