CPU
Esplora il ruolo vitale della CPU nell'AI. Impara a ottimizzare il pre-elaborazione dei dati, la post-elaborazione ed eseguire l'inferenza di Ultralytics YOLO26 su dispositivi edge oggi.
Una Central Processing Unit (CPU) è il componente principale di un computer che funge da suo "cervello", responsabile dell'interpretazione e dell'esecuzione delle istruzioni da hardware e software. Nel contesto dell'intelligenza artificiale (AI), la CPU svolge un ruolo fondamentale nella gestione dei dati, nell'orchestrazione del sistema e nell'esecuzione dell'inferenza, in particolare sui dispositivi edge dove l'efficienza energetica è critica. Sebbene l'hardware specializzato come le GPU sia spesso associato al lavoro pesante dell'addestramento dei modelli di deep learning, la CPU rimane indispensabile per l'intero processo di machine learning (ML).
Link to this sectionIl ruolo delle CPU nei flussi di lavoro AI#
Sebbene le GPU siano celebri per il loro massiccio parallelismo durante l'addestramento, la CPU è il cavallo di battaglia per molte fasi essenziali del ciclo di vita della computer vision (CV). La sua architettura, tipicamente basata su progetti x86 (Intel, AMD) o ARM, è ottimizzata per l'elaborazione sequenziale e il controllo logico complesso.
- Pre-elaborazione dei dati: Prima che una rete neurale possa apprendere, i dati devono essere preparati. Le CPU eccellono in attività come il caricamento dei file, la pulizia dei dati e trasformazioni complesse utilizzando librerie come NumPy e OpenCV.
- Inferenza Edge: Per l'implementazione nel mondo reale, eseguire modelli su server massicci non è sempre fattibile. Le CPU consentono un'efficiente distribuzione del modello su hardware consumer, come l'esecuzione di Ultralytics YOLO26 su un laptop o un Raspberry Pi.
- Post-elaborazione: Dopo che un modello produce probabilità grezze, la CPU gestisce spesso la logica finale, come la Non-Maximum Suppression (NMS) nel rilevamento di oggetti, per filtrare le previsioni duplicate e perfezionare i risultati.
Link to this sectionCPU vs. GPU vs. TPU#
Comprendere il panorama hardware è fondamentale per ottimizzare le operazioni di machine learning (MLOps). Questi processori differiscono significativamente nella loro architettura e nei casi d'uso ideali.
- CPU: Progettata per versatilità e logica complessa. È dotata di pochi core potenti che elaborano le attività in modo sequenziale. È ideale per l'aumento dei dati, la gestione della pipeline e l'inferenza a bassa latenza su piccoli lotti.
- GPU (Graphics Processing Unit): Originariamente per la grafica, le GPU hanno migliaia di core più piccoli progettati per l'elaborazione parallela. Sono lo standard per l'addestramento del modello perché possono eseguire moltiplicazioni di matrici molto più velocemente di una CPU.
- TPU (Tensor Processing Unit): Un circuito specializzato (ASIC) sviluppato da Google Cloud specificamente per la matematica dei tensori. Sebbene altamente efficiente per carichi di lavoro specifici, manca della flessibilità di uso generale di una CPU.
Link to this sectionApplicazioni nel mondo reale#
Le CPU sono spesso l'hardware preferito per le applicazioni in cui il costo, la disponibilità e il consumo energetico superano la necessità di un enorme throughput grezzo.
-
Telecamere di sicurezza intelligenti: Nei sistemi di allarme di sicurezza, le telecamere elaborano spesso i feed video localmente. Un modello di rilevamento oggetti basato su CPU può identificare una persona o un veicolo e attivare un avviso senza inviare video al cloud, preservando la larghezza di banda e la privacy dell'utente.
-
Automazione industriale: Nei reparti di produzione, i sistemi di manutenzione predittiva utilizzano le CPU per monitorare i dati dei sensori dai macchinari. Questi sistemi analizzano vibrazioni o picchi di temperatura in tempo reale per prevedere i guasti, garantendo un'efficiente automazione della produzione senza la necessità di costosi cluster GPU.
Link to this sectionEsecuzione dell'inferenza su CPU con Ultralytics#
Gli sviluppatori spesso testano i modelli su CPU per verificare la compatibilità con ambienti di serverless computing o dispositivi a basso consumo. L'API di Ultralytics ti consente di indirizzare facilmente la CPU, assicurando che la tua applicazione funzioni ovunque.
Il seguente esempio dimostra come caricare un modello leggero ed eseguire l'inferenza specificamente sulla CPU:
from ultralytics import YOLO
# Load the lightweight YOLO26 nano model
# Smaller models are optimized for faster CPU execution
model = YOLO("yolo26n.pt")
# Run inference on an image, explicitly setting the device to 'cpu'
results = model.predict("https://ultralytics.com/images/bus.jpg", device="cpu")
# Print the detection results (bounding boxes)
print(results[0].boxes.xywh)To further improve performance on Intel CPUs, developers can export their models to the OpenVINO format, which optimizes the neural network structure specifically for x86 architecture. For managing datasets and orchestrating these deployments, tools like the Ultralytics Platform simplify the workflow from annotation to edge execution.






