Edge AI
Esplora l'Edge AI e impara come implementare Ultralytics YOLO26 su hardware locale per un'inferenza in tempo reale, una latenza ridotta e una maggiore privacy dei dati nell'edge.
L'Edge AI si riferisce all'implementazione di algoritmi e modelli di intelligenza artificiale (AI) direttamente su dispositivi hardware locali—come smartphone, sensori IoT, droni e veicoli connessi—invece di affidarsi a centri di cloud computing centralizzati. Questo approccio decentralizzato consente di elaborare i dati alla fonte della loro creazione, riducendo significativamente la latenza derivante dall'invio di informazioni avanti e indietro verso server remoti. Eseguendo attività di machine learning (ML) localmente, i dispositivi possono prendere decisioni istantanee, operare in modo affidabile senza connettività internet e migliorare la privacy dei dati mantenendo le informazioni sensibili sul dispositivo stesso.
Link to this sectionCome funziona l'Edge AI#
Il fulcro dell'Edge AI consiste nell'eseguire un motore di inferenza su un sistema embedded. Poiché i dispositivi edge hanno solitamente una durata della batteria e una potenza di calcolo limitate rispetto ai server cloud, i modelli AI devono essere altamente efficienti. Gli sviluppatori impiegano spesso tecniche come la quantizzazione del modello o il pruning del modello per comprimere ampie reti neurali senza sacrificare in modo significativo l'accuratezza.
Spesso si utilizzano acceleratori hardware specializzati per gestire questi carichi di lavoro in modo efficiente. Esempi includono la piattaforma NVIDIA Jetson per la robotica e il Google Coral Edge TPU per l'inferenza a basso consumo. Anche i framework software svolgono un ruolo vitale; strumenti come TensorRT e TFLite ottimizzano i modelli specificamente per questi ambienti vincolati, garantendo una rapida inferenza in tempo reale.
Link to this sectionEdge AI vs. Edge Computing#
Sebbene i termini siano spesso usati in modo intercambiabile, è utile distinguerli:
- Edge Computing: Descrive l'infrastruttura fisica e la topologia di rete più ampie in cui l'elaborazione dei dati avviene vicino alla fonte dei dati. È il "dove" dell'equazione.
- Edge AI: Si riferisce specificamente alle applicazioni intelligenti eseguite su quell'infrastruttura. È il "cosa". Ad esempio, una telecamera di sicurezza agisce come un dispositivo di edge computing, ma quando utilizza la computer vision (CV) per riconoscere una persona specifica, sta eseguendo Edge AI.
Link to this sectionApplicazioni nel mondo reale#
L'Edge AI sta trasformando le industrie abilitando il processo decisionale autonomo in scenari critici:
- Veicoli autonomi: Le auto a guida autonoma generano terabyte di dati quotidianamente. Non possono fare affidamento sul cloud per identificare pedoni o ostacoli a causa della latenza del segnale. Invece, utilizzano l'Edge AI di bordo per l'istantaneo object detection per garantire la sicurezza dei passeggeri.
- Smart Manufacturing: Nell'Industrial IoT (IIoT), i sensori nelle fabbriche utilizzano l'Edge AI per la manutenzione predittiva. Analizzando i dati di vibrazione e temperatura localmente, il sistema può rilevare anomalie e prevedere guasti alle apparecchiature in tempo reale, evitando costosi tempi di inattività.
- Sanità: I dispositivi medici portatili dotati di Vision AI possono analizzare immagini mediche o parametri vitali del paziente direttamente nel punto di cura, fornendo supporto diagnostico immediato in aree remote con scarsa connettività.
Link to this sectionDistribuzione dei modelli sull'edge#
Distribuire un modello all'edge comporta tipicamente l'addestramento di un modello in un ambiente ad alta capacità di calcolo per poi esportarlo in un formato compatibile con i dispositivi edge, come ONNX o OpenVINO. La Ultralytics Platform semplifica questo flusso di lavoro, consentendo agli utenti di addestrare ed esportare automaticamente i modelli per vari target edge.
The following example demonstrates how to export a lightweight YOLO26 model—specifically designed for efficiency—to a format suitable for mobile and edge deployment.
from ultralytics import YOLO
# Load the YOLO26 Nano model, which is optimized for speed on edge devices
model = YOLO("yolo26n.pt")
# Export the model to TFLite format for deployment on Android or Raspberry Pi
# This creates a 'yolo26n.tflite' file ready for edge inference
model.export(format="tflite")Le implementazioni edge avanzate utilizzano spesso tecnologie di containerization come Docker per pacchettizzare le applicazioni, garantendo che vengano eseguite in modo coerente su diverse architetture di dispositivi, dalle unità Raspberry Pi ai gateway industriali.






