Explore how Convolutional Neural Networks (CNNs) power modern computer vision. Learn about layers, applications, and how to run Ultralytics YOLO26 for real-time AI.
Una rete neurale convoluzionale (CNN) è un'architettura di deep learning specializzata progettata per elaborare dati con una topologia a griglia, in particolare immagini digitali. Ispirate alla struttura biologica della corteccia visiva, le CNN sono in grado di preservare in modo unico le relazioni spaziali all'interno dei dati di input. A differenza delle reti neurali tradizionali che appiattiscono un'immagine in un lungo elenco di numeri, le CNN analizzano piccole regioni sovrapposte di un'immagine per apprendere automaticamente le gerarchie delle caratteristiche, dai semplici bordi e texture alle forme e agli oggetti complessi. Questa capacità le rende la tecnologia fondamentale alla base dei moderni sistemi di visione artificiale (CV).
La potenza di una CNN risiede nella sua capacità di ridurre un'immagine complessa in una forma più facile da elaborare senza perdere caratteristiche fondamentali per ottenere una buona previsione. Ciò si ottiene attraverso una pipeline di livelli distinti che trasformano il volume di input in una classe o un valore di output:
Le CNN hanno trasformato i settori industriali automatizzando le attività visive con una precisione sovrumana .
Sebbene le CNN siano state a lungo lo standard per le attività di visione, è emersa una nuova architettura chiamata Vision Transformer (ViT).
Le librerie moderne rendono semplice l'utilizzo di modelli basati su CNN. Il ultralytics Il pacchetto fornisce l'accesso
a modelli all'avanguardia come YOLO26, che presentano architetture CNN altamente ottimizzate per un'inferenza rapida.
L'esempio seguente mostra come caricare un modello CNN pre-addestrato ed eseguire una previsione:
from ultralytics import YOLO
# Load a YOLO26 model, which uses an advanced CNN architecture
model = YOLO("yolo26n.pt")
# Run inference on an image to identify objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the prediction results
results[0].show()
Lo sviluppo delle CNN è supportato da un solido ecosistema di strumenti open source. Gli ingegneri utilizzano in genere framework come PyTorch o TensorFlow per costruire architetture personalizzate. Queste librerie forniscono le tensor di basso livello necessarie per la convoluzione e la retropropagazione.
Per i team che desiderano semplificare il ciclo di vita dei progetti di visione artificiale, dalla raccolta dei dati alla distribuzione, Ultralytics offre una soluzione completa. Semplifica i flussi di lavoro complessi, consentendo agli sviluppatori di concentrarsi sull'applicazione delle CNN per risolvere i problemi aziendali piuttosto che sulla gestione dell' infrastruttura. Inoltre, i modelli possono essere esportati in formati come ONNX o TensorRT per un'implementazione ad alte prestazioni su dispositivi edge .