Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Torna al glossario Ultralytics

Convolution

Esplora i fondamenti della convoluzione nella Computer Vision e nel deep learning. Impara come i kernel e le feature map alimentano Ultralytics YOLO26 per attività in tempo reale.

La convoluzione è un'operazione matematica fondamentale che funge da blocco costitutivo centrale dei moderni sistemi di computer vision (CV) e deep learning (DL). Nel contesto dell'elaborazione delle immagini, la convoluzione comporta lo scorrimento di un piccolo filtro, spesso chiamato kernel, su un'immagine di input per creare una mappa di caratteristiche significative. Questo processo consente ai modelli di intelligenza artificiale (AI) di apprendere e identificare automaticamente pattern come bordi, texture e forme senza intervento umano. A differenza del machine learning (ML) tradizionale, che spesso richiede l'estrazione di feature manuale, la convoluzione consente alle reti di costruire una comprensione gerarchica dei dati visivi, partendo da semplici linee per progredire verso oggetti complessi come volti o veicoli.

Link to this sectionCome funziona la convoluzione#

L'operazione funziona facendo passare un filtro sui dati di input, eseguendo una moltiplicazione elemento per elemento e sommando i risultati per produrre un singolo valore per ogni posizione. Questo output è noto come feature map.

  • Il Kernel: Questa è una piccola matrice di numeri (pesi) che rileva caratteristiche specifiche. Ad esempio, un operatore di Sobel è un tipo specifico di kernel utilizzato per rilevare bordi verticali o orizzontali.
  • Finestra scorrevole (Sliding Window): Il kernel si muove attraverso l'immagine utilizzando una dimensione del passo definita chiamata "stride". Questo processo di filtraggio spaziale preserva la relazione tra i pixel, che è cruciale per comprendere le immagini.
  • Gerarchia dei layer: Nelle architetture profonde come le Convolutional Neural Networks (CNNs), i layer iniziali catturano dettagli di basso livello, mentre i layer più profondi li combinano in concetti di alto livello.

Link to this sectionConvoluzione vs. Concetti correlati#

Per comprendere appieno la convoluzione, è utile distinguerla da termini simili spesso incontrati nella letteratura sulle reti neurali (NN):

  • Cross-correlation vs. Convoluzione: Matematicamente, la vera convoluzione comporta il capovolgimento del kernel prima di applicarlo. Tuttavia, la maggior parte dei framework di deep learning, inclusa la libreria PyTorch, implementa la cross-correlation (scorrimento senza capovolgimento) ma la etichetta come "convoluzione" perché i pesi vengono appresi durante l'addestramento, rendendo la distinzione sul capovolgimento irrilevante per le prestazioni.
  • Convoluzione vs. Attenzione: Mentre la convoluzione elabora le informazioni localmente (pixel vicini), il meccanismo di attenzione consente a un modello di mettere in relazione parti distanti di un'immagine simultaneamente. Le architetture moderne come YOLO26 utilizzano spesso layer convoluzionali altamente ottimizzati per mantenere velocità di inferenza in tempo reale, poiché i layer di attenzione possono essere computazionalmente più pesanti.

Link to this sectionApplicazioni nel mondo reale#

L'efficienza della convoluzione ha permesso all'AI di rivoluzionare vari settori alimentando robusti sistemi di percezione:

  1. Diagnostica medica: Nel campo dell'AI in Healthcare, la convoluzione aiuta ad analizzare scansioni MRI ad alta risoluzione. Utilizzando kernel specifici progettati per evidenziare anomalie, i modelli possono rilevare segni precoci di tumori o fratture con un'accuratezza che rivaleggia con quella degli esperti umani.

  2. Navigazione autonoma: I veicoli a guida autonoma si affidano alla convoluzione per il rilevamento oggetti in tempo reale. Mentre l'auto si muove, i layer convoluzionali elaborano i feed video per identificare istantaneamente pedoni, segnali di corsia e segnali stradali, un componente critico per la sicurezza nell'AI in Automotive.

Link to this sectionEsempio Python con Ultralytics#

Puoi ispezionare i layer convoluzionali all'interno dei modelli all'avanguardia utilizzando Python. Il seguente esempio carica il modello YOLO26 e verifica che il suo layer iniziale utilizzi una normale operazione convoluzionale, implementata tramite torch.nn.

import torch.nn as nn
from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Access the first layer of the model's backbone
first_layer = model.model.model[0]

# Verify it is a Convolutional layer
if isinstance(first_layer.conv, nn.Conv2d):
    print("Success: The first layer is a standard convolution.")
    print(f"Kernel size: {first_layer.conv.kernel_size}")

Link to this sectionPerché la convoluzione è importante per l'Edge AI#

Le operazioni convoluzionali sono altamente ottimizzabili, rendendole ideali per implementazioni di Edge AI dove le risorse computazionali sono limitate. Poiché lo stesso kernel è condiviso sull'intera immagine (condivisione dei parametri), il modello richiede molta meno memoria rispetto alle vecchie architetture completamente connesse. Questa efficienza consente a modelli avanzati di girare su smartphone e dispositivi IoT.

Per i team che cercano di sfruttare queste operazioni per dataset personalizzati, la Ultralytics Platform fornisce un ambiente fluido per annotare immagini e addestrare modelli basati sulla convoluzione senza gestire infrastrutture complesse. Utilizzando il transfer learning, puoi ottimizzare i pesi convoluzionali pre-addestrati per riconoscere nuovi oggetti con minimi dati di addestramento.

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning