Image Classification
Esplora i fondamenti della classificazione delle immagini, dalle CNN agli usi reali dell'IA. Impara ad addestrare e distribuire classificatori all'avanguardia con Ultralytics YOLO26.
La classificazione di immagini è un'attività fondamentale nella computer vision (CV) in cui un modello di machine learning analizza un'intera immagine e le assegna una singola etichetta da un insieme predefinito di categorie. In sostanza, risponde alla domanda: "Qual è il soggetto principale di questa immagine?" Come componente centrale dell'intelligenza artificiale (AI), questo processo consente ai sistemi automatizzati di organizzare, categorizzare e interpretare dati visivi su larga scala. Anche se può sembrare semplice all'occhio umano, consentire ai computer di riconoscere schemi richiede sofisticati algoritmi di machine learning (ML) per colmare il divario tra pixel grezzi e concetti significativi.
Link to this sectionIl meccanismo alla base della classificazione#
La moderna classificazione di immagini si basa pesantemente su architetture di deep learning (DL) note come Convolutional Neural Networks (CNNs). Queste reti sono progettate per imitare il modo in cui la corteccia visiva biologica elabora le informazioni. Attraverso un processo chiamato feature extraction, il modello impara a identificare attributi di basso livello come bordi e texture negli strati iniziali, combinandoli infine per riconoscere forme e oggetti complessi negli strati più profondi.
Per costruire un classificatore, gli sviluppatori utilizzano l'apprendimento supervisionato, fornendo al modello enormi quantità di dati di addestramento contenenti esempi etichettati. Grandi dataset pubblici come ImageNet sono stati fondamentali per far progredire l'accuratezza di questi sistemi. Durante la fase di inferenza, il modello emette un punteggio di probabilità per ogni categoria, utilizzando spesso una funzione softmax per determinare la classe più probabile.
Link to this sectionClassificazione vs. altre attività di visione#
È importante distinguere la classificazione di immagini dalle relative funzionalità di computer vision, poiché la scelta della tecnica dipende dallo specifico problema:
- Classificazione vs. Object Detection: La classificazione assegna un'etichetta all'intera immagine. Al contrario, l'object detection identifica la posizione di oggetti multipli all'interno di una scena disegnando un bounding box attorno a ciascuno di essi.
- Classificazione vs. Image Segmentation: Mentre la classificazione guarda al contesto globale, la segmentazione fornisce precisione a livello di pixel. La segmentazione semantica classifica ogni singolo pixel, consentendo una delimitazione esatta dei confini tra gli oggetti e lo sfondo.
Link to this sectionApplicazioni nel mondo reale#
La classificazione di immagini alimenta un'ampia gamma di applicazioni AI nel mondo reale in diversi settori:
Link to this sectionDiagnostica sanitaria#
In campo medico, i modelli di classificazione assistono i radiologi analizzando gli esami diagnostici. Gli strumenti di analisi di immagini mediche possono categorizzare rapidamente radiografie o risonanze magnetiche come "normali" o "anormali", o identificare condizioni specifiche come il rilevamento di tumori, consentendo un triage e una diagnosi del paziente più rapidi.
Link to this sectionControllo qualità nella produzione#
Le fabbriche utilizzano l'ispezione visiva automatizzata per mantenere gli standard di prodotto. Le telecamere sulle linee di assemblaggio acquisiscono immagini dei componenti e i modelli di classificazione li etichettano istantaneamente come "pass" o "fail" in base ai difetti visibili. Questo controllo qualità automatizzato garantisce che solo gli articoli non difettosi raggiungano la fase di confezionamento.
Link to this sectionAgricoltura intelligente#
Gli agricoltori sfruttano l'AI in agricoltura per monitorare la salute delle colture. Classificando le immagini scattate da droni o smartphone, i sistemi possono identificare segni di malattie, carenze nutrizionali o infestazioni da parassiti, consentendo interventi mirati di agricoltura di precisione.
Link to this sectionImplementazione della classificazione con YOLO26#
Il framework Ultralytics YOLO26, sebbene famoso per il rilevamento, offre prestazioni all'avanguardia per attività di classificazione di immagini. La sua architettura è ottimizzata per velocità e precisione, rendendolo adatto ad applicazioni in tempo reale.
Ecco un esempio conciso di come caricare un modello pre-addestrato e classificare un'immagine utilizzando il pacchetto Python ultralytics:
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Run inference on an image source
results = model("https://ultralytics.com/images/bus.jpg")
# Print the top predicted class name
print(f"Prediction: {results[0].names[results[0].probs.top1]}")Per i team che cercano di ottimizzare il proprio flusso di lavoro, la Ultralytics Platform semplifica l'intera pipeline. Consente agli utenti di gestire dataset di classificazione, eseguire addestramenti basati su cloud e distribuire modelli in vari formati come ONNX o TensorRT senza una complessa infrastruttura di programmazione.






