Sintonizzati su YOLO Vision 2025!
25 settembre 2025
10:00 — 18:00 BST
Evento ibrido
Yolo Vision 2024
Glossario

Riconoscimento delle immagini

Scopri come il riconoscimento delle immagini consente all'IA di classificare e comprendere le immagini, guidando l'innovazione in ambito sanitario, retail, sicurezza e altro ancora.

Il riconoscimento delle immagini è un ampio campo della computer vision che consente alle macchine di identificare e interpretare oggetti, persone, luoghi e azioni all'interno di immagini o video digitali. È una tecnologia fondamentale che alimenta innumerevoli applicazioni, dallo sblocco del telefono con il viso alla guida di veicoli autonomi in ambienti complessi. Nella sua essenza, il riconoscimento delle immagini utilizza algoritmi di machine learning (ML) e deep learning (DL) per analizzare i pixel ed estrarre schemi significativi, imitando la capacità umana di comprendere le informazioni visive.

Riconoscimento delle immagini e attività correlate

Sebbene spesso usato in modo intercambiabile, il riconoscimento delle immagini è un termine generale che comprende diverse attività più specifiche. È importante distinguerlo dai suoi sottocampi:

  • Classificazione delle immagini: Questa è la forma più semplice di riconoscimento delle immagini. Consiste nell'assegnare una singola etichetta a un'intera immagine da un insieme predefinito di categorie. Ad esempio, un modello potrebbe classificare un'immagine come contenente un "gatto", un "cane" o un'"auto". L'output è un'etichetta per l'intera immagine.
  • Rilevamento di oggetti: Un'attività più avanzata, il rilevamento di oggetti non solo classifica gli oggetti all'interno di un'immagine, ma li localizza anche, in genere disegnando un riquadro di delimitazione attorno a ciascuno. Un'auto a guida autonoma, ad esempio, utilizza il rilevamento di oggetti per identificare e localizzare pedoni, altri veicoli e segnali stradali.
  • Segmentazione delle immagini: Questa attività fa un ulteriore passo avanti identificando i pixel precisi appartenenti a ciascun oggetto in un'immagine. Crea una maschera dettagliata per ogni oggetto, fondamentale per le applicazioni che richiedono una profonda comprensione della forma e dei confini di un oggetto, come nell'analisi delle immagini mediche.

Come funziona il riconoscimento immagini

Il riconoscimento delle immagini moderno è prevalentemente alimentato dalle reti neurali convoluzionali (CNN), un tipo di rete neurale particolarmente efficace nell'elaborazione di dati simili a griglie come le immagini. Il processo in genere prevede:

  1. Raccolta Dati: Viene raccolto un ampio set di dati di immagini etichettate. Esempi famosi includono ImageNet e COCO.
  2. Addestramento del modello: La CNN viene addestrata su questo set di dati. Durante l'addestramento, la rete impara a identificare i pattern—dai semplici bordi e texture alle parti complesse degli oggetti—attraverso un processo chiamato estrazione delle feature. I pesi del modello vengono regolati per ridurre al minimo la differenza tra le sue previsioni e le etichette ground-truth.
  3. Inferenza: Una volta addestrato, il modello può fare previsioni su immagini nuove e mai viste prima. Questo processo di applicazione di un modello addestrato è chiamato inferenza.

Applicazioni nel mondo reale

Il riconoscimento delle immagini è diventato parte integrante di molti settori:

  • Sanità: Nell'IA in ambito sanitario, il riconoscimento delle immagini aiuta i radiologi a rilevare tumori, fratture e altre anomalie in radiografie, risonanze magnetiche e TAC. Ad esempio, i modelli possono essere addestrati su set di dati di immagini mediche per identificare i tumori cerebrali con elevata precisione, assistendo i medici nel formulare diagnosi più rapide.
  • Retail: I rivenditori utilizzano il riconoscimento delle immagini per la gestione dell'inventario facendo monitorare gli scaffali alle telecamere per rilevare quando i prodotti stanno per esaurirsi. Le funzionalità di ricerca visiva sui siti di e-commerce, che consentono ai clienti di caricare una foto per trovare prodotti simili, sono un'altra applicazione popolare. Puoi saperne di più sulla nostra pagina dedicata all'IA nel retail.

Strumenti e formazione

Lo sviluppo di applicazioni di riconoscimento delle immagini spesso implica l'utilizzo di librerie e framework specializzati. Le tecnologie chiave includono:

Unisciti alla community di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora
Link copiato negli appunti