Sintonizzati su YOLO Vision 2025!
25 settembre 2025
10:00 — 18:00 BST
Evento ibrido
Yolo Vision 2024
Glossario

Computer Visione (CV)

Sblocca il potenziale dell'IA con la Computer Visione! Esplora il suo ruolo nel rilevamento di oggetti, nella sanità, nelle auto a guida autonoma e altro ancora. Scopri di più ora!

La visione artificiale (CV) è un campo dell'intelligenza artificiale (AI) che addestra i computer a interpretare e comprendere il mondo visivo. Utilizzando immagini digitali da telecamere, video e modelli di deep learning, le macchine possono identificare e classificare accuratamente gli oggetti e quindi reagire a ciò che "vedono". L'obiettivo è consentire ai computer di replicare la visione umana, un compito che implica l'elaborazione e l'analisi di vaste quantità di dati visivi per dare loro un senso. In quanto campo, è cresciuto rapidamente grazie ai progressi nel deep learning e alla disponibilità di grandi set di dati.

Come funziona la Computer Vision

La computer vision funziona applicando algoritmi di machine learning (ML) ai dati visivi. Invece di essere esplicitamente programmato per riconoscere un oggetto, un modello CV impara a identificare i pattern da migliaia o milioni di immagini etichettate. Ad esempio, per addestrare un modello a riconoscere i gatti, verrebbero fornite innumerevoli immagini di gatti finché non impara a distinguere autonomamente le caratteristiche di un gatto.

La CV moderna si basa fortemente sui modelli di deep learning, in particolare sulle reti neurali convoluzionali (CNN). Una CNN è un tipo di rete neurale che è altamente efficace nell'elaborazione dei dati delle immagini. Funziona applicando filtri (o kernel) a un'immagine per creare feature map che evidenziano caratteristiche importanti come bordi, texture e forme. Queste reti alimentano molti task di computer vision comuni, consentendo alle macchine di analizzare le informazioni visive con crescente precisione.

Computer Vision vs. Elaborazione delle immagini

Sebbene strettamente correlate, la computer vision e l'image processing non sono la stessa cosa. L'Image processing è un sottoinsieme della CV che si concentra sulla manipolazione di immagini digitali per migliorarle o estrarre informazioni utili. Coinvolge operazioni come l'affinamento, la sfocatura o il filtraggio di un'immagine. Al contrario, la computer vision fa un passo avanti mirando a interpretare e comprendere il contenuto dell'immagine. Ad esempio, l'image processing potrebbe essere utilizzato per migliorare la qualità di una foto, mentre la computer vision verrebbe utilizzata per identificare le persone, gli oggetti e la scena all'interno di quella foto. Puoi saperne di più sulla distinzione in questa panoramica dettagliata dell'elaborazione digitale delle immagini.

Attività chiave nella Computer Vision

La visione artificiale comprende diverse attività chiave che consentono alle macchine di analizzare e interpretare i dati visivi:

  • Rilevamento di oggetti: Ciò implica l'identificazione e la localizzazione di oggetti all'interno di un'immagine o di un video. Un modello come Ultralytics YOLO disegna un riquadro di delimitazione attorno a ciascun oggetto rilevato e gli assegna un'etichetta di classe.
  • Classificazione delle immagini: Questa attività prevede l'assegnazione di una singola etichetta a un'intera immagine da un insieme predefinito di categorie. Ad esempio, classificare un'immagine come contenente un "gatto" o un "cane".
  • Segmentazione delle immagini: A differenza del rilevamento oggetti, la segmentazione classifica ogni pixel in un'immagine. Fornisce una comprensione molto più dettagliata del contenuto dell'immagine. Le sotto-attività includono la segmentazione di istanza e la segmentazione semantica.
  • Stima della posa: Viene utilizzata per determinare la posizione e l'orientamento di una persona o di un oggetto nello spazio. È ampiamente utilizzata nella robotica, nella realtà aumentata e nell'analisi dell'attività umana.
  • Object Tracking: Questo task prevede il tracciamento di uno o più oggetti nel tempo in una sequenza video. È fondamentale per applicazioni come la sorveglianza e la navigazione autonoma.

Applicazioni nel mondo reale

Le applicazioni di computer vision sono sempre più diffuse in vari settori:

Strumenti e Framework

Lo sviluppo e il deployment di modelli di computer vision sono facilitati da diversi strumenti e framework. Librerie come PyTorch (visita il sito ufficiale di PyTorch) e TensorFlow (visita il sito ufficiale di TensorFlow) sono fondamentali per la creazione di modelli. Librerie open source come OpenCV forniscono una vasta raccolta di funzioni per la computer vision in tempo reale.

Piattaforme come Ultralytics HUB semplificano l'intero ciclo di vita di un progetto di CV, dalla gestione dei set di dati e il training di modelli personalizzati al deployment. L'uso di formati standardizzati come ONNX aiuta anche a garantire l'interoperabilità tra diversi framework. Man mano che queste tecnologie maturano, continueranno a guidare l'innovazione in tutti i settori.

Unisciti alla community di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora
Link copiato negli appunti