Yolo Vision Shenzhen
Shenzhen
Iscriviti ora
Glossario

Computer Visione (CV)

Esplora i fondamenti della visione artificiale (CV). Scopri come Ultralytics e la Ultralytics consentono il rilevamento di oggetti, la segmentazione e molto altro ancora.

La visione artificiale (CV) è un campo sofisticato dell' intelligenza artificiale (AI) che consente ai computer e ai sistemi di ricavare informazioni significative da immagini digitali, video e altri input visivi. Mentre la vista umana ha la capacità innata di percepire e comprendere istantaneamente l'ambiente circostante, i computer devono essere addestrati a riconoscere modelli e interpretare i pixel. Sfruttando il Machine Learning (ML) e in particolare gli algoritmi di Deep Learning (DL), i sistemi CV possono acquisire dati visivi, elaborarli e formulare raccomandazioni o intraprendere azioni sulla base di tali informazioni.

Come funziona la Computer Vision

Fondamentalmente, un computer vede un'immagine come una serie di valori numerici che rappresentano i pixel. Il CV moderno si basa in gran parte sulle reti neurali convoluzionali (CNN), progettate per imitare il modello di connettività dei neuroni nel cervello umano. Queste reti imparano a identificare una gerarchia di caratteristiche, dai semplici bordi e texture alle forme e agli oggetti complessi, attraverso un processo chiamato estrazione delle caratteristiche.

Per funzionare in modo efficace, questi modelli richiedono grandi quantità di dati di addestramento. Ad esempio, per riconoscere un'auto, un modello deve elaborare migliaia di immagini etichettate di auto in varie condizioni. Strumenti come la Ultralytics semplificano questo flusso di lavoro, consentendo agli utenti di annotare i set di dati, addestrare i modelli nel cloud e distribuirli in modo efficiente.

Compiti fondamentali nella visione artificiale

La visione artificiale non è una singola funzione, ma un insieme di compiti distinti, ciascuno dei quali risolve un problema specifico:

  • Classificazione delle immagini: questo compito assegna un'etichetta di classe a un'intera immagine, rispondendo alla domanda "Cosa c'è in questa immagine?" (ad esempio, distinguendo tra un gatto e un cane).
  • Rilevamento di oggetti: facendo un ulteriore passo avanti, il rilevamento identifica oggetti distinti all'interno di un'immagine e disegna un riquadro di delimitazione attorno ad essi. Ciò è fondamentale per contare gli elementi o individuare caratteristiche specifiche.
  • Segmentazione delle istanze: fornisce una maschera precisa a livello di pixel per ogni oggetto rilevato, separando le singole istanze della stessa classe. È fondamentale per le applicazioni che richiedono un'elevata precisione, come l'analisi delle immagini mediche.
  • Stima della posa: comporta il rilevamento di punti chiave specifici su un oggetto, come le articolazioni del corpo umano, per track e la postura.

Applicazioni nel mondo reale

L'utilità della visione artificiale si estende praticamente a tutti i settori industriali, automatizzando compiti che in precedenza richiedevano l'intervento umano .

  • Produzione e controllo qualità: In ambito industriale, il CV viene spesso definito come visione artificiale. Viene utilizzato per automatizzare il controllo qualità, rilevando difetti minimi nei prodotti su una linea di assemblaggio in modo più rapido e accurato rispetto agli ispettori umani. Ad esempio, l'IA nella produzione consente il monitoraggio in tempo reale delle apparecchiature per prevenire guasti.
  • Trasporto autonomo: le auto a guida autonoma si affidano interamente alla CV per navigare in sicurezza. Elaborando gli input provenienti dalle telecamere e dai sensori LiDAR, questi veicoli eseguono il rilevamento di oggetti 3D per identificare pedoni, altri veicoli e segnali stradali in tempo reale. Si tratta di una componente fondamentale per raggiungere livelli elevati di automazione dei veicoli.
  • Assistenza sanitaria e diagnostica: i radiologi utilizzano il CV per identificare anomalie nelle radiografie, nelle risonanze magnetiche e nelle tomografie computerizzate. L'intelligenza artificiale nel settore sanitario aiuta nella diagnosi precoce delle malattie, ad esempio nell'identificazione dei tumori, evidenziando le aree di interesse che potrebbero sfuggire a un esame visivo .

Computer Vision vs. Elaborazione delle immagini

È importante distinguere il CV dall' elaborazione delle immagini, anche se spesso lavorano insieme.

  • L'elaborazione delle immagini comporta la manipolazione di un'immagine per migliorarla o estrarre informazioni (ad esempio, regolando la luminosità, il contrasto o applicando filtri come quelli di Adobe Photoshop). Il risultato è solitamente un'altra immagine.
  • La visione artificiale prende un'immagine come input e produce informazioni o un'interpretazione (ad esempio, "Ci sono tre persone in questa stanza"). La visione artificiale utilizza tecniche di elaborazione delle immagini per preparare le immagini per l'analisi da parte delle reti neurali.

Implementazione della visione artificiale con Python

Le librerie moderne hanno reso accessibile l'implementazione di potenti modelli CV. L'esempio seguente mostra come caricare lo stato dell'arte YOLO26 modello per detect in un'immagine utilizzando il ultralytics pacchetto.

from ultralytics import YOLO

# Load the YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")

# Run inference on a standard example image
# The model identifies objects and their locations
results = model("https://ultralytics.com/images/bus.jpg")

# Display the resulting image with bounding boxes
results[0].show()

Questo semplice script utilizza un modello pre-addestrato per eseguire complesse attività di inferenza, dimostrando l'accessibilità dei moderni strumenti di IA. Per gli sviluppatori che desiderano andare oltre le immagini statiche, CV alimenta anche sistemi di comprensione video e tracciamento in tempo reale utilizzati nella sicurezza e nell'analisi sportiva. Integrandosi con librerie come OpenCV, gli sviluppatori possono creare applicazioni complete che catturano, elaborano e analizzano il mondo visivo.

Unitevi alla comunità di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora