Sintonizzati su YOLO Vision 2025!
25 settembre 2025
10:00 — 18:00 BST
Evento ibrido
Yolo Vision 2024
Glossario

Flusso ottico

Scopri la potenza dell'Optical Flow nella computer vision. Scopri come stima il movimento, migliora l'analisi video e guida le innovazioni nell'AI.

Il flusso ottico è un concetto fondamentale nella computer vision (CV) che implica la stima del movimento di oggetti, superfici e bordi in una scena visiva causato dal movimento relativo tra un osservatore (come una telecamera) e la scena. Calcola un campo di vettori che descrivono la direzione e la velocità del movimento per pixel o caratteristiche tra due fotogrammi video consecutivi. Questo fornisce una comprensione dettagliata e di basso livello di "come" le cose si stanno muovendo, il che è fondamentale per molte attività di analisi dinamica della scena.

Come funziona il flusso ottico

L'assunzione centrale alla base della maggior parte degli algoritmi di optical flow è la "costanza della luminosità", che presuppone che l'intensità di un pixel corrispondente a un punto specifico su un oggetto rimanga costante per brevi intervalli di tempo. Trovando lo spostamento che preserva questa luminosità, gli algoritmi possono stimare il movimento. Esistono due approcci principali per calcolare l'optical flow:

  • Flusso ottico denso: Questo metodo calcola un vettore di movimento per ogni singolo pixel nell'immagine. Fornisce un campo di movimento altamente dettagliato, utile per attività come la image segmentation e la comprensione delle dinamiche complesse della scena. Il metodo Horn-Schunck è un esempio classico, mentre i moderni modelli di deep learning come RAFT offrono prestazioni all'avanguardia.
  • Flusso ottico sparso: Invece di analizzare ogni pixel, questo metodo tiene traccia di un insieme sparso di caratteristiche "interessanti" (come angoli o punti chiave) attraverso i fotogrammi. Il metodo Lucas-Kanade è un algoritmo sparso ben noto. Questo approccio è più efficiente dal punto di vista computazionale ed è adatto per applicazioni in cui è necessario solo il movimento di punti specifici, come nel tracciamento degli oggetti.

Flusso ottico vs. rilevamento oggetti

Sebbene correlati, il flusso ottico e il rilevamento degli oggetti risolvono problemi diversi.

  • Flusso Ottico descrive il movimento di basso livello dei pixel. Il suo output è un insieme di vettori che rappresentano il movimento tra due fotogrammi. Non comprende intrinsecamente il concetto di "oggetto" o ne mantiene l'identità nel tempo.
  • Object Tracking è un'attività di livello superiore incentrata sulla localizzazione di un oggetto specifico e sul tracciamento del suo percorso attraverso più frame, assegnandogli un ID univoco. Gli algoritmi di tracking utilizzano spesso tecniche come il flusso ottico come input per prevedere la posizione di un oggetto nel frame successivo dopo che è stato identificato da un modello di object detection, come un modello Ultralytics YOLO. Puoi vedere questo in azione nella modalità object tracking di Ultralytics.

In breve, il flusso ottico risponde alla domanda "Come si muovono i pixel?", mentre il tracciamento degli oggetti risponde alla domanda "Dove è andata quell'auto?".

Applicazioni nel mondo reale

Il flusso ottico è fondamentale per molte applicazioni che richiedono la comprensione del movimento dai video:

  • Sistemi autonomi: I veicoli autonomi e i robot utilizzano il flusso ottico per l'odometria visiva (stima del movimento autonomo), il rilevamento degli ostacoli e la comprensione del movimento relativo degli oggetti nel loro ambiente. Ad esempio, aiuta un'auto a guida autonoma a stimare la sua velocità rispetto alla strada o a tracciare i veicoli vicini. Aziende come Waymo fanno molto affidamento sulla percezione del movimento. Esplora l'IA nelle auto a guida autonoma per maggiori informazioni.
  • Compressione video: Standard come MPEG utilizzano tecniche di stima del movimento simili al flusso ottico per prevedere i fotogrammi successivi in base a quelli precedenti. Codificando solo i vettori di movimento e gli errori di previsione (residui), si ottiene una significativa compressione dei dati.
  • Riconoscimento delle azioni: La comprensione delle azioni umane nei video, una parte fondamentale della stima della posa, spesso implica l'analisi di modelli di movimento derivati dal flusso ottico. Questo è fondamentale per le applicazioni nell'analisi sportiva e nella tecnologia per il fitness intelligente.
  • Stabilizzazione video: Le tecniche di stabilizzazione digitale dell'immagine possono utilizzare il flusso ottico per stimare il tremolio della fotocamera e compensarlo, producendo video più fluidi. Questa tecnologia è comune negli smartphone e nelle fotocamere moderni.
  • Analisi di immagini mediche: Utilizzata per tracciare il movimento dei tessuti, come il movimento del muscolo cardiaco negli ecocardiogrammi o la deformazione degli organi durante le procedure. Consultare risorse come la rivista Radiology: Artificial Intelligence per i relativi progressi.
  • Robotica: Consente ai robot di navigare, interagire con gli oggetti ed eseguire compiti basati sul feedback visivo sul movimento nell'ambiente circostante. L'integrazione con sistemi come ROS spesso incorpora l'analisi del movimento.

Strumenti e implementazione

Librerie come OpenCV forniscono implementazioni di algoritmi classici di optical flow e la sua documentazione include tutorial dettagliati sull'Optical Flow di OpenCV. Per gli approcci di deep learning, vengono comunemente utilizzati framework come PyTorch (visita il sito ufficiale di PyTorch) e TensorFlow (visita il sito ufficiale di TensorFlow), spesso sfruttando modelli pre-addestrati disponibili tramite piattaforme come Hugging Face. L'addestramento di questi modelli richiede dataset video su larga scala con informazioni sul flusso di ground truth, come i dataset FlyingThings3D o Sintel. Piattaforme come Ultralytics HUB possono aiutare a gestire i dataset e i workflow di addestramento dei modelli per attività di computer vision correlate.

Unisciti alla community di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora
Link copiato negli appunti