Glosario

Flujo óptico

Descubra el poder del flujo óptico en la visión por ordenador. Descubra cómo estima el movimiento, mejora el análisis de vídeo e impulsa innovaciones en IA.

El flujo óptico es un concepto básico de la visión por ordenador (VC ) que consiste en estimar el movimiento de objetos, superficies y bordes en una escena visual causado por el movimiento relativo entre un observador (como una cámara) y la escena. Calcula un campo de vectores que describen la dirección y la velocidad de movimiento de los píxeles o características entre dos fotogramas de vídeo consecutivos. Esto proporciona una comprensión detallada y de bajo nivel de "cómo" se mueven las cosas, lo cual es fundamental para muchas tareas de análisis dinámico de escenas.

Cómo funciona el flujo óptico

La hipótesis central de la mayoría de los algoritmos de flujo óptico es la "constancia del brillo", que presupone que la intensidad de un píxel correspondiente a un punto concreto de un objeto permanece constante a lo largo de intervalos de tiempo cortos. Al encontrar el desplazamiento que preserva este brillo, los algoritmos pueden estimar el movimiento. Existen dos métodos principales para calcular el flujo óptico:

  • Flujo óptico denso: este método calcula un vector de movimiento para cada píxel de la imagen. Proporciona un campo de movimiento muy detallado, útil para tareas como la segmentación de imágenes y la comprensión de la dinámica de escenas complejas. El método Horn-Schunck es un ejemplo clásico, mientras que los modelos modernos de aprendizaje profundo, como RAFT, ofrecen un rendimiento de vanguardia.
  • Flujo óptico disperso: en lugar de analizar cada píxel, este método rastrea un conjunto disperso de características "interesantes" (como esquinas o puntos clave) a lo largo de los fotogramas. El método Lucas-Kanade es un algoritmo disperso muy conocido. Este método es más eficiente desde el punto de vista computacional y es adecuado para aplicaciones en las que sólo se necesita el movimiento de puntos específicos, como en el seguimiento de objetos.

Flujo óptico frente a seguimiento de objetos

Aunque están relacionados, el flujo óptico y el seguimiento de objetos resuelven problemas diferentes.

  • El flujo óptico describe el movimiento a bajo nivel de los píxeles. Su resultado es un conjunto de vectores que representan el movimiento entre dos fotogramas. No entiende intrínsecamente el concepto de "objeto" ni mantiene su identidad a lo largo del tiempo.
  • Seguimiento de objetos es una tarea de alto nivel centrada en localizar un objeto específico y seguir su trayectoria a través de múltiples fotogramas, asignándole un ID coherente. Los algoritmos de seguimiento suelen utilizar técnicas como el flujo óptico como entrada para predecir la posición de un objeto en el siguiente fotograma después de que haya sido identificado por un modelo de detección de objetos, como un modelo YOLO de Ultralytics. Puede ver esto en acción en el modo de seguimiento de objetos de Ultralytics.

En pocas palabras, el flujo óptico responde a "¿Cómo se mueven los píxeles?", mientras que el seguimiento de objetos responde a "¿Dónde ha ido ese coche?".

Aplicaciones reales

El flujo óptico es crucial para muchas aplicaciones que requieren comprender el movimiento a partir del vídeo:

  • Sistemas autónomos: Los vehículos autónomos y los robots utilizan el flujo óptico para la odometría visual (estimación del movimiento propio), la detección de obstáculos y la comprensión del movimiento relativo de los objetos de su entorno. Por ejemplo, ayuda a un coche autónomo a estimar su velocidad respecto a la carretera o a seguir la pista de vehículos cercanos. Empresas como Waymo dependen en gran medida de la percepción del movimiento. Más información sobre la IA en los coches autónomos.
  • Compresión de vídeo: Normas como MPEG utilizan técnicas de estimación del movimiento similares al flujo óptico para predecir los fotogramas siguientes basándose en los anteriores. Al codificar sólo los vectores de movimiento y los errores de predicción (residuales), se consigue una importante compresión de datos.
  • Reconocimiento de acciones: La comprensión de las acciones humanas en los vídeos, una parte clave de la estimación de la pose, suele implicar el análisis de patrones de movimiento derivados del flujo óptico. Esto es fundamental para aplicaciones de análisis deportivo y tecnología de fitness inteligente.
  • Estabilización de vídeo: Las técnicas de estabilización de imagen digital pueden utilizar el flujo óptico para estimar el movimiento de la cámara y compensarlo, produciendo vídeos más fluidos. Esta tecnología es habitual en los smartphones y cámaras modernos.
  • Análisis de imágenes médicas: Se utiliza para rastrear el movimiento de los tejidos, como el movimiento del músculo cardíaco en ecocardiogramas o la deformación de órganos durante procedimientos. Consulte recursos como la revista Radiology: Inteligencia Artificial para ver avances relacionados.
  • Robótica: Permite a los robots navegar, interactuar con objetos y realizar tareas basándose en información visual sobre el movimiento en su entorno. La integración con sistemas como ROS suele incorporar análisis de movimiento.

Herramientas y aplicación

Bibliotecas como OpenCV proporcionan implementaciones de algoritmos de flujo óptico clásicos, y su documentación incluye tutoriales detallados de OpenCV Optical Flow. Para los enfoques de aprendizaje profundo, se suelen utilizar marcos como PyTorch (visite el sitio oficial de PyTorch) y TensorFlow (visite el sitio oficial de TensorFlow), a menudo aprovechando modelos preentrenados disponibles a través de plataformas como Hugging Face. El entrenamiento de estos modelos requiere conjuntos de datos de vídeo a gran escala con información de flujo real, como los conjuntos de datos FlyingThings3D o Sintel. Plataformas como Ultralytics HUB pueden ayudar a gestionar conjuntos de datos y flujos de trabajo de entrenamiento de modelos para tareas de visión por ordenador relacionadas.

Únase a la comunidad Ultralytics

Únase al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo.

Únete ahora
Enlace copiado en el portapapeles