Seguimiento multiobjeto (MOT)
Explore el seguimiento multiobjeto (MOT): rastree y reidentifique objetos a través de fotogramas de vídeo con YOLO11, filtros Kalman, coincidencia de apariencia y asociación de datos moderna.
El seguimiento de múltiples objetos (Multi-Object Tracking, MOT) es una tarea fundamental en visión por ordenador (VC ) que consiste en detectar múltiples objetos en un vídeo y mantener sus identidades únicas a lo largo de fotogramas consecutivos. A diferencia de la detección de objetos, que localiza y clasifica objetos en una sola imagen, el MOT añade una dimensión temporal. Responde no sólo a "¿Qué objetos hay en el fotograma?", sino también a "¿Hacia dónde se dirige cada objeto concreto?". Al asignar un ID persistente a cada objeto, la MOT permite analizar el movimiento, el comportamiento y las interacciones a lo largo del tiempo, lo que la hace esencial para comprender escenas dinámicas.
Cómo funciona el seguimiento multiobjeto
El proceso MOT suele seguir un paradigma de seguimiento por detección. En primer lugar, se utiliza un detector de objetos, como YOLO11, para identificar todos los objetos en cada fotograma de un vídeo. A cada objeto detectado se le asigna un ID de seguimiento único. En los fotogramas siguientes, un algoritmo de seguimiento predice las nuevas posiciones de estos objetos y las asocia a los objetos recién detectados. Esta asociación es un paso crítico y se basa en varias técnicas:
- Predicción del movimiento: Algoritmos como el filtro de Kalman (KF) estiman la posición futura de un objeto basándose en su movimiento pasado. Esto ayuda a acotar la búsqueda del objeto en el siguiente fotograma.
- Coincidencia de apariencia: para volver a identificar un objeto después de que haya sido ocluido o haya cambiado su apariencia, los sistemas suelen extraer características distintivas. Estas pueden ir desde simples histogramas de color a complejas incrustaciones basadas en el aprendizaje profundo.
- Asociación de datos: Este componente empareja las pistas de objetos existentes con las nuevas detecciones. Para gestionar estas asignaciones se utilizan algoritmos sofisticados como el algoritmo húngaro o métodos empleados por rastreadores modernos como ByteTrack y BoT-SORT, que garantizan la continuidad del rastreo incluso en escenas abarrotadas.
Ultralytics ofrece una integración perfecta de estos algoritmos de seguimiento, lo que permite a los usuarios implementar fácilmente un sólido seguimiento multiobjeto con detectores de alto rendimiento.
Seguimiento multiobjeto frente a detección de objetos
Aunque están estrechamente relacionados, el MOT y la detección de objetos tienen objetivos distintos. La detección de objetos es un análisis estático, fotograma a fotograma, que produce un conjunto de cuadros delimitadores y etiquetas de clase. En cambio, el MOT es un proceso dinámico que enlaza estas detecciones a lo largo del tiempo, creando una "historia" continua para cada objeto. Se puede pensar en la detección de objetos como una serie de instantáneas, mientras que el seguimiento multiobjeto une esas instantáneas para crear una película, revelando la trama de cómo se mueven e interactúan los objetos.
Aplicaciones en el mundo real
La ITV es una tecnología transformadora con una amplia gama de usos prácticos en diversos sectores.
- Vehículos autónomos: Para los coches autónomos, la ITV es fundamental para la seguridad. Permite a un vehículo seguir las trayectorias de otros coches, peatones y ciclistas y predecir sus movimientos para tomar decisiones con conocimiento de causa y evitar colisiones. Este seguimiento continuo proporciona una comprensión más rica del entorno que la detección de un solo fotograma.
- Análisis de comercios y espacios públicos: En el comercio minorista, el MOT se utiliza para analizar el comportamiento de los clientes mediante el seguimiento de los patrones de tráfico peatonal y los tiempos de permanencia. Esto ayuda a optimizar la distribución de las tiendas y a gestionar las colas con eficacia. En los espacios públicos, puede utilizarse para la gestión de multitudes y la seguridad, por ejemplo mediante la creación de un sistema de alarma de seguridad que se activa cuando se rastrea a una persona que entra en una zona restringida.
- Análisis deportivo: Los entrenadores y analistas utilizan la ITV para controlar los movimientos de los jugadores, analizar las formaciones y evaluar métricas de rendimiento como la velocidad y la distancia recorrida. Esto puede combinarse con la estimación de la postura para obtener un análisis más detallado de la técnica atlética y la estrategia de juego.
- Automatización industrial: En una fábrica, la ITV puede utilizarse para seguir piezas en una cinta transportadora para el recuento de objetos y el control de calidad, garantizando que cada artículo se procesa correctamente. Se trata de un componente clave de la IA en la fabricación.