Guía para el seguimiento de objetos en movimiento en vídeos con los modelos YOLO de Ultralytics

Abirami Vina

5 minutos de lectura

15 de abril de 2025

Aprenda cómo funcionan los sistemas de seguimiento de visión por ordenador, explore los modelos más conocidos que admiten el seguimiento de objetos, como YOLO11, y descubra sus aplicaciones en el mundo real.

Robots capaces de ensamblar piezas eléctricas, sistemas que detectan coches que circulan a gran velocidad y soluciones inteligentes para el comercio minorista que siguen la forma en que compran los clientes: todas estas innovaciones se basan en la visión por ordenador. Se trata de una rama de la inteligencia artificial (IA) que ayuda a las máquinas a analizar y comprender imágenes y vídeos.

Por ejemplo, un robot necesita reconocer y seguir diferentes piezas para ensamblarlas correctamente. Del mismo modo, un sistema de tráfico puede utilizar la visión por ordenador para detectar coches, leer matrículas y averiguar cuándo alguien va a gran velocidad. Mientras tanto, en las tiendas, Vision AI puede ayudar a rastrear lo que los clientes están mirando o recogiendo e incluso puede vigilar el inventario.

Estas aplicaciones se basan en modelos de visión artificial como Ultralytics YOLO11, que permite realizar una amplia gama de tareas visuales. Muchas de ellas se centran en obtener información a partir de una sola imagen, pero una tarea especialmente interesante, el seguimiento de objetos, puede utilizarse para seguir el movimiento de objetos en una serie de imágenes o fotogramas de vídeo.

__wf_reserved_inherit
Fig. 1. Ejemplo de detección y seguimiento de coches.

En esta guía, veremos más de cerca cómo funciona el seguimiento de objetos y exploraremos ejemplos reales de cómo se utiliza. También hablaremos de cómo los modelos de Vision AI, como Ultralytics YOLO11, admiten el seguimiento de objetos. Empecemos.

Los sistemas de seguimiento por visión artificial

El seguimiento de objetos es una tarea de visión por ordenador que se utiliza para seguir el movimiento de objetos a través de fotogramas de vídeo, lo que ayuda a los sistemas a controlar y comprender cómo cambian las cosas con el tiempo. Es muy similar a la forma en que los seres humanos pueden seguir naturalmente con la mirada a una persona o un objeto en movimiento, como cuando estás viendo un partido de tenis y tus ojos siguen la pelota mientras se mueve de un lado a otro de la pista.

Del mismo modo, el seguimiento de objetos implica el uso de cámaras e inteligencia artificial para seguir el movimiento del balón en tiempo real. Esta tecnología puede ofrecer a los espectadores una mejor comprensión del desarrollo del juego, especialmente a través de análisis como la velocidad, la trayectoria y la posición de los jugadores.

Si bien este tipo de seguimiento visual puede parecer sencillo para los humanos, cuando se trata de visión artificial, implica una serie de pasos impulsados por modelos de IA de visión. He aquí un sencillo desglose de cómo funciona el seguimiento de objetos: 

  • Captura de vídeo: Las cámaras graban secuencias de vídeo, captando cómo se mueven los objetos por una escena a lo largo del tiempo.
  • Detección de objetos: Los modelos de visión artificial como YOLO11 pueden analizar cada fotograma para identificar y localizar objetos concretos, como personas, vehículos o productos.
  • Asignación de identidad: Una vez detectado un objeto, los algoritmos de seguimiento le asignan un ID único para seguirlo a través de múltiples fotogramas, lo que garantiza que el sistema sepa que se trata del mismo objeto aunque se mueva.
  • Seguimiento del movimiento: El sistema realiza un seguimiento del movimiento a lo largo del tiempo, y estos datos pueden utilizarse para recopilar información como la velocidad, la dirección y las interacciones con otros objetos.
  • Generación de información: Esta información puede utilizarse en tiempo real para proporcionar análisis, ayudar a la toma de decisiones o potenciar superposiciones visuales, en función del caso de uso específico.

Comparación de la detección y el seguimiento de objetos con YOLO

Otra tarea de visión por ordenador soportada por YOLO11 que está estrechamente relacionada con el seguimiento de objetos es la detección de objetos. Exploremos la diferencia entre estas dos tareas. 

La detección de objetos consiste en identificar y localizar objetos de interés en una sola imagen o fotograma de vídeo. Por ejemplo, un coche autoconducido utiliza la detección de objetos para reconocer una señal de stop o un peatón en un único fotograma captado por las cámaras de a bordo. Responde a la pregunta: "¿Qué hay en esta imagen y dónde está?". Sin embargo, no proporciona ninguna información sobre dónde va el objeto a continuación.

El seguimiento de objetos se basa en la detección de objetos, añadiendo la comprensión del movimiento a lo largo del tiempo. La diferencia clave entre ambos es cómo gestionan el tiempo y el movimiento. La detección de objetos trata cada fotograma como una instantánea independiente, mientras que el seguimiento de objetos conecta los puntos entre fotogramas, utilizando datos pasados para predecir la posición futura de un objeto.

Combinando ambas, podemos construir potentes sistemas de IA de visión capaces de realizar seguimientos en tiempo real en entornos dinámicos. Por ejemplo, un sistema de seguridad automatizado puede detectar a las personas que entran en un espacio y seguir continuamente sus movimientos por el encuadre.

Seguimiento en tiempo real mediante los modelos YOLO de Ultralytics

Ahora que hemos cubierto la diferencia entre detección y seguimiento de objetos, veamos cómo los modelos YOLO de Ultralytics, como YOLO11, admiten el seguimiento de objetos en tiempo real.

Aunque los modelos YOLO no son algoritmos de seguimiento propiamente dichos, desempeñan un papel esencial al detectar objetos en cada fotograma de vídeo. Una vez detectados los objetos, se necesitan algoritmos de seguimiento para asignarles identificadores únicos que permitan al sistema seguir su movimiento de un fotograma a otro. 

Para dar respuesta a esta necesidad, el paquete Python de Ultralytics integra a la perfección la detección de objetos con algoritmos de seguimiento populares como BoT-SORT y ByteTrack. Esta integración permite a los usuarios ejecutar conjuntamente la detección y el seguimiento con una configuración mínima.

Al utilizar modelos YOLO para el seguimiento de objetos, puede elegir qué algoritmo de seguimiento aplicar en función de los requisitos de su aplicación. Por ejemplo, BoT-SORT es una buena opción para el seguimiento de objetos que se mueven de forma impredecible, gracias a su uso de la predicción de movimiento y el aprendizaje profundo. ByteTrack, por su parte, funciona especialmente bien en escenas con mucha gente, manteniendo un seguimiento fiable incluso cuando los objetos están borrosos o parcialmente ocultos.

__wf_reserved_inherit
Fig. 2. El paquete Python de Ultralytics integra a la perfección BoT-SORT y ByteTrack.

¿Cómo se relaciona el entrenamiento personalizado del modelo YOLO con el seguimiento de objetos?

El entrenamiento personalizado es el proceso de ajustar un modelo de detección de objetos preentrenado, como YOLO11, en un conjunto de datos específico para que pueda reconocer objetos que no están incluidos en los conjuntos de datos estándar. Esto es especialmente importante cuando su sistema de seguimiento necesita seguir objetos personalizados o poco comunes.

Los sistemas de seguimiento dependen del modelo de detección para reconocer primero el objeto. Si un modelo YOLO no puede detectar un elemento concreto, como un tipo específico de maquinaria o una especie silvestre, el algoritmo de seguimiento no podrá seguirlo.

Por eso el entrenamiento personalizado es esencial: garantiza que el modelo de detección pueda identificar con precisión los objetos que desea rastrear.

También es importante tener en cuenta que durante este proceso sólo se ajusta el modelo de detección. Los algoritmos de seguimiento, como BoT-SORT o ByteTrack, no se entrenan de forma personalizada, sino que simplemente utilizan la salida del modelo YOLO para seguir los objetos detectados a través de los fotogramas.

Aplicaciones del seguimiento de objetos con Ultralytics YOLO

Ahora que entendemos mejor qué es el seguimiento de objetos y cómo funciona, vamos a explorar algunas aplicaciones del mundo real en las que esta tecnología está teniendo un gran impacto.

Seguimiento en tiempo real con Ultralytics YOLO para estimar la velocidad

Los sistemas de estimación de la velocidad que permite la visión por ordenador dependen de tareas como la detección y el seguimiento de objetos. Estos sistemas están diseñados para calcular la velocidad a la que se mueve un objeto, ya sea un vehículo, un ciclista o incluso una persona. Esta información es crucial para diversas aplicaciones, desde la gestión del tráfico hasta la supervisión de la seguridad y la automatización industrial.

Utilizando un modelo como Ultralytics YOLO11, se pueden detectar y seguir objetos a través de fotogramas de vídeo. Analizando la distancia que recorre un objeto en un periodo de tiempo determinado, el sistema puede estimar su velocidad. 

__wf_reserved_inherit
Fig. 3. Utilización del soporte de YOLO11 para el seguimiento de objetos para la estimación de la velocidad.

Exploración del seguimiento de objetos en la fabricación

Los procesos de fabricación pueden ser rápidos y muy complejos, lo que dificulta el seguimiento manual de cada artículo que se produce. El seguimiento de objetos ofrece una buena solución para automatizar la supervisión de los productos a medida que pasan por cada etapa de la producción. Puede ayudar a las fábricas a mantener altos niveles de precisión y eficacia sin ralentizar el proceso.

Desde el recuento de productos en una cinta transportadora hasta la detección de defectos o la verificación de un montaje correcto, el seguimiento de objetos aporta visibilidad y control a tareas que, de otro modo, llevarían mucho tiempo o serían propensas a errores. Esta tecnología es especialmente útil en industrias de gran volumen, como las de procesamiento de alimentos, electrónica y envasado, donde la velocidad y la precisión son fundamentales.

__wf_reserved_inherit
Fig. 4. Ejemplo de seguimiento y recuento de productos alimentarios en una cadena de montaje con YOLO11.

Visión general del seguimiento de objetos en la analítica comercial

Innumerables clientes entran y salen de las tiendas cada día, y entender su comportamiento es clave para mejorar tanto la experiencia del cliente como el rendimiento del negocio. El seguimiento de objetos permite a los minoristas controlar el tráfico peatonal, medir el tiempo de permanencia y analizar los patrones de movimiento, todo ello sin necesidad de métodos invasivos o manuales.

Mediante el seguimiento de las personas que entran, salen y se mueven por la tienda, las empresas pueden obtener información sobre las horas punta, las zonas más frecuentadas e incluso la longitud de las colas. Esta información puede servir de base para tomar decisiones sobre la dotación de personal, la distribución de la tienda y la colocación del inventario, lo que en última instancia conduce a operaciones más eficientes y a un aumento de las ventas.

__wf_reserved_inherit
Fig. 5. Uso de las capacidades de seguimiento de objetos de YOLO11 para controlar a las personas que entran y salen de una tienda.

Ventajas e inconvenientes del seguimiento de objetos

Desde tiendas minoristas hasta fábricas, el seguimiento de objetos se utiliza en todo tipo de industrias para mejorar factores como la eficacia, la seguridad y la experiencia general. Estas son algunas de las principales ventajas que el seguimiento de objetos puede aportar a diversos sectores:

  • Permite alertas en tiempo real: Los sistemas integrados con seguimiento de objetos pueden configurarse para activar alertas automáticamente cuando se detecta algo inusual, como una persona que entra en una zona restringida o una entrega que se deja demasiado tiempo en un lugar.
  • Se integra con otros sistemas: Los datos de seguimiento de objetos pueden combinarse con otras tecnologías, como el reconocimiento facial, las cámaras térmicas o los sistemas de inventario, para obtener información aún más potente.
  • Rentable a largo plazo: Aunque la configuración inicial puede requerir una inversión, el seguimiento automatizado reduce la necesidad de mano de obra, disminuye las tasas de error y reduce los costes operativos con el tiempo.

Aunque estas ventajas ponen de relieve el impacto positivo del seguimiento de objetos en distintos casos de uso, también es importante tener en cuenta los retos que plantea su aplicación. Veamos con más detalle algunas limitaciones del seguimiento de objetos:

  • Dificultad en entornos abarrotados: En entornos muy concurridos, como conciertos, centros comerciales o calles de la ciudad, los sistemas de seguimiento pueden tener dificultades para distinguir entre personas u objetos que están muy juntos, lo que provoca confusión o resultados imprecisos.
  • Sensible a las condiciones ambientales: La mala iluminación, la niebla, el movimiento rápido o las sacudidas de la cámara pueden afectar a la capacidad del sistema para rastrear objetos con precisión, especialmente en exteriores o en entornos no controlados.
  • Inquietudes legales y de privacidad: El tratamiento inadecuado de datos personales, la falta de consentimiento de los usuarios o la vigilancia en espacios públicos pueden plantear problemas éticos y dar lugar al incumplimiento de la legislación sobre privacidad.

Principales conclusiones

El seguimiento de objetos es una tarea de visión por ordenador que permite a las máquinas seguir el movimiento de los objetos a lo largo del tiempo. Se utiliza en una amplia gama de escenarios del mundo real, desde la estimación de la velocidad de un vehículo y el recuento de productos en una cadena de montaje hasta el análisis de los movimientos de los jugadores en los deportes.

Con modelos de Vision AI como YOLO11 y algoritmos de seguimiento como BoT-SORT y ByteTrack, el seguimiento de objetos se ha vuelto más rápido, inteligente y accesible en diferentes sectores. A medida que la tecnología de seguimiento de objetos evoluciona, ayuda a los sistemas a ser más inteligentes, eficientes y receptivos, fotograma a fotograma.

¿Desea obtener más información sobre la visión por ordenador y la IA? Explore nuestro repositorio de GitHub, conéctese con nuestra comunidad y consulte nuestras opciones de licencia para poner en marcha su proyecto de visión por ordenador. Si está explorando innovaciones como la IA en la fabricación y la visión por ordenador en el sector de la automoción, visite nuestras páginas de soluciones para obtener más información. 

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Empezar gratis
Enlace copiado en el portapapeles