Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Seguimiento multiobjeto (MOT)

Explore el seguimiento multiobjeto (MOT): track y reidentifique objetos a través de fotogramas de vídeo con YOLO11, filtros Kalman, coincidencia de apariencia y asociación de datos moderna.

El seguimiento multiobjeto (MOT) es una sofisticada capacidad de la visión por computadora (CV) que permite a los sistemas detect, identificar y seguir múltiples entidades únicas a lo largo de una secuencia de fotogramas de vídeo. A diferencia de la detección de objetos estándar detección de objetos, que trata cada fotograma de imagen como un evento aislado, el MOT introduce una dimensión temporal en la inteligencia artificial (IA). Al asignar un número de identificación (ID) persistente a cada instancia detectada, como un coche específico en el tráfico o un jugador en un campo deportivo, MOT permite a los algoritmos mantener la identidad de los objetos mientras se mueven, interactúan e incluso desaparecen temporalmente detrás de obstáculos. Esta continuidad es la base de la comprensión moderna del comprensión de vídeo y análisis del comportamiento.

Mecánica de los sistemas de seguimiento

La mayoría de los sistemas MOT contemporáneos, incluidos los que funcionan con la tecnología punta YOLO26, funcionan según un paradigma de «seguimiento por detección». Este flujo de trabajo se basa en un ciclo de detección y asociación para garantizar una alta precisión y un cambio de identificación mínimo.

  1. Detección: En cada fotograma, un modelo de alta velocidad como YOLO26 o la generación anterior YOLO11 escanea la escena para localizar objetos, generando cuadros delimitadores y probabilidades de clase .
  2. Predicción de movimiento: Para predecir hacia dónde se moverá un objeto a continuación, los algoritmos utilizan estimadores matemáticos como el filtro de Kalman. Esto crea una estimación de estado basada en la velocidad y la trayectoria, lo que reduce el área de búsqueda para el fotograma siguiente.
  3. Asociación de datos: El sistema compara las nuevas detecciones con las pistas existentes. Métodos de optimización como el algoritmo húngaro resuelven este problema de asignación minimizando el «coste» de la correspondencia, a menudo utilizando la intersección sobre la unión (IoU) para medir la superposición espacial.
  4. Reidentificación (ReID): Cuando se producen obstrucciones visuales —conocidas como oclusiones—, los rastreadores avanzados utilizan incrustaciones visuales incrustaciones para reconocer el objeto cuando reaparece, conservando su ID original en lugar de tratarlo como una nueva entidad.

MOT frente a conceptos relacionados

Comprender la diferencia entre MOT y el aprendizaje automático similar aprendizaje automático (ML) es fundamental para seleccionar la herramienta adecuada.

  • vs. Detección de objetos: La detección responde a «qué y dónde» en una imagen estática. Si una persona aparece en el fotograma 1 y en el fotograma 2, un detector ve a dos personas distintas. El MOT las vincula, entendiendo que se trata de la misma persona moviéndose en el tiempo.
  • vs. Seguimiento de un solo objeto (SOT): El SOT se centra en seguir un objetivo específico, a menudo inicializado manualmente por un usuario, y rastrearlo independientemente de otras distracciones. El MOT es más complejo, ya que debe detect track de forma autónoma track número desconocido y fluctuante de objetos que entran y salen de la escena, lo que requiere una sólida gestión de la memoria .

Aplicaciones en el mundo real

La capacidad de convertir las transmisiones de vídeo en datos estructurados impulsa la innovación en todos los sectores, lo que permite modelización predictiva y la toma de decisiones automatizada.

  • Sistemas de transporte inteligentes: En el IA en el sector automovilístico , la MOT es esencial para los coches autónomos y la infraestructura de las ciudades inteligentes. Permite la estimar la velocidad analizando la distancia que recorre un vehículo en un tiempo y ayuda a prevenir accidentes al predecir las trayectorias de peatones y ciclistas.
  • Análisis minorista: las tiendas físicas utilizan IA en el comercio minorista para analizar el comportamiento de los compradores . Mediante la aplicación de MOT para el el recuento de objetos, los minoristas pueden generar mapas de calor de los pasillos con mayor tráfico, supervisar los tiempos de permanencia y optimizar la la gestión de las colas para reducir los tiempos de espera en las cajas.

Seguimiento con Python

En ultralytics El paquete proporciona una interfaz perfecta para MOT, integrando potentes algoritmos como BoT-SORT y ByteTrackEl siguiente ejemplo muestra cómo cargar un modelo y track en una secuencia de vídeo.

from ultralytics import YOLO

# Load a pre-trained YOLO model (YOLO11n is used here, YOLO26n is also supported)
model = YOLO("yolo11n.pt")

# Perform tracking on a video source
# 'persist=True' ensures tracks are maintained between frames
results = model.track(source="https://youtu.be/LNwODJXcvt4", persist=True, tracker="bytetrack.yaml")

# Visualize the first frame's results with IDs drawn
results[0].show()

Este sencillo flujo de trabajo gestiona automáticamente la detección, la asociación y la asignación de identificadores, lo que permite a los desarrolladores centrarse en la lógica de alto nivel, como el el recuento de regiones o desencadenantes de comportamiento. Para obtener más detalles sobre la configuración, consulte la documentación del modo de seguimiento.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora