Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Seguimiento multiobjeto (MOT)

Explora el seguimiento multiobjeto (MOT) en la visión artificial. Aprende a detect track utilizando Ultralytics para la conducción autónoma, el comercio minorista y mucho más.

El seguimiento de múltiples objetos (MOT) es una tarea dinámica en la visión por computadora (CV) que implica detectar múltiples entidades distintas dentro de una secuencia de vídeo y mantener sus identidades a lo largo del tiempo. A diferencia de la detección de objetos estándar, que trata cada fotograma como una instantánea aislada, el MOT introduce una dimensión temporal en la inteligencia artificial (IA). Al asignar un número de identificación (ID) único a cada instancia detectada, como un peatón específico en una multitud o un vehículo en una autopista, los algoritmos MOT permiten a los sistemas trazar trayectorias, analizar comportamientos y comprender interacciones. Esta capacidad es fundamental para la comprensión moderna del vídeo y permite a las máquinas percibir la continuidad en un entorno cambiante.

Cómo funciona MOT

La mayoría de los sistemas de seguimiento contemporáneos funcionan según un paradigma de «seguimiento por detección». Este enfoque divide el proceso en dos etapas principales: identificar lo que hay en el fotograma y, a continuación, asociar esos hallazgos con objetos conocidos del pasado.

  1. Detección: En cada fotograma, un modelo de alto rendimiento como YOLO26 escanea la imagen para localizar objetos, generando cuadros delimitadores y probabilidades de clase.
  2. Predicción de movimiento: Para anticipar hacia dónde se moverá un objeto a continuación, los algoritmos suelen utilizar un filtro de Kalman. Esta herramienta matemática estima el estado de un sistema dinámico, como la velocidad y la posición, lo que ayuda a reducir el área de búsqueda en el fotograma siguiente .
  3. Asociación de datos: el sistema compara las nuevas detecciones con los rastros existentes. Los métodos de optimización, como el algoritmo húngaro, resuelven este problema de asignación minimizando el coste de la comparación, a menudo basándose en la intersección sobre la unión (IoU) para medir la superposición espacial.
  4. Reidentificación (ReID): Cuando se producen obstrucciones visuales, conocidas como oclusión, los rastreadores avanzados utilizan incrustaciones visuales para reconocer el objeto cuando vuelve a aparecer. Esto ayuda a evitar el «cambio de identificación», lo que garantiza que el sistema sepa que el coche que sale de un túnel es el mismo que entró en él.

Distinguir MOT del seguimiento de un solo objeto

Aunque la terminología es similar, el seguimiento de múltiples objetos (MOT) difiere significativamente del seguimiento de un solo objeto (SOT). El SOT se centra en seguir un objetivo específico inicializado en el primer fotograma, a menudo ignorando todas las demás entidades. Por el contrario, el MOT debe gestionar un número desconocido y variable de objetivos que pueden entrar o salir de la escena en cualquier momento. Esto hace que el MOT sea más exigente desde el punto de vista computacional, ya que requiere una lógica robusta para gestionar track y el final track , así como las complejas interacciones entre múltiples cuerpos en movimiento.

Aplicaciones en el mundo real

La capacidad de track simultáneo track entidades impulsa la innovación en varios sectores importantes.

  • Conducción autónoma: los coches autónomos dependen en gran medida de la MOT para circular con seguridad. Mediante el seguimiento de peatones, ciclistas y otros vehículos, los sistemas autónomos pueden predecir posiciones futuras para evitar colisiones. Esto suele implicar la fusión de datos de cámaras y sensores LiDAR para obtener la máxima fiabilidad.
  • Análisis minorista: En las tiendas físicas, los minoristas utilizan la IA en el comercio minorista para trazar el recorrido de los clientes. Los algoritmos MOT generan mapas de calor del tráfico peatonal, lo que ayuda a los gerentes a optimizar la distribución de las tiendas y mejorar la gestión de las colas durante las horas punta.
  • Análisis deportivo: Los equipos profesionales utilizan el MOT para analizar los movimientos de los jugadores y las formaciones de los equipos. Mediante el seguimiento de cada jugador en el campo, los entrenadores pueden extraer métricas detalladas sobre la velocidad, la distancia recorrida y el posicionamiento táctico utilizando técnicas de estimación de la postura.

Implementación de MOT con Python

Ultralytics la implementación del seguimiento con modelos de última generación. El track() El método integra la lógica de detección y seguimiento de forma fluida, admitiendo algoritmos como ByteTrack y BoT-SORT. El siguiente ejemplo muestra el seguimiento de vehículos en un vídeo utilizando la recomendada Modelo YOLO26.

from ultralytics import YOLO

# Load the official YOLO26 small model
model = YOLO("yolo26s.pt")

# Track objects in a video file (or use '0' for webcam)
# The 'persist=True' argument keeps track IDs consistent between frames
results = model.track(source="traffic_analysis.mp4", show=True, persist=True)

# Print the IDs of objects tracked in the first frame
if results[0].boxes.id is not None:
    print(f"Tracked IDs: {results[0].boxes.id.int().tolist()}")

Desafíos en el seguimiento de múltiples objetos

A pesar de los avances, el MOT sigue siendo un campo difícil. La oclusión es una dificultad principal; cuando los objetos se cruzan o se ocultan detrás de obstáculos, mantener la identidad es complejo. Las escenas concurridas, como una maratón concurrida o una bandada de pájaros, ponen a prueba los límites de los algoritmos de asociación de datos. Además, mantener las velocidades de inferencia en tiempo real mientras se procesan flujos de vídeo de alta resolución requiere arquitecturas de modelos eficientes y, a menudo, hardware especializado como los dispositivos NVIDIA .

Para hacer frente a estos retos, los investigadores están explorando enfoques de aprendizaje profundo de extremo a extremo que unifican la detección y el seguimiento en una única red, además de aprovechar Ultralytics para anotar conjuntos de datos complejos y entrenar modelos personalizados robustos.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora