Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Seguimento de múltiplos objectos (MOT)

Explore o rastreio de múltiplos objectos (MOT): track e reidentifique objectos em quadros de vídeo com YOLO11, filtros Kalman, correspondência de aspeto e associação de dados moderna.

O rastreamento de múltiplos objetos (MOT) é uma capacidade sofisticada em visão computacional (CV) que permite que os sistemas detect, identifiquem e sigam várias entidades únicas em uma sequência de quadros de vídeo. Ao contrário da detecção de objetos padrão detecção de objetos, que trata cada fotograma de imagem como um evento isolado, o MOT introduz uma dimensão temporal à inteligência artificial (IA). Ao atribuir um número de identificação (ID) persistente a cada instância detetada — como um carro específico no trânsito ou um jogador num campo desportivo —, o MOT permite que os algoritmos mantenham a identidade dos objetos à medida que se movem, interagem e até desaparecem temporariamente atrás de obstruções. Essa continuidade é a base da compreensão moderna compreensão de vídeo e análise comportamental.

A mecânica dos sistemas de localização

A maioria dos sistemas MOT contemporâneos, incluindo aqueles equipados com a tecnologia de ponta YOLO26, operam com base no paradigma de "rastreamento por detecção". Esse fluxo de trabalho depende de um ciclo de detecção e associação para garantir alta precisão e mínima troca de identificação.

  1. Detecção: Em cada fotograma, um modelo de alta velocidade como o YOLO26 ou a geração anterior YOLO11 , faz a varredura da cena para localizar objetos, gerando caixas delimitadoras e probabilidades de classe.
  2. Previsão de movimento: para prever para onde um objeto se moverá a seguir, os algoritmos utilizam estimadores matemáticos como o Filtro de Kalman. Isso cria uma estimativa de estado com base na velocidade e na trajetória, estreitando a área de pesquisa para o quadro subsequente.
  3. Associação de dados: O sistema associa novas detecções a faixas existentes. Métodos de otimização, como o algoritmo húngaro resolvem esse problema de atribuição minimizando o "custo" da correspondência, geralmente usando Intersection over Union (IoU) para medir a sobreposição espacial.
  4. Reidentificação (ReID): Quando ocorrem obstruções visuais — conhecidas como oclusão— rastreadores avançados utilizam para para reconhecer o objeto quando ele reaparece, preservando a sua identificação original em vez de tratá-lo como uma nova entidade.

MOT vs. Conceitos relacionados

Compreender a distinção entre MOT e aprendizagem automática (ML) é crucial para selecionar a ferramenta certa.

  • vs. Detecção de objetos: a detecção responde "o quê e onde" em uma imagem estática. Se uma pessoa aparece no Quadro 1 e no Quadro 2, um detector vê duas pessoas separadas. O MOT as vincula, entendendo que é a mesma pessoa se movendo no tempo.
  • vs. Rastreamento de Objeto Único (SOT): O SOT concentra-se em seguir um alvo específico, geralmente inicializado manualmente por um utilizador, e rastreá-lo independentemente de outras distrações. O MOT é mais complexo, pois deve detect track de forma autónoma track número desconhecido e flutuante de objetos que entram e saem da cena, exigindo um gerenciamento de memória robusto gestão de memória .

Aplicações no Mundo Real

A capacidade de transformar feeds de vídeo em dados estruturados impulsiona a inovação em todos os setores, permitindo modelagem preditiva e a tomada de decisões automatizada.

  • Sistemas de transporte inteligentes: Na IA no setor automóvel , a MOT é essencial para carros autônomos e infraestrutura de cidades inteligentes. Ela permite estimativa de velocidade através da análise da distância percorrida por um veículo ao longo do tempo e ajuda a prevenir acidentes, prevendo as trajetórias de peões e ciclistas.
  • Análise de retalho: lojas físicas utilizam IA no retalho para analisar o comportamento dos compradores. Ao aplicar MOT para contagem de objetos, os retalhistas podem gerar mapas de calor de corredores de alto tráfego, monitorizar tempos de permanência e otimizar a gestão das filas para reduzir o tempo de espera no caixa.

Implementar o rastreio com Python

O ultralytics O pacote fornece uma interface perfeita para MOT, integrando algoritmos poderosos como BoT-SORT e ByteTrack. O exemplo a seguir demonstra como carregar um modelo e track em um fluxo de vídeo.

from ultralytics import YOLO

# Load a pre-trained YOLO model (YOLO11n is used here, YOLO26n is also supported)
model = YOLO("yolo11n.pt")

# Perform tracking on a video source
# 'persist=True' ensures tracks are maintained between frames
results = model.track(source="https://youtu.be/LNwODJXcvt4", persist=True, tracker="bytetrack.yaml")

# Visualize the first frame's results with IDs drawn
results[0].show()

Este fluxo de trabalho simples lida com a detecção, associação e atribuição de ID automaticamente, permitindo que os programadores se concentrem em lógica de nível superior, como contagem de regiões ou gatilhos comportamentais. Para obter mais detalhes sobre a configuração, consulte a documentação do modo de rastreamento.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora