Explore o rastreio de múltiplos objectos (MOT): track e reidentifique objectos em quadros de vídeo com YOLO11, filtros Kalman, correspondência de aspeto e associação de dados moderna.
O rastreamento de múltiplos objetos (MOT) é uma capacidade sofisticada em visão computacional (CV) que permite que os sistemas detect, identifiquem e sigam várias entidades únicas em uma sequência de quadros de vídeo. Ao contrário da detecção de objetos padrão detecção de objetos, que trata cada fotograma de imagem como um evento isolado, o MOT introduz uma dimensão temporal à inteligência artificial (IA). Ao atribuir um número de identificação (ID) persistente a cada instância detetada — como um carro específico no trânsito ou um jogador num campo desportivo —, o MOT permite que os algoritmos mantenham a identidade dos objetos à medida que se movem, interagem e até desaparecem temporariamente atrás de obstruções. Essa continuidade é a base da compreensão moderna compreensão de vídeo e análise comportamental.
A maioria dos sistemas MOT contemporâneos, incluindo aqueles equipados com a tecnologia de ponta YOLO26, operam com base no paradigma de "rastreamento por detecção". Esse fluxo de trabalho depende de um ciclo de detecção e associação para garantir alta precisão e mínima troca de identificação.
Compreender a distinção entre MOT e aprendizagem automática (ML) é crucial para selecionar a ferramenta certa.
A capacidade de transformar feeds de vídeo em dados estruturados impulsiona a inovação em todos os setores, permitindo modelagem preditiva e a tomada de decisões automatizada.
O ultralytics O pacote fornece uma interface perfeita para MOT, integrando algoritmos poderosos como
BoT-SORT e
ByteTrack. O exemplo a seguir demonstra como carregar um modelo e track em um fluxo de vídeo.
from ultralytics import YOLO
# Load a pre-trained YOLO model (YOLO11n is used here, YOLO26n is also supported)
model = YOLO("yolo11n.pt")
# Perform tracking on a video source
# 'persist=True' ensures tracks are maintained between frames
results = model.track(source="https://youtu.be/LNwODJXcvt4", persist=True, tracker="bytetrack.yaml")
# Visualize the first frame's results with IDs drawn
results[0].show()
Este fluxo de trabalho simples lida com a detecção, associação e atribuição de ID automaticamente, permitindo que os programadores se concentrem em lógica de nível superior, como contagem de regiões ou gatilhos comportamentais. Para obter mais detalhes sobre a configuração, consulte a documentação do modo de rastreamento.