Seguimento de múltiplos objectos (MOT)
Explore o rastreio de múltiplos objectos (MOT): track e reidentifique objectos em quadros de vídeo com YOLO11, filtros Kalman, correspondência de aspeto e associação de dados moderna.
O rastreio de múltiplos objectos (MOT) é uma tarefa fundamental na
visão computacional que envolve a deteção de múltiplas
entidades distintas num fluxo de vídeo e manter as suas identidades únicas em fotogramas consecutivos. Enquanto a
deteção de objectos padrão identifica o que está
identifica o que está presente numa única imagem estática, a MOT introduz uma dimensão temporal, respondendo à questão de onde
objectos específicos se movem ao longo do tempo. Ao atribuir um número de identificação (ID) persistente a cada instância detectada, a MOT permite aos
sistemas para analisar trajectórias, compreender interações e contar itens únicos, tornando-a um componente fundamental das
aplicações modernas de compreensão de vídeo.
A mecânica dos sistemas de localização
A maioria dos sistemas MOT de última geração, incluindo os alimentados por
YOLO11funcionam segundo um paradigma de "seguimento por deteção"
"por deteção". Este fluxo de trabalho separa o processo em fases distintas que se repetem em cada fotograma de vídeo para garantir uma elevada
precisão e continuidade.
-
Deteção: O sistema utiliza primeiro um modelo de alto desempenho para localizar objectos de interesse,
gerando caixas delimitadoras e
pontuações de confiança.
-
Previsão de movimento: Para associar as detecções entre quadros, algoritmos como o
Filtro de Kalman estimam a posição futura de um objeto
objeto com base na sua velocidade e localização passadas. Isto cria uma
que limita a área de pesquisa para o próximo
próximo fotograma.
-
Associação de dados: O sistema associa as novas detecções às pistas existentes. As técnicas de otimização
como o algoritmo húngaro resolvem este
problema de atribuição minimizando o custo da correspondência, calculando frequentemente a
Intersecção sobre a União (IoU) entre
entre o track previsto e a nova deteção.
-
Re-identificação (ReID): Em cenários em que os objectos se cruzam ou estão temporariamente ocultos - um
fenómeno conhecido como oclusão - os
avançados usam embeddings visuais para reconhecer o objeto
quando ele reaparece, evitando a troca de ID.
MOT vs. termos de visão computacional relacionados
É importante distinguir a MOT de conceitos semelhantes para selecionar a tecnologia adequada para um caso de utilização específico.
-
vs. Deteção de Objectos: A deteção trata cada fotograma como um evento independente. Se um veículo aparecer em
dois fotogramas consecutivos, um detetor vê duas instâncias separadas de um "carro". Em contraste,
rastreio de objectos liga estas instâncias,
reconhecendo-as como o mesmo veículo a mover-se no tempo.
-
vs. Seguimento de um único objeto (SOT): O SOT concentra-se em seguir um alvo específico inicializado pelo
pelo utilizador, ignorando frequentemente todas as outras actividades. O MOT é mais complexo, uma vez que tem de detect, track e gerir de forma autónoma um
e gerir um número desconhecido e flutuante de objectos que entram e saem de cena, exigindo uma
lógica robusta de gestão de memória.
Aplicações no Mundo Real
A capacidade de track vários objectos em simultâneo impulsiona a inovação em várias indústrias, convertendo dados de vídeo em bruto
em dados de vídeo em
em informações acionáveis de modelação preditiva.
-
Transportes inteligentes: No domínio da
IA no sector automóvel, a MOT é fundamental para a
condução autónoma e monitorização do tráfego. Permite aos sistemas efetuar
a estimativa da velocidade através do cálculo da distância que um
distância que um veículo percorre ao longo do tempo e ajuda a prever potenciais colisões, monitorizando as trajectórias de peões e
ciclistas.
-
Análise de retalho: As lojas de tijolo e cimento tiram partido da
IA no retalho para compreender o comportamento dos clientes. Ao
aplicar a MOT para uma contagem precisa de objectos,
os retalhistas podem medir o tráfego pedonal, analisar os tempos de permanência em corredores específicos e otimizar a
gestão de filas para melhorar a experiência de
experiência de compra.
-
Análise desportiva: Os treinadores e analistas utilizam o MOT para track os jogadores e a bola durante os jogos. Estes
dados facilitam a análise avançada da estimativa da pose, ajudando as
as equipas a compreender as formações, a fadiga dos jogadores e a dinâmica do jogo em
em cenários de inferência em tempo real.
Implementar o rastreio com Python
O ultralytics simplifica a complexidade do MOT, integrando poderosos rastreadores como o
BoT-SORT e
ByteTrack diretamente na previsão
de previsão. Esses rastreadores podem ser trocados facilmente por meio de argumentos.
O exemplo seguinte demonstra como carregar um modelo YOLO11 pré-treinado e aplicar o rastreio a um ficheiro de vídeo:
from ultralytics import YOLO
# Load an official YOLO11 model pretrained on COCO
model = YOLO("yolo11n.pt")
# Perform tracking on a video file
# 'persist=True' ensures IDs are maintained between frames
# 'tracker' allows selection of algorithms like 'bytetrack.yaml' or 'botsort.yaml'
results = model.track(source="traffic_analysis.mp4", persist=True, tracker="bytetrack.yaml")
# Visualize the results
for result in results:
result.show()
Este código trata de todo o pipeline, desde a deteção até à atribuição de ID, permitindo que os programadores se concentrem na lógica de alto nível
de alto nível, como contagem de regiões ou
comportamental. Para personalização adicional, consulte a documentação do
documentação do modo de rastreamento.