Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Seguimento de múltiplos objectos (MOT)

Explore o rastreio de múltiplos objectos (MOT): track e reidentifique objectos em quadros de vídeo com YOLO11, filtros Kalman, correspondência de aspeto e associação de dados moderna.

O rastreio de múltiplos objectos (MOT) é uma tarefa fundamental na visão computacional que envolve a deteção de múltiplas entidades distintas num fluxo de vídeo e manter as suas identidades únicas em fotogramas consecutivos. Enquanto a deteção de objectos padrão identifica o que está identifica o que está presente numa única imagem estática, a MOT introduz uma dimensão temporal, respondendo à questão de onde objectos específicos se movem ao longo do tempo. Ao atribuir um número de identificação (ID) persistente a cada instância detectada, a MOT permite aos sistemas para analisar trajectórias, compreender interações e contar itens únicos, tornando-a um componente fundamental das aplicações modernas de compreensão de vídeo.

A mecânica dos sistemas de localização

A maioria dos sistemas MOT de última geração, incluindo os alimentados por YOLO11funcionam segundo um paradigma de "seguimento por deteção" "por deteção". Este fluxo de trabalho separa o processo em fases distintas que se repetem em cada fotograma de vídeo para garantir uma elevada precisão e continuidade.

  1. Deteção: O sistema utiliza primeiro um modelo de alto desempenho para localizar objectos de interesse, gerando caixas delimitadoras e pontuações de confiança.
  2. Previsão de movimento: Para associar as detecções entre quadros, algoritmos como o Filtro de Kalman estimam a posição futura de um objeto objeto com base na sua velocidade e localização passadas. Isto cria uma que limita a área de pesquisa para o próximo próximo fotograma.
  3. Associação de dados: O sistema associa as novas detecções às pistas existentes. As técnicas de otimização como o algoritmo húngaro resolvem este problema de atribuição minimizando o custo da correspondência, calculando frequentemente a Intersecção sobre a União (IoU) entre entre o track previsto e a nova deteção.
  4. Re-identificação (ReID): Em cenários em que os objectos se cruzam ou estão temporariamente ocultos - um fenómeno conhecido como oclusão - os avançados usam embeddings visuais para reconhecer o objeto quando ele reaparece, evitando a troca de ID.

MOT vs. termos de visão computacional relacionados

É importante distinguir a MOT de conceitos semelhantes para selecionar a tecnologia adequada para um caso de utilização específico.

  • vs. Deteção de Objectos: A deteção trata cada fotograma como um evento independente. Se um veículo aparecer em dois fotogramas consecutivos, um detetor vê duas instâncias separadas de um "carro". Em contraste, rastreio de objectos liga estas instâncias, reconhecendo-as como o mesmo veículo a mover-se no tempo.
  • vs. Seguimento de um único objeto (SOT): O SOT concentra-se em seguir um alvo específico inicializado pelo pelo utilizador, ignorando frequentemente todas as outras actividades. O MOT é mais complexo, uma vez que tem de detect, track e gerir de forma autónoma um e gerir um número desconhecido e flutuante de objectos que entram e saem de cena, exigindo uma lógica robusta de gestão de memória.

Aplicações no Mundo Real

A capacidade de track vários objectos em simultâneo impulsiona a inovação em várias indústrias, convertendo dados de vídeo em bruto em dados de vídeo em em informações acionáveis de modelação preditiva.

  • Transportes inteligentes: No domínio da IA no sector automóvel, a MOT é fundamental para a condução autónoma e monitorização do tráfego. Permite aos sistemas efetuar a estimativa da velocidade através do cálculo da distância que um distância que um veículo percorre ao longo do tempo e ajuda a prever potenciais colisões, monitorizando as trajectórias de peões e ciclistas.
  • Análise de retalho: As lojas de tijolo e cimento tiram partido da IA no retalho para compreender o comportamento dos clientes. Ao aplicar a MOT para uma contagem precisa de objectos, os retalhistas podem medir o tráfego pedonal, analisar os tempos de permanência em corredores específicos e otimizar a gestão de filas para melhorar a experiência de experiência de compra.
  • Análise desportiva: Os treinadores e analistas utilizam o MOT para track os jogadores e a bola durante os jogos. Estes dados facilitam a análise avançada da estimativa da pose, ajudando as as equipas a compreender as formações, a fadiga dos jogadores e a dinâmica do jogo em em cenários de inferência em tempo real.

Implementar o rastreio com Python

O ultralytics simplifica a complexidade do MOT, integrando poderosos rastreadores como o BoT-SORT e ByteTrack diretamente na previsão de previsão. Esses rastreadores podem ser trocados facilmente por meio de argumentos.

O exemplo seguinte demonstra como carregar um modelo YOLO11 pré-treinado e aplicar o rastreio a um ficheiro de vídeo:

from ultralytics import YOLO

# Load an official YOLO11 model pretrained on COCO
model = YOLO("yolo11n.pt")

# Perform tracking on a video file
# 'persist=True' ensures IDs are maintained between frames
# 'tracker' allows selection of algorithms like 'bytetrack.yaml' or 'botsort.yaml'
results = model.track(source="traffic_analysis.mp4", persist=True, tracker="bytetrack.yaml")

# Visualize the results
for result in results:
    result.show()

Este código trata de todo o pipeline, desde a deteção até à atribuição de ID, permitindo que os programadores se concentrem na lógica de alto nível de alto nível, como contagem de regiões ou comportamental. Para personalização adicional, consulte a documentação do documentação do modo de rastreamento.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora