Glossário

Fluxo Óptico

Descubra o poder do Fluxo Óptico na visão computacional. Aprenda como ele estima o movimento, aprimora a análise de vídeo e impulsiona inovações em IA.

O fluxo ótico é um conceito fundamental em visão computacional que envolve estimar o movimento aparente de objectos, superfícies e arestas numa cena visual. Este movimento é calculado com base no movimento relativo entre um observador (como uma câmara) e a própria cena. O resultado deste processo é um campo vetorial campo de vectores em que cada vetor representa o deslocamento de um pixel ou elemento entre duas imagens de vídeo consecutivas. Ao analisar estes vectores de movimento, os sistemas podem obter uma compreensão granular e de baixo nível da dinâmica da cena, respondendo respondendo à questão crítica de "como" os pixéis se estão a mover ao longo do tempo.

Mecanismos principais do fluxo ótico

O cálculo do fluxo ótico baseia-se normalmente no pressuposto de "constância de brilho". Este princípio Este princípio pressupõe que a intensidade do pixel de um ponto específico de um objeto permanece constante entre fotogramas consecutivos, mesmo quando mesmo quando o objeto se move. Os algoritmos utilizam este pressuposto para track a deslocação. Existem duas abordagens principais para determinar estes campos de movimento:

Fluxo ótico denso: Este método calcula um vetor de movimento para cada pixel de uma imagem. Fornece um mapa de movimento abrangente, mapa de movimento de alta resolução, que é essencial para tarefas de pormenor como segmentação de imagens e restauração vídeo. Embora computacionalmente intensivo, os aprendizagem profunda modernos, tais como RAFT (Recurrent All-Pairs Field Transforms) têm alcançaram um desempenho topo de gama na estimativa de densidade, ultrapassando os métodos matemáticos tradicionais.
Fluxo ótico esparso: Em vez de analisar toda a imagem, os métodos esparsos track um conjunto selecionado de caraterísticas distintas, como cantos ou cantos ou arestas, frequentemente identificados com extração de caraterísticas de extração de caraterísticas. Algoritmos como o método Lucas-Kanade são fundamentais nesta categoria. Como processam menos pontos de dados pontos de dados, os métodos esparsos são altamente eficientes e adequados para inferência em tempo real em tempo real, onde a velocidade tem prioridade sobre a densidade.

Fluxo Óptico vs. Rastreamento de Objetos

É importante distinguir entre fluxo ótico e rastreio de objectosuma vez que têm finalidades diferentes num pipeline de visão. O fluxo ótico é uma operação de baixo nível que descreve o movimento movimento instantâneo de pixéis sem compreender o que esses pixéis representam. Não mantém inerentemente a identidade de um identidade de um objeto ao longo do tempo.

Em contraste, o seguimento de objectos é uma tarefa de alto nível que localiza entidades específicas e lhes atribui uma identificação consistente consistente em todos os fotogramas. Modos avançados de rastreamento, como os disponíveis no Ultralytics YOLO11normalmente efectuam deteção de objectos de objectos e depois utilizam pistas de movimento para associar as detecções. Enquanto um localizador pode utilizar internamente o fluxo ótico para prever a posição, o objetivo do localizador é a persistência da identidade ("Para onde foi o carro #4?"), enquanto o objetivo do fluxo ótico é o mapeamento do movimento movimento ("A que velocidade estão estes pixéis a mover-se para a direita?").

Aplicações do mundo real em IA

O fluxo ótico é uma ferramenta versátil utilizada em várias indústrias para resolver problemas complexos relacionados com o movimento.

Sistemas Autónomos e Robótica: No domínio dos veículos autónomoso fluxo ótico é utilizado para a odometria visual - estimar o movimento do próprio veículo em relação ao mundo. Ajuda na ajuda a detetar obstáculos em movimento que podem passar despercebidos pela deteção estática, contribuindo para uma navegação mais segura. Do mesmo modo, em robóticaos agentes utilizam o fluxo para manipular objectos e navegar em ambientes dinâmicos utilizando estruturas como ROS.
Reconhecimento de acções: A análise dos padrões temporais do movimento permite aos sistemas de IA reconhecer acções humanas complexas. Por exemplo, em tecnologia de fitness inteligenteo fluxo ótico pode ajudar a aperfeiçoar estimativa da pose assegurando que os movimentos dos membros movimentos dos membros são seguidos suavemente entre fotogramas, identificando exercícios como agachamentos ou balanços de ténis.
Estabilização e compressão de vídeo: Os produtos electrónicos de consumo dependem fortemente da estimativa de fluxo. A estabilização eletrónica da imagem (EIS) utiliza vectores de fluxo para compensar a vibração da câmara. Além disso, as normas de compressão de vídeo como o MPEG utilizam a estimativa de movimento para reduzir o tamanho dos ficheiros, codificando apenas as diferenças (resíduos) entre os fotogramas, em vez dos fotogramas completos propriamente ditos.
Imagiologia médica: Em análise de imagens médicaso fluxo ótico é aplicado para track a deformação dos tecidos, como o batimento de um coração num ecocardiograma. Isto ajuda os médicos a quantificar a função dos órgãos e a detetar anomalias que são invisíveis em imagens estáticas.

Exemplo de implementação

O seguinte exemplo Python demonstra como calcular o fluxo ótico denso utilizando o OpenCV biblioteca. Este exemplo utiliza o algoritmo Gunnar Farneback, um método popular para a estimativa de fluxo denso.

import cv2
import numpy as np

# Load two consecutive frames (ensure these files exist)
frame1 = cv2.imread("frame1.jpg")
frame2 = cv2.imread("frame2.jpg")

# Convert frames to grayscale
prvs = cv2.cvtColor(frame1, cv2.COLOR_BGR2GRAY)
next = cv2.cvtColor(frame2, cv2.COLOR_BGR2GRAY)

# Calculate dense optical flow using Farneback's algorithm
flow = cv2.calcOpticalFlowFarneback(prvs, next, None, 0.5, 3, 15, 3, 5, 1.2, 0)

# Compute magnitude and angle of 2D vectors
mag, ang = cv2.cartToPolar(flow[..., 0], flow[..., 1])

print(f"Flow shape: {flow.shape}")  # Output: (Height, Width, 2)
print(f"Max motion magnitude: {np.max(mag):.2f} pixels")

Para utilizadores que pretendem integrar a análise de movimento com a deteção de objectos, modelos de deteçãoUltralytics podem ser combinados com algoritmos de fluxo para criar pipelines analíticos robustos. Enquanto o fluxo ótico fornece os dados brutos de movimento, modelos de nível superior como o YOLO11 fornecem a compreensão semântica necessária para interpretar esse movimento de forma eficaz. A I&D em curso em modelos como o YOLO26 tem como objetivo unificar ainda mais a compreensão espacial e e temporal para uma análise de vídeo de ponta a ponta ainda mais rápida.

Fluxo Óptico

Treine os modelosYOLO Ultralytics para simplificar os fluxos de trabalho em todos os sectores

Solução de licenciamento empresarial flexível para impulsionar sua inovação

Treine modelos de IA em segundos com o Ultralytics YOLO

Mecanismos principais do fluxo ótico

Fluxo Óptico vs. Rastreamento de Objetos

Aplicações do mundo real em IA

Exemplo de implementação

Leia mais nesta categoria

Compreender por que a anotação humana no ciclo é fundamental

O que é destilação de conjuntos de dados? Uma rápida visão geral

Os óculos Oakley Meta AI estão a redefinir os óculos com a Vision AI

Junte-se à comunidade Ultralytics