Glossário

OpenCV

Explore os principais recursos OpenCVpara processamento de imagens em tempo real. Aprenda a integrá-lo ao Ultralytics para criar aplicativos poderosos de visão computacional.

OpenCV Open Source Computer Vision Library) é uma biblioteca de software de código aberto amplamente utilizada, projetada especificamente para visão computacional (CV) em tempo real e processamento de imagens . Originalmente desenvolvida pela Intel 1999, ela evoluiu para uma ferramenta padrão para pesquisadores e desenvolvedores, fornecendo mais de 2.500 algoritmos otimizados. Esses algoritmos permitem que os computadores percebam e compreendam dados visuais do mundo, realizando tarefas que vão desde a manipulação básica de imagens até a complexa inferência de aprendizado de máquina (ML). Escrito em C++ para alto desempenho, OpenCV ligações robustas para linguagens como Python, Java e MATLAB, tornando-o acessível para prototipagem rápida e implantação em grande escala.

Principais capacidades e funcionalidades

OpenCV como uma camada fundamental no ecossistema de IA, frequentemente lidando com as etapas de pré-processamento de dados necessárias antes que os dados visuais entrem nos modelos de aprendizagem profunda. A sua funcionalidade abrange várias áreas críticas:

Processamento de imagens: A biblioteca se destaca na manipulação de pixels de baixo nível. Isso inclui limiarização, filtragem, redimensionamento e conversão de espaço de cor (por exemplo, conversão de RGB para escala de cinza). Essas operações são essenciais para normalizar os dados e garantir uma entrada consistente no modelo.
Detecção de características: OpenCV ferramentas para identificar pontos-chave numa imagem, como cantos, bordas e manchas. Algoritmos como SIFT (Scale-Invariant Feature Transform) e ORB permitem que os sistemas correspondam características em diferentes imagens, o que é vital para a junção de imagens e a criação de panoramas.
Análise de vídeo: Além das imagens estáticas, a biblioteca lida com fluxos de vídeo para tarefas como subtração de fundo e fluxo ótico, que rastreia o movimento de objetos entre quadros consecutivos.
Transformações geométricas: permite que os programadores realizem transformações afins, distorção de perspetiva e calibração da câmara para corrigir a distorção da lente, o que é crucial para veículos autónomos e robótica.

Aplicações no Mundo Real

OpenCV onipresente em todos os setores, frequentemente trabalhando em conjunto com estruturas de aprendizagem profunda.

Imagem médica: Na área da saúde, OpenCV na análise de imagens médicas, aprimorando raios-X ou ressonâncias magnéticas. Ele pode detect ou segment automaticamente, auxiliando os médicos no diagnóstico. Por exemplo, algoritmos de detecção de bordas ajudam a delinear os limites de uma fratura óssea em um raio-X.
Inspeção automatizada na produção: as fábricas utilizam OpenCV controlo de qualidade. As câmaras nas linhas de montagem utilizam a biblioteca para verificar se as etiquetas estão alinhadas corretamente ou se os produtos têm defeitos na superfície . Ao comparar a transmissão ao vivo com uma imagem de referência, o sistema pode sinalizar instantaneamente os itens com defeito.

OpenCV vs. Frameworks de aprendizagem profunda

É importante distinguir OpenCV estruturas de aprendizagem profunda como PyTorch ou TensorFlow.

OpenCV concentra-se em técnicas tradicionais de visão computacional (filtragem, transformações geométricas) e algoritmos "clássicos" de aprendizagem automática (como máquinas de vetores de suporte ou k-vizinhos mais próximos). Embora tenha um módulo de rede neural profunda (DNN) para inferência, não é usado principalmente para treinar grandes redes neurais .
As estruturas de aprendizagem profunda são concebidas para construir, treinar e implementar redes neurais complexas como as redes neurais convolucionais (CNNs).

Nos fluxos de trabalho modernos, essas ferramentas complementam-se. Por exemplo, um programador pode usar OpenCV ler um fluxo de vídeo e redimensionar quadros, depois passar esses quadros para um modelo YOLO26 para detecção de objetos e, finalmente, usar OpenCV para desenhar caixas delimitadoras na saída.

Integração com o Ultralytics YOLO

OpenCV frequentemente utilizado em conjunto com o ultralytics pacote para gerir fluxos de vídeo e visualizar resultados. A integração permite uma inferência eficiente em tempo real.

O exemplo a seguir demonstra como usar OpenCV abrir um ficheiro de vídeo, processar fotogramas e aplicar um modelo YOLO26n para detecção.

import cv2
from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Open the video file using OpenCV
cap = cv2.VideoCapture("path/to/video.mp4")

while cap.isOpened():
    success, frame = cap.read()
    if not success:
        break

    # Run YOLO26 inference on the frame
    results = model(frame)

    # Visualize the results on the frame
    annotated_frame = results[0].plot()

    # Display the annotated frame
    cv2.imshow("YOLO26 Inference", annotated_frame)

    # Break loop if 'q' is pressed
    if cv2.waitKey(1) & 0xFF == ord("q"):
        break

cap.release()
cv2.destroyAllWindows()

Avanços na visão computacional

OpenCV a evoluir, suportando novos padrões e acelerações de hardware. A sua vasta comunidade contribui para um rico ecossistema de tutoriais e documentação. Para equipas que procuram expandir os seus projetos de visão computacional de protótipos locais para soluções baseadas na nuvem, a Ultralytics oferece ferramentas abrangentes para gestão de conjuntos de dados e treinamento de modelos que se integram perfeitamente com pipelines de pré-processamento OpenCV . Seja para sistemas de segurança com reconhecimento facial ou estimativa de poses em análises desportivas, OpenCV um utilitário essencial no kit de ferramentas dos desenvolvedores de IA.

OpenCV

Treine os modelosYOLO Ultralytics para simplificar os fluxos de trabalho em todos os sectores

Solução de licenciamento empresarial flexível para impulsionar sua inovação

Treine modelos de IA em segundos com o Ultralytics YOLO

Principais capacidades e funcionalidades

Aplicações no Mundo Real

OpenCV vs. Frameworks de aprendizagem profunda

Integração com o Ultralytics YOLO

Avanços na visão computacional

Leia mais nesta categoria

12 casos de uso de imagens aéreas com tecnologia de visão computacional

O que é a estimativa de profundidade monocular? Uma visão geral

Uma análise sobre o usoYOLO Ultralytics para deteção de ameaças por IA

Junte-se à comunidade Ultralytics