Glossario

OpenCV

Esplora le funzionalità principali OpenCVper l'elaborazione delle immagini in tempo reale. Scopri come integrarlo con Ultralytics per potenti applicazioni di visione artificiale.

OpenCV Open Source Computer Vision Library) è una libreria software open source ampiamente utilizzata, progettata specificamente per la visione artificiale (CV) in tempo reale e l'elaborazione delle immagini . Sviluppata originariamente da Intel 1999, si è evoluta fino a diventare uno strumento standard per ricercatori e sviluppatori, fornendo oltre 2.500 algoritmi ottimizzati. Questi algoritmi consentono ai computer di percepire e comprendere i dati visivi provenienti dal mondo, eseguendo attività che vanno dalla manipolazione di immagini di base alla complessa inferenza di machine learning (ML). Scritto in C++ per garantire prestazioni elevate, OpenCV robusti collegamenti per linguaggi come Python, Java e MATLAB, rendendolo accessibile per la prototipazione rapida e l'implementazione su larga scala.

Funzionalità e caratteristiche principali

OpenCV da livello fondamentale nell'ecosistema dell'intelligenza artificiale, spesso gestendo le fasi di pre-elaborazione dei dati necessarie prima che i dati visivi entrino nei modelli di deep learning. La sua funzionalità copre diverse aree critiche:

Elaborazione delle immagini: La libreria eccelle nella manipolazione dei pixel a basso livello. Ciò include soglia, filtraggio, ridimensionamento e conversione dello spazio colore (ad esempio, conversione da RGB a scala di grigi). Queste operazioni sono essenziali per normalizzare i dati e garantire un input coerente del modello.
Rilevamento delle caratteristiche: OpenCV strumenti per identificare i punti chiave di un'immagine, come angoli, bordi e blob. Algoritmi come SIFT (Scale-Invariant Feature Transform) e ORB consentono ai sistemi di abbinare le caratteristiche di immagini diverse, il che è fondamentale per l'unione delle immagini e la creazione di panoramiche.
Analisi video: oltre alle immagini statiche, la libreria gestisce flussi video per attività quali la sottrazione dello sfondo e il flusso ottico, che traccia il movimento degli oggetti tra fotogrammi consecutivi.
Trasformazioni geometriche: consente agli sviluppatori di eseguire trasformazioni affini, distorsione prospettica e calibrazione della fotocamera per correggere la distorsione dell'obiettivo, fondamentale per i veicoli autonomi e la robotica.

Applicazioni nel mondo reale

OpenCV onnipresente in tutti i settori industriali e spesso lavora in tandem con i framework di deep learning.

Imaging medico: nel settore sanitario, OpenCV nell' analisi delle immagini mediche migliorando le radiografie o le scansioni MRI. È in grado di detect automaticamente detect o segment , assistendo i medici nella diagnosi. Ad esempio, gli algoritmi di rilevamento dei bordi aiutano a delineare i confini di una frattura ossea in una radiografia.
Ispezione automatizzata nella produzione: le fabbriche utilizzano OpenCV il controllo qualità. Le telecamere sulle linee di assemblaggio utilizzano la libreria per verificare se le etichette sono allineate correttamente o se i prodotti presentano difetti superficiali . Confrontando il feed live con un'immagine di riferimento, il sistema è in grado di segnalare immediatamente gli articoli difettosi.

OpenCV contro i framework di apprendimento profondo

È importante distinguere OpenCV framework di deep learning come PyTorch o TensorFlow.

OpenCV si concentra sulle tecniche tradizionali di visione artificiale (filtraggio, trasformazioni geometriche) e sugli algoritmi "classici" di apprendimento automatico (come Support Vector Machines o k-Nearest Neighbors). Sebbene disponga di un modulo Deep Neural Network (DNN) per l'inferenza, non viene utilizzato principalmente per l'addestramento di grandi reti neurali .
I framework di deep learning sono progettati per la creazione, l'addestramento e l'implementazione di reti neurali complesse come le reti neurali convoluzionali (CNN).

Nei flussi di lavoro moderni, questi strumenti si completano a vicenda. Ad esempio, uno sviluppatore potrebbe utilizzare OpenCV leggere un flusso video e ridimensionare i fotogrammi, quindi passare tali fotogrammi a un modello YOLO26 per il rilevamento degli oggetti e infine utilizzare OpenCV per disegnare i riquadri di delimitazione sull'output.

Integrazione con Ultralytics YOLO

OpenCV spesso utilizzato insieme al ultralytics pacchetto per gestire i flussi video e visualizzare i risultati. L'integrazione consente un'efficiente inferenza in tempo reale.

L'esempio seguente mostra come utilizzare OpenCV aprire un file video, elaborare i fotogrammi e applicare un modello YOLO26n per il rilevamento.

import cv2
from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Open the video file using OpenCV
cap = cv2.VideoCapture("path/to/video.mp4")

while cap.isOpened():
    success, frame = cap.read()
    if not success:
        break

    # Run YOLO26 inference on the frame
    results = model(frame)

    # Visualize the results on the frame
    annotated_frame = results[0].plot()

    # Display the annotated frame
    cv2.imshow("YOLO26 Inference", annotated_frame)

    # Break loop if 'q' is pressed
    if cv2.waitKey(1) & 0xFF == ord("q"):
        break

cap.release()
cv2.destroyAllWindows()

Il progresso della visione artificiale

OpenCV ad evolversi, supportando standard più recenti e accelerazioni hardware. La sua vasta comunità contribuisce a un ricco ecosistema di tutorial e documentazione. Per i team che desiderano scalare i propri progetti di visione artificiale da prototipi locali a soluzioni basate su cloud, la Ultralytics offre strumenti completi per la gestione dei set di dati e l'addestramento dei modelli che si integrano perfettamente con le pipeline di pre-elaborazione OpenCV . Che si tratti di sistemi di sicurezza con riconoscimento facciale o di stima della postura nell'analisi sportiva, OpenCV uno strumento essenziale nel toolkit degli sviluppatori di IA.

OpenCV

Addestrare i modelliYOLO di Ultralytics per ottimizzare i flussi di lavoro in tutti i settori industriali

Soluzione di licenza aziendale flessibile per potenziare la tua innovazione

Addestrare modelli di intelligenza artificiale in pochi secondi con Ultralytics YOLO

Funzionalità e caratteristiche principali

Applicazioni nel mondo reale

OpenCV contro i framework di apprendimento profondo

Integrazione con Ultralytics YOLO

Il progresso della visione artificiale

Leggi di più in questa categoria

12 casi d'uso delle immagini aeree basati sulla visione artificiale

Che cos'è la stima della profondità monoculare? Una panoramica

Uno sguardo all'utilizzoYOLO Ultralytics per il rilevamento delle minacce tramite IA

Unitevi alla comunità di Ultralytics