Глоссарий

OpenCV

Изучите основные возможности OpenCVдля обработки изображений в реальном времени. Узнайте, как интегрировать его с Ultralytics для создания мощных приложений компьютерного зрения.

OpenCV Open Source Computer Vision Library) — широко используемая библиотека программного обеспечения с открытым исходным кодом, разработанная специально для компьютерного зрения (CV) в реальном времени и обработки изображений . Первоначально разработанная Intel 1999 году, она превратилась в стандартный инструмент для исследователей и разработчиков, предоставляющий более 2500 оптимизированных алгоритмов. Эти алгоритмы позволяют компьютерам воспринимать и понимать визуальные данные из окружающего мира, выполняя задачи от базовой обработки изображений до сложных выводов машинного обучения (ML). Написанная на C++ для обеспечения высокой производительности, OpenCV надежные связки для таких языков, как Python, Java и MATLAB, что делает ее доступной для быстрого прототипирования и крупномасштабного развертывания.

Основные возможности и функции

OpenCV основополагающим уровнем в экосистеме ИИ, часто обрабатывая этапы предварительной обработки данных, необходимые перед тем, как визуальные данные поступают в модели глубокого обучения. Его функциональность охватывает несколько критически важных областей:

Обработка изображений: Библиотека отлично справляется с низкоуровневой манипуляцией пикселями. Сюда входят пороговое значение, фильтрация, изменение размера и преобразование цветового пространства (например, преобразование RGB в оттенки серого). Эти операции необходимы для нормализации данных , чтобы обеспечить согласованность входных данных модели.
Обнаружение признаков: OpenCV инструменты для идентификации ключевых точек в изображении, таких как углы, края и пятна. Алгоритмы, такие как SIFT (Scale-Invariant Feature Transform) и ORB, позволяют системам сопоставлять признаки на разных изображениях, что жизненно важно для сшивки изображений и создания панорам.
Анализ видео: помимо статических изображений, библиотека обрабатывает видеопотоки для таких задач, как вычитание фона и оптический поток, который отслеживает движение объектов между последовательными кадрами.
Геометрические преобразования: позволяет разработчикам выполнять аффинные преобразования, искажение перспективы и калибровку камеры для коррекции искажений объектива, что имеет решающее значение для автономных транспортных средств и робототехники.

Применение в реальном мире

OpenCV широко OpenCV во всех отраслях промышленности, часто в сочетании с фреймворками глубокого обучения.

Медицинская визуализация: в здравоохранении OpenCV в анализе медицинских изображений путем улучшения качества рентгеновских или МРТ-сканов. Он может автоматически detect или segment , помогая врачам в диагностике. Например, алгоритмы обнаружения краев помогают определить границы перелома кости на рентгеновском снимке.
Автоматизированный контроль в производстве: заводы используют OpenCV контроля качества. Камеры на сборочных линиях используют библиотеку для проверки правильности расположения этикеток или наличия дефектов на поверхности продукции . Сравнивая изображение в реальном времени с эталонным, система может мгновенно выявлять бракованные изделия.

OpenCV против фреймворков глубокого обучения

Важно отличать OpenCV фреймворков глубокого обучения, таких как PyTorch или TensorFlow.

OpenCV сосредоточен на традиционных методах компьютерного зрения (фильтрация, геометрические преобразования) и «классических» алгоритмах машинного обучения (таких как методы опорных векторов или k-ближайших соседей). Хотя он имеет модуль глубокой нейронной сети (DNN) для вывода, он в первую очередь не используется для обучения больших нейронных сетей.
Фреймворки глубокого обучения предназначены для построения, обучения и развертывания сложных нейронных сетей, таких как сверточные нейронные сети (CNN).

В современных рабочих процессах эти инструменты дополняют друг друга. Например, разработчик может использовать OpenCV чтения видеопотока и изменения размера кадров, затем передать эти кадры в модель YOLO26 для обнаружения объектов и, наконец, OpenCV использовать OpenCV для рисования ограничительных рамок на выходе.

Интеграция с Ultralytics YOLO

OpenCV часто OpenCV вместе с ultralytics пакет для управления видеопотоками и визуализации результатов. Интеграция позволяет осуществлять эффективное вычисление в реальном времени.

Следующий пример демонстрирует, как использовать OpenCV открытия видеофайла, обработки кадров и применения модели YOLO26n для обнаружения.

import cv2
from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Open the video file using OpenCV
cap = cv2.VideoCapture("path/to/video.mp4")

while cap.isOpened():
    success, frame = cap.read()
    if not success:
        break

    # Run YOLO26 inference on the frame
    results = model(frame)

    # Visualize the results on the frame
    annotated_frame = results[0].plot()

    # Display the annotated frame
    cv2.imshow("YOLO26 Inference", annotated_frame)

    # Break loop if 'q' is pressed
    if cv2.waitKey(1) & 0xFF == ord("q"):
        break

cap.release()
cv2.destroyAllWindows()

Развитие компьютерного зрения

OpenCV развиваться, поддерживая новые стандарты и аппаратное ускорение. Его обширное сообщество вносит вклад в создание богатой экосистемы учебных материалов и документации. Для команд, стремящихся масштабировать свои проекты в области компьютерного зрения от локальных прототипов до облачных решений, Ultralytics предлагает комплексные инструменты для управления наборами данных и обучения моделей, которые легко интегрируются с конвейерами предварительной обработки OpenCV . Будь то системы безопасности с распознаванием лиц или оценка позы в спортивной аналитике, OpenCV незаменимым инструментом в арсенале разработчиков ИИ.

OpenCV

Обучение моделям Ultralytics YOLO для оптимизации рабочих процессов в разных отраслях

Гибкое корпоративное лицензирование для развития ваших инноваций

Обучайте модели искусственного интеллекта за считанные секунды с помощью Ultralytics YOLO

Основные возможности и функции

Применение в реальном мире

OpenCV против фреймворков глубокого обучения

Интеграция с Ultralytics YOLO

Развитие компьютерного зрения

Читать больше в этой категории

12 примеров использования аэрофотоснимков с помощью компьютерного зрения

Что такое монокулярная оценка глубины? Обзор

Обзор использованияYOLO Ultralytics YOLO для обнаружения угроз с помощью искусственного интеллекта

Присоединяйтесь к сообществу Ultralytics