Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Компьютерное зрение (CV)

Раскройте потенциал ИИ с помощью компьютерного зрения! Узнайте о его роли в обнаружении объектов, здравоохранении, самоуправляемых автомобилях и многом другом. Узнайте больше прямо сейчас!

Компьютерное зрение (КЗ) - это преобразующая область искусственного интеллекта (ИИ), которая позволяет компьютерам воспринимать, интерпретировать и понимать визуальный мир. Обрабатывая цифровые изображения, видео и другие визуальные данные, машины могут извлекать значимую информацию и предпринимать действия или давать рекомендации на основе этого анализа. анализ. В то время как человеческое зрение полагается на глаз и мозг для мгновенного определения контекста окружающей обстановки, компьютерное зрение использует передовое программное обеспечение и алгоритмы машинного обучения (ML) для воспроизведения Это позволяет системам автоматизировать задачи, которые раньше требовали человеческого зрения.

Как работает компьютерное зрение

В своей основе компьютерное зрение опирается на методы распознавания образов для понимания визуальных данные. Ранние попытки заключались в ручном кодировании правил для определения объектов, но современное компьютерное зрение опирается на глубокое обучение (ГОО) и огромные объемы обучающих данных. Наиболее распространенной архитектурой, используемой сегодня, является Конволюционная нейронная сеть (CNN), которая обрабатывает изображения пиксель за пикселем. Эти сети определяют низкоуровневые признаки, такие как края и текстуры, в начальных слоях и объединяют их для распознавания сложных концепций - например, лиц или автомобилей - в более глубоких слоях. Этот процесс требует огромных наборов данных с метками, чтобы научить модель эффективно различать различные категории.

Основные задачи в области компьютерного зрения

Компьютерное зрение - это не одно действие, а совокупность специфических задач, решающих различные проблемы:

  • Обнаружение объектов: Эта задача включает в себя идентификация и определение местоположения объектов в изображении или видеопотоке. Она рисует ограничительные рамки вокруг обнаруженных объектов и присваивает им метку класса, например "человек" или "велосипед".
  • Классификация изображений: Система Система анализирует все изображение и присваивает ему единую метку на основе его доминирующего содержания. Например, классификация фотографии как "пейзаж" или "портрет".
  • Сегментация экземпляров: Более глубокое, чем обнаружения, она определяет точный пиксельный контур каждого объекта, отделяя отдельные экземпляры одного класса от фона.
  • Оценка позы: Эта техника обнаруживает определенных ключевых точек на фигуре, таких как суставы на теле человека, для track движения и позы в режиме реального времени.

Компьютерное зрение и обработка изображений

Обычно компьютерное зрение путают с Цифровая обработка изображений, но они служат разным целям. Обработка изображений направлена на манипулирование входным изображением для улучшения его качества или извлечения информации, не обязательно "понимая" его. Обычные примеры - регулировка яркости, применение фильтров или подавление шума. В отличие от этого, CV фокусируется на понимании изображения, где целью является имитация человеческого познания для интерпретации того, что представляет собой изображение.

Применение в реальном мире

Компьютерное зрение используется практически во всех отраслях промышленности, повышая эффективность и безопасность:

Реализация компьютерного зрения с помощью YOLO11

Разработчики могут реализовать мощные задачи компьютерного зрения с помощью ultralytics Пакет Python . Пример ниже демонстрирует, как загрузить пакет Модель YOLO11-последней стабильная версия, рекомендуемая для всех стандартных случаев использования, для detect объектов на изображении.

from ultralytics import YOLO

# Load the pretrained YOLO11 model (nano version for speed)
model = YOLO("yolo11n.pt")

# Run inference on an online image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results to see bounding boxes and labels
results[0].show()

Ключевые инструменты и библиотеки

Экосистема CV поддерживается надежными библиотеками с открытым исходным кодом. OpenCV это фундаментальная библиотека, предоставляющая тысячи алгоритмов для компьютерного зрения в реальном времени. Для построения и обучения моделей глубокого обучения используются такие фреймворки, как PyTorch и TensorFlow являются промышленными стандартами. Ultralytics опирается на эти основы, чтобы предоставить самые современные модели, которые легко развернуть. В перспективе ПлатформаUltralytics представляет собой комплексную среду для управления всем жизненным циклом Vision AI, от управления данными до развертывания.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас