Глоссарий

Компьютерное зрение (CV)

Раскройте потенциал ИИ с помощью компьютерного зрения! Узнайте о его роли в обнаружении объектов, здравоохранении, самоуправляемых автомобилях и многом другом. Узнайте больше прямо сейчас!

Компьютерное зрение (КЗ) - это преобразующая область искусственного интеллекта (ИИ), которая позволяет компьютерам воспринимать, интерпретировать и понимать визуальный мир. Обрабатывая цифровые изображения, видео и другие визуальные данные, машины могут извлекать значимую информацию и предпринимать действия или давать рекомендации на основе этого анализа. анализ. В то время как человеческое зрение полагается на глаз и мозг для мгновенного определения контекста окружающей обстановки, компьютерное зрение использует передовое программное обеспечение и алгоритмы машинного обучения (ML) для воспроизведения Это позволяет системам автоматизировать задачи, которые раньше требовали человеческого зрения.

Как работает компьютерное зрение

В своей основе компьютерное зрение опирается на методы распознавания образов для понимания визуальных данные. Ранние попытки заключались в ручном кодировании правил для определения объектов, но современное компьютерное зрение опирается на глубокое обучение (ГОО) и огромные объемы обучающих данных. Наиболее распространенной архитектурой, используемой сегодня, является Конволюционная нейронная сеть (CNN), которая обрабатывает изображения пиксель за пикселем. Эти сети определяют низкоуровневые признаки, такие как края и текстуры, в начальных слоях и объединяют их для распознавания сложных концепций - например, лиц или автомобилей - в более глубоких слоях. Этот процесс требует огромных наборов данных с метками, чтобы научить модель эффективно различать различные категории.

Основные задачи в области компьютерного зрения

Компьютерное зрение - это не одно действие, а совокупность специфических задач, решающих различные проблемы:

Обнаружение объектов: Эта задача включает в себя идентификация и определение местоположения объектов в изображении или видеопотоке. Она рисует ограничительные рамки вокруг обнаруженных объектов и присваивает им метку класса, например "человек" или "велосипед".
Классификация изображений: Система Система анализирует все изображение и присваивает ему единую метку на основе его доминирующего содержания. Например, классификация фотографии как "пейзаж" или "портрет".
Сегментация экземпляров: Более глубокое, чем обнаружения, она определяет точный пиксельный контур каждого объекта, отделяя отдельные экземпляры одного класса от фона.
Оценка позы: Эта техника обнаруживает определенных ключевых точек на фигуре, таких как суставы на теле человека, для track движения и позы в режиме реального времени.

Компьютерное зрение и обработка изображений

Обычно компьютерное зрение путают с Цифровая обработка изображений, но они служат разным целям. Обработка изображений направлена на манипулирование входным изображением для улучшения его качества или извлечения информации, не обязательно "понимая" его. Обычные примеры - регулировка яркости, применение фильтров или подавление шума. В отличие от этого, CV фокусируется на понимании изображения, где целью является имитация человеческого познания для интерпретации того, что представляет собой изображение.

Применение в реальном мире

Компьютерное зрение используется практически во всех отраслях промышленности, повышая эффективность и безопасность:

Диагностика в здравоохранении: Медицинские работники используют CV для анализа рентгеновских снимков, МРТ и КТ. Алгоритмы позволяют detect такие аномалии, как опухоли на медицинских снимках с высокой точностью, что часто помогает врачам в ранней диагностике.
Умное сельское хозяйство: Фермеры Используют снимки с беспилотников и модели CV для мониторинга состояния посевов, detect вредителей и автоматизации сбора урожая. Такие системы, как мониторинг урожая в режиме реального времени помогают оптимизировать урожайность и сократить потери ресурсов.
Автономные транспортные средства: Для навигации по дорогам самоуправляемые автомобили в значительной степени опираются на данные автобиографии. Они обрабатывают данные с нескольких камер, чтобы обнаружения дорожных знаков, слежения за пешеходами и удержания полосы движения.
Контроль качества на производстве: Автоматизированные системы контроля на сборочных линиях выявляют дефекты в продукции быстрее и точнее, чем человеческие инспекторы. инспекторы, обеспечивая постоянный контроль качества.

Реализация компьютерного зрения с помощью YOLO11

Разработчики могут реализовать мощные задачи компьютерного зрения с помощью ultralytics Пакет Python . Пример ниже демонстрирует, как загрузить пакет Модель YOLO11-последней стабильная версия, рекомендуемая для всех стандартных случаев использования, для detect объектов на изображении.

from ultralytics import YOLO

# Load the pretrained YOLO11 model (nano version for speed)
model = YOLO("yolo11n.pt")

# Run inference on an online image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results to see bounding boxes and labels
results[0].show()

Ключевые инструменты и библиотеки

Экосистема CV поддерживается надежными библиотеками с открытым исходным кодом. OpenCV это фундаментальная библиотека, предоставляющая тысячи алгоритмов для компьютерного зрения в реальном времени. Для построения и обучения моделей глубокого обучения используются такие фреймворки, как PyTorch и TensorFlow являются промышленными стандартами. Ultralytics опирается на эти основы, чтобы предоставить самые современные модели, которые легко развернуть. В перспективе ПлатформаUltralytics представляет собой комплексную среду для управления всем жизненным циклом Vision AI, от управления данными до развертывания.

Компьютерное зрение (CV)

Обучение моделям Ultralytics YOLO для оптимизации рабочих процессов в разных отраслях

Гибкое корпоративное лицензирование для развития ваших инноваций

Обучайте модели искусственного интеллекта за считанные секунды с помощью Ultralytics YOLO

Как работает компьютерное зрение

Основные задачи в области компьютерного зрения

Компьютерное зрение и обработка изображений

Применение в реальном мире

Реализация компьютерного зрения с помощью YOLO11

Ключевые инструменты и библиотеки

Читать больше в этой категории

Понимание важности аннотации с участием человека

Что такое дистилляция наборов данных? Краткий обзор

Очки Oakley Meta AI переосмысливают концепцию очков с помощью Vision AI

Присоединяйтесь к сообществу Ultralytics