Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Руководства

Все, что тебе нужно знать о компьютерном зрении в 2025 году

Узнай, как компьютерное зрение преображает отрасли с помощью задач на основе ИИ, таких как обнаружение объектов, классификация изображений и оценка позы.

АБАбирами Вина
5 min read
Приложения компьютерного зрения в различных отраслях

Двадцать лет назад идея о том, что машины и компьютеры смогут видеть и понимать окружающий мир, была лишь научной фантастикой. Сегодня, благодаря достижениям в области искусственного интеллекта (ИИ), эта концепция стала реальностью. В частности, компьютерное зрение (CV), направление ИИ, позволяет машинам понимать и анализировать изображения и видео. Независимо от того, идет ли речь об идентификации объектов в реальном времени, улучшении систем безопасности или автоматизации сложных задач, его потенциал расширяет границы возможного.

Компьютерное зрение стремительно формирует будущее технологий, поскольку различные отрасли изучают способы использования его уникальных возможностей. Мировой объем рынка технологий компьютерного зрения достиг 19,83 млрд долларов в 2024 году, и прогнозируется, что в ближайшие годы он будет расти на 19,8% ежегодно.

График размера мирового рынка компьютерного зрения

Рис. 1. Мировой объем рынка компьютерного зрения.

В этой статье мы подробнее рассмотрим компьютерное зрение, охватывая то, что это такое, как оно развивалось и как работает сегодня. Мы также изучим некоторые из его наиболее интересных применений. Давай начнем!

Link to this sectionЧто такое компьютерное зрение?#

Компьютерное зрение — это подполе ИИ, которое использует машинное обучение и нейронные сети, чтобы научить компьютеры понимать содержимое визуальных данных, таких как изображения или видеофайлы. Инсайты, полученные в результате обработки изображений, могут быть использованы для принятия более обоснованных решений. Например, компьютерное зрение можно использовать в розничной торговле для отслеживания уровня товарных запасов путем анализа снимков полок или улучшения качества обслуживания покупателей с помощью систем автоматизированной кассы. Многие компании уже используют технологию компьютерного зрения для различных приложений, начиная от таких задач, как добавление фильтров к фотографиям на смартфонах, и заканчивая контролем качества на производстве.

Возможно, ты задаешься вопросом: почему существует такая потребность в решениях на базе компьютерного зрения? Задачи, требующие постоянного внимания, такие как обнаружение дефектов или распознавание паттернов, могут быть трудными для людей. Глаза могут уставать, а детали можно упустить, особенно в динамичных или сложных условиях.

Хотя люди хорошо распознают объекты разных размеров, цветов, освещения или под разными углами, им часто трудно сохранять последовательность под давлением. Решения на базе компьютерного зрения, напротив, работают без остановки, быстро и точно обрабатывая большие объемы визуальных данных. Например, оно может анализировать трафик в реальном времени, чтобы обнаружить заторы, оптимизировать тайминг светофоров или даже выявлять аварии быстрее, чем смог бы человек-наблюдатель.

Link to this sectionИстория развития компьютерного зрения#

С годами компьютерное зрение превратилось из теоретической концепции в надежную технологию, стимулирующую инновации в различных отраслях. Давай взглянем на некоторые ключевые вехи, которые определили его развитие:

  • 1950-е – 1960-е годы: Исследователи начали разрабатывать алгоритмы для обработки и анализа визуальных данных, но прогресс был медленным из-за ограниченной вычислительной мощности.

  • 1970-е годы: Это десятилетие ознаменовалось серьезными улучшениями в алгоритмах, таких как преобразование Хафа, которое улучшило обнаружение линий и геометрических фигур на изображениях. Также появилось оптическое распознавание символов (OCR), что позволило машинам читать печатный текст.

  • 1980-е – 1990-е годы: Машинное обучение начало играть важную роль в компьютерном зрении, прокладывая путь к более продвинутым возможностям и будущим прорывам.

  • 2000-е – 2010-е годы: Глубинное обучение придало новое измерение компьютерному зрению, оснастив машины способностью более эффективно интерпретировать визуальные данные. Это расширило возможности, такие как идентификация объектов, анализ движения и выполнение сложных задач.

Сегодня компьютерное зрение быстро развивается и меняет то, как мы решаем проблемы в таких областях, как здравоохранение, автономные транспортные средства и «умные» города. Модели Ultralytics YOLO (You Only Look Once), разработанные для задач компьютерного зрения в реальном времени, упрощают эффективное и точное внедрение ИИ зрения в различных отраслях. По мере того как ИИ и оборудование продолжают совершенствоваться, эти модели помогают компаниям принимать более взвешенные решения и оптимизировать операции за счет использования передового анализа визуальных данных.

Link to this sectionРазбираем, как работает компьютерное зрение#

Системы компьютерного зрения работают с использованием нейронных сетей — алгоритмов, вдохновленных тем, как работает человеческий мозг, — для анализа изображений. Особый тип, называемый сверточными нейронными сетями (CNN), особенно хорош для распознавания паттернов, таких как края и формы на изображениях.

Для упрощения визуальных данных используются такие методы, как пулинг (pooling), который фокусируется на наиболее важных частях изображения, в то время как дополнительные слои обрабатывают эту информацию для выполнения таких задач, как идентификация признаков или обнаружение объектов. Продвинутые модели, такие как Ultralytics YOLO11, разработанные для скорости и точности, делают возможной обработку изображений в реальном времени.

Использование Ultralytics YOLO11 для обнаружения объектов

Рис. 2. Пример использования Ultralytics YOLO11 для обнаружения объектов.

Типичное приложение компьютерного зрения включает несколько шагов по преобразованию «сырых» изображений в полезные инсайты. Вот четыре основных этапа:

  • Приобретение изображения: визуальные данные собираются с помощью камер или датчиков, и качество изображений зависит от типа используемого датчика.

  • Обработка изображения: собранные данные затем улучшаются с помощью методов предварительной обработки, таких как уменьшение шума и выделение краев, чтобы облегчить анализ.

  • Извлечение признаков: выделяются важные детали, такие как формы и текстуры, с фокусом на тех частях изображения, которые имеют наибольшее значение.

  • Распознавание паттернов: идентифицированные признаки анализируются с помощью машинного обучения для выполнения таких задач, как обнаружение объектов, отслеживание движения или распознавание паттернов.

Link to this sectionИзучаем задачи компьютерного зрения#

Ты мог заметить, что при обсуждении работы компьютерного зрения мы упоминали задачи компьютерного зрения. Модели, такие как Ultralytics YOLO11, созданы для поддержки этих задач, предлагая быстрые и точные решения для реальных приложений. От обнаружения объектов до отслеживания их движения — YOLO11 эффективно справляется с этими задачами. Давай изучим некоторые из ключевых задач компьютерного зрения, которые он поддерживает, и то, как они работают.

Link to this sectionДетекция объектов#

Обнаружение объектов — это ключевая задача компьютерного зрения, используемая для идентификации интересующих объектов на изображении. Результатом задачи обнаружения объектов является набор ограничивающих рамок (прямоугольников, нарисованных вокруг обнаруженных объектов на изображении), наряду с метками классов (категория или тип каждого объекта, например «машина» или «человек») и показателями уверенности (числовое значение, указывающее, насколько модель уверена в каждой детекции). Например, обнаружение объектов можно использовать для идентификации и определения местоположения пешехода на улице или автомобиля в потоке.

YOLO11 обнаруживает объекты на изображении

Рис. 3. YOLO11 используется для обнаружения объектов.

Link to this sectionКлассификация изображений#

Основная цель классификации изображений — присвоить предопределенную метку или категорию входному изображению на основе его общего содержания. Эта задача обычно включает идентификацию доминирующего объекта или признака на изображении. Например, классификацию изображений можно использовать, чтобы определить, содержит ли изображение кошку или собаку. Модели компьютерного зрения, такие как YOLO11, можно даже дообучать для классификации отдельных пород кошек или собак, как показано ниже.

Классификация различных пород кошек с помощью YOLO11

Рис. 4. Классификация различных пород кошек с использованием YOLO11.

Link to this sectionСегментация экземпляров#

Сегментация экземпляров — еще одна важнейшая задача компьютерного зрения, используемая в различных приложениях. Она включает разбиение изображения на сегменты и идентификацию каждого отдельного объекта, даже если объектов одного типа несколько. В отличие от обнаружения объектов, сегментация экземпляров идет дальше, очерчивая точные границы каждого объекта. Например, в автомобильной промышленности и ремонте сегментация экземпляров может помочь идентифицировать и маркировать каждую деталь автомобиля отдельно, делая процесс более точным и эффективным.

Сегментация деталей автомобиля с помощью YOLO11

Рис. 5. Сегментация деталей автомобиля с использованием YOLO11.

Link to this sectionОценка позы (pose estimation)#

Цель оценки позы — определить положение и ориентацию человека или объекта путем прогнозирования расположения ключевых точек, таких как руки, голова и локти. Это особенно полезно в приложениях, где важно понимание физических действий в реальном времени. Оценка позы человека обычно используется в таких областях, как спортивный анализ, мониторинг поведения животных и робототехника.

Оценка позы человека с помощью YOLO11

Рис. 6. YOLO11 может помочь в оценке позы человека.

Чтобы изучить другие задачи компьютерного зрения, поддерживаемые YOLO11, ты можешь обратиться к официальной документации Ultralytics. В ней содержится подробная информация о том, как YOLO11 справляется с такими задачами, как отслеживание объектов и обнаружение объектов с ориентированными ограничивающими рамками (OBB).

Link to this sectionПопулярные модели компьютерного зрения сегодня#

Несмотря на то, что существует множество моделей компьютерного зрения, серия Ultralytics YOLO выделяется своей высокой производительностью и универсальностью. Со временем модели Ultralytics YOLO совершенствовались, становясь быстрее, точнее и способными выполнять больше задач. Когда были представлены Ultralytics YOLOv5, развертывание моделей стало проще с помощью фреймворков ИИ зрения, таких как PyTorch. Это позволило более широкому кругу пользователей работать с продвинутым ИИ зрения, сочетая высокую точность с простотой использования.

Затем Ultralytics YOLOv8 пошли еще дальше, добавив новые возможности, такие как сегментация экземпляров, оценка позы и классификация изображений. В свою очередь, последняя версия, YOLO11, обеспечивает высочайшую производительность в различных задачах компьютерного зрения. Имея на 22% меньше параметров, чем YOLOv8m, YOLO11m достигает более высокой средней точности (mAP) на датасете COCO, что означает, что он может обнаруживать объекты более точно и эффективно. Независимо от того, являешься ли ты опытным разработчиком или новичком в ИИ, YOLO11 предлагает мощное решение для твоих задач компьютерного зрения.

Link to this sectionРоль компьютерного зрения в повседневной жизни#

Ранее мы обсуждали, как модели компьютерного зрения, такие как YOLO11, могут применяться в самых разных отраслях. Теперь давай изучим другие варианты использования, которые меняют нашу повседневную жизнь.

Link to this sectionИИ зрения в здравоохранении#

Существует широкий спектр приложений для компьютерного зрения в здравоохранении. Такие задачи, как обнаружение объектов и классификация, используются в медицинской визуализации, чтобы сделать выявление заболеваний быстрее и точнее. При анализе рентгеновских снимков компьютерное зрение может выявлять паттерны, которые могут быть слишком тонкими для человеческого глаза.

Оно также используется для выявления раковых заболеваний, позволяя сравнивать раковые клетки со здоровыми. Аналогичным образом, в отношении КТ-сканирований и МРТ компьютерное зрение можно использовать для анализа изображений с почти человеческой точностью. Это помогает врачам принимать более обоснованные решения и в конечном итоге спасает больше жизней.

YOLO11 анализирует медицинские снимки

Рис. 7. YOLO11 используется для анализа медицинских сканов.

Link to this sectionИИ в автомобильной промышленности#

Компьютерное зрение критически важно для самоуправляемых автомобилей, помогая им обнаруживать объекты, такие как дорожные знаки и светофоры. Такие методы, как оптическое распознавание символов (OCR), позволяют автомобилю считывать текст с дорожных знаков. Оно также используется для обнаружения пешеходов, где задачи обнаружения объектов идентифицируют людей в реальном времени.

Более того, компьютерное зрение может даже заметить трещины и выбоины на дорожном покрытии, позволяя лучше отслеживать меняющиеся дорожные условия. В целом технология компьютерного зрения может играть ключевую роль в улучшении управления трафиком, повышении безопасности дорожного движения и поддержке планирования «умных» городов.

Понимание дорожной ситуации с помощью YOLO11

Рис. 8. Понимание трафика с помощью YOLO11.

Link to this sectionКомпьютерное зрение в сельском хозяйстве#

Представь, что фермеры могли бы автоматически сеять, поливать и собирать урожай вовремя, без каких-либо забот. Именно это компьютерное зрение привносит в сельское хозяйство. Оно облегчает мониторинг сельскохозяйственных культур в реальном времени, чтобы фермеры могли выявлять проблемы, такие как болезни или дефицит питательных веществ, более точно, чем люди.

В дополнение к мониторингу, автоматические машины для прополки на базе ИИ с интеграцией компьютерного зрения могут идентифицировать и удалять сорняки, сокращая затраты на рабочую силу и повышая урожайность. Такое сочетание технологий помогает фермерам оптимизировать свои ресурсы, повышать эффективность и защищать посевы.

Использование YOLO11 в сельском хозяйстве

Рис. 9. Пример использования YOLO11 в сельском хозяйстве.

Link to this sectionАвтоматизация производственных процессов с помощью ИИ#

В производстве компьютерное зрение помогает отслеживать производство, проверять качество продукции и автоматически отслеживать действия работников. ИИ зрения делает этот процесс быстрее и точнее, при этом уменьшая количество ошибок, что ведет к снижению затрат.

В частности, для обеспечения качества обычно используются обнаружение объектов и сегментация экземпляров. Системы обнаружения дефектов выполняют финальную проверку готовой продукции, чтобы гарантировать, что только лучшие образцы попадут к клиентам. Любой продукт с вмятинами или трещинами автоматически идентифицируется и отбраковывается. Эти системы также отслеживают и подсчитывают продукты в реальном времени, обеспечивая непрерывный мониторинг на сборочной линии.

Мониторинг сборочной линии с помощью компьютерного зрения

Рис. 10. Мониторинг сборочной линии с использованием компьютерного зрения.

Link to this sectionОбразование становится более эффективным благодаря компьютерному зрению#

Один из способов использования компьютерного зрения в классе — это распознавание жестов: оно персонализирует обучение, отслеживая движения учащихся. Модели, такие как YOLO11, отлично подходят для этой задачи. Они могут точно идентифицировать жесты, такие как поднятая рука или растерянное выражение лица, в реальном времени.

Когда такие жесты обнаруживаются, текущий урок можно скорректировать, предоставив дополнительную помощь или изменив содержание, чтобы оно лучше соответствовало потребностям ученика. Это создает более динамичную и адаптивную среду обучения, помогая учителям сосредоточиться на преподавании, в то время как система поддерживает опыт обучения каждого ученика.

Link to this sectionПоследние тренды в компьютерном зрении#

Теперь, когда мы изучили некоторые из приложений компьютерного зрения в различных отраслях, давай погрузимся в основные тренды, движущие его прогрессом.

Одним из главных трендов является периферийные вычисления (edge computing) — распределенная вычислительная инфраструктура, которая обрабатывает данные ближе к их источнику. Например, периферийные вычисления оснащают устройства, такие как камеры и датчики, возможностью обрабатывать визуальные данные напрямую, что приводит к сокращению времени отклика, уменьшению задержек и улучшению конфиденциальности.

Еще один ключевой тренд в компьютерном зрении — использование смешанной реальности. Она сочетает физический мир с цифровыми элементами, используя компьютерное зрение, чтобы виртуальные объекты плавно сливались с реальным миром. Это можно использовать для улучшения опыта в играх, образовании и обучении.

Link to this sectionПлюсы и минусы компьютерного зрения#

Вот некоторые из ключевых преимуществ, которые компьютерное зрение может принести различным отраслям:

  • Экономия затрат: Автоматизация задач с помощью компьютерного зрения помогает снизить операционные расходы, повысить производительность и минимизировать ошибки.

  • Масштабируемость: После внедрения системы компьютерного зрения можно легко масштабировать для обработки больших объемов данных, что делает их подходящими для растущего бизнеса или крупномасштабных операций.

  • Кастомизация под конкретные задачи: Модели компьютерного зрения можно дообучать с использованием твоего датасета, получая узкоспециализированные решения, которые соответствуют требованиям твоего приложения.

Хотя эти преимущества подчеркивают, как компьютерное зрение может повлиять на различные отрасли, также важно учитывать проблемы, связанные с его внедрением. Вот некоторые из ключевых проблем:

  • Проблемы конфиденциальности данных: Использование визуальных данных, особенно в чувствительных областях, таких как наблюдение или здравоохранение, может вызвать вопросы конфиденциальности и проблемы безопасности.

  • Ограничения окружающей среды: Системы компьютерного зрения могут испытывать трудности с правильной работой в сложных условиях, таких как плохое освещение, изображения низкого качества или сложные фоны.

  • Высокие первоначальные затраты: Разработка и внедрение систем компьютерного зрения могут быть дорогими из-за необходимости в специализированном оборудовании, программном обеспечении и опыте.

Link to this sectionОсновные выводы#

Компьютерное зрение меняет то, как машины взаимодействуют с миром, позволяя им видеть и понимать мир так же, как люди. Оно уже используется во многих областях, таких как повышение безопасности в самоуправляемых автомобилях, помощь врачам в более быстрой диагностике заболеваний, персонализация покупок и даже помощь фермерам в мониторинге урожая.

По мере того как технологии продолжают совершенствоваться, новые тренды, такие как периферийные вычисления и смешанная реальность, открывают еще больше возможностей. Хотя существуют некоторые проблемы, такие как предвзятость и высокие затраты, компьютерное зрение имеет потенциал оказать огромное положительное влияние на многие отрасли в будущем.

Чтобы узнать больше, посети наш репозиторий на GitHub и присоединяйся к нашему сообществу. Изучай инновации в таких секторах, как ИИ в самоуправляемых автомобилях и компьютерное зрение в сельском хозяйстве на наших страницах с решениями. 🚀

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения