Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Руководства

Все, что тебе нужно знать о задачах компьютерного зрения

Узнай, как работают задачи компьютерного зрения, такие как отслеживание объектов, сегментация экземпляров и классификация изображений, и как Ultralytics YOLO11 поддерживает их.

АБАбирами Вина
4 min read
Задачи компьютерного зрения, поддерживаемые Ultralytics YOLO11

Благодаря камерам и достижениям в области искусственного интеллекта (ИИ) компьютеры и машины теперь могут видеть мир так же, как люди. Например, они могут распознавать людей, отслеживать объекты и даже понимать контекст происходящего на видео.

В частности, computer vision — это область ИИ, которая позволяет машинам понимать и интерпретировать визуальную информацию из окружающего мира. Компьютерное зрение включает в себя множество задач, каждая из которых предназначена для извлечения определенного типа данных из изображений или видео. Например, обнаружение объектов помогает идентифицировать и находить различные предметы на снимке, а другие задачи, такие как отслеживание, сегментация и оценка позы, помогают машинам точнее понимать движение, формы и положение объектов.

Computer vision task, используемая для конкретного приложения, зависит от того, какие данные тебе нужны. Модели компьютерного зрения, такие как Ultralytics YOLO11, поддерживают различные задачи, что делает их надежным выбором для создания реальных систем Vision AI.

В этом руководстве мы подробнее рассмотрим задачи компьютерного зрения, поддерживаемые такими моделями, как YOLO11. Мы разберем, как работает каждая задача и как они используются в разных отраслях. Давай начнем!

Link to this sectionЧто такое задачи компьютерного зрения?#

Задачи компьютерного зрения направлены на воспроизведение способностей человеческого зрения различными способами. Эти задачи помогают машинам обнаруживать объекты, отслеживать их перемещения, оценивать позы и даже обводить контуры отдельных элементов на изображениях и видео. Обычно задачи компьютерного зрения выполняются моделями, которые разбивают визуальные данные на мелкие части, чтобы лучше интерпретировать происходящее.

Vision AI models, такие как модели Ultralytics YOLO, поддерживают несколько задач, включая детекцию, отслеживание и сегментацию, в рамках одной платформы. Благодаря такой универсальности модели YOLO11 легко адаптировать для широкого спектра задач.

Задачи компьютерного зрения, поддерживаемые YOLO11

Fig 1. Задачи компьютерного зрения, поддерживаемые YOLO11.

Отличный пример этого — спортивная аналитика. YOLO11 можно использовать для обнаружения каждого игрока на поле с помощью детекции объектов, а затем отслеживать их перемещения на протяжении всего матча. Тем временем функции оценки позы YOLO11 помогут проанализировать движения и технику игроков, а сегментация экземпляров позволит отделить каждого игрока от фона, что сделает анализ еще точнее.

В совокупности эти задачи компьютерного зрения, реализованные в YOLO11, создают полную картину происходящего на поле, давая командам глубокое понимание эффективности игроков, тактики и общей стратегии.

Link to this sectionОбзор задач компьютерного зрения, поддерживаемых YOLO11#

Теперь, когда мы узнали, что такое задачи компьютерного зрения, давай разберем каждую из них, поддерживаемую YOLO11, более детально на реальных примерах.

Link to this sectionПоддержка классификации изображений в YOLO11#

Когда ты смотришь на фотографию, ты легко определишь, что на ней изображено: собака, гора или дорожный знак, потому что мы все знаем, как выглядят эти вещи. Image classification помогает машинам делать то же самое, обучая их классифицировать и помечать изображение на основе основного объекта — будь то "автомобиль", "банан" или "рентгеновский снимок с переломом". Эта метка помогает системам компьютерного зрения понимать визуальный контент, чтобы они могли соответствующим образом реагировать или принимать решения.

Интересное применение этой задачи компьютерного зрения — мониторинг дикой природы. Классификация изображений может использоваться для идентификации различных видов животных по фотографиям, сделанным в дикой природе. Автоматически помечая изображения, исследователи могут отслеживать популяции, контролировать пути миграции и легче находить вымирающие виды для поддержки природоохранных мероприятий.

Использование YOLO11 для классификации изображений

Fig 2. Пример использования YOLO11 для классификации изображений.

Link to this sectionВозможности детекции объектов в YOLO11#

Хотя классификация изображений полезна для общего понимания содержимого снимка, она присваивает только одну метку всему изображению. В ситуациях, когда требуется детальная информация, например точное расположение и идентификация нескольких объектов, становится необходимой object detection.

Детекция объектов — это процесс идентификации и нахождения отдельных объектов на изображении, часто с помощью отрисовки ограничивающих рамок (bounding boxes) вокруг них. Ultralytics YOLO11 особенно эффективна в детекции объектов в реальном времени, что делает её идеальной для широкого спектра приложений.

Возьмем, к примеру, решения компьютерного зрения, используемые в розничных магазинах для пополнения полок. Детекция объектов может помочь пересчитать фрукты, овощи и другие товары, обеспечивая точный учет запасов. В сельском хозяйстве та же технология может контролировать зрелость урожая, помогая фермерам определить лучшее время для сбора, даже различая спелые и неспелые плоды.

Обнаружение фруктов с помощью Ultralytics YOLO11

Fig 3. Обнаружение фруктов с помощью Ultralytics YOLO11.

Link to this sectionИспользование YOLO11 для сегментации экземпляров#

Детекция объектов использует ограничивающие рамки для идентификации и поиска объектов, но не передает их точную форму. Здесь на помощь приходит instance segmentation. Вместо того чтобы рисовать прямоугольник вокруг объекта, сегментация экземпляров прорисовывает его точный контур.

Представь это так: вместо того чтобы просто указать, что «в этой области есть яблоко», система тщательно обводит и заполняет точную форму этого яблока. Этот детальный процесс помогает ИИ-системам четко понимать границы объекта, особенно когда объекты находятся близко друг к другу.

Сегментация экземпляров может применяться во многих областях: от инспекции инфраструктуры до геологических изысканий. Например, данные геологических исследований могут быть проанализированы с помощью YOLO11 для сегментации как крупных, так и мелких поверхностных трещин или аномалий. Рисуя точные границы вокруг этих аномалий, инженеры могут выявлять проблемы и решать их до начала проекта.

Сегментация трещин с использованием YOLO11

Fig 4. Сегментация трещин с помощью YOLO11.

Link to this sectionОтслеживание объектов: сопровождение объектов по кадрам с YOLO11#

До сих пор мы рассматривали задачи компьютерного зрения, которые фокусируются на одном изображении. Однако для видео нам нужны данные, выходящие за рамки одного кадра. Для этого можно использовать задачу object tracking.

Возможность YOLO11 отслеживать объекты позволяет следить за конкретным объектом, например человеком или автомобилем, по мере его перемещения через последовательность кадров видео. Даже если угол обзора камеры меняется или появляются другие объекты, система продолжает следить за той же целью.

Это крайне важно для приложений, требующих мониторинга в течение длительного времени, например для отслеживания автомобилей в дорожном потоке. Более того, YOLO11 может точно отслеживать транспортные средства, следуя за каждой машиной для оценки их скорости в реальном времени. Это делает отслеживание объектов ключевым компонентом систем мониторинга дорожного движения.

Отслеживание объектов YOLO11 для оценки скорости

Fig 5. Поддержка отслеживания объектов в YOLO11 может использоваться для оценки скорости.

Link to this sectionОбнаружение ориентированных ограничивающих рамок (OBB) с помощью YOLO11#

Объекты в реальном мире не всегда идеально выровнены — они могут быть наклонены, повернуты на бок или расположены под необычными углами. Например, на спутниковых снимках корабли и здания часто выглядят повернутыми.

Традиционные методы детекции объектов используют фиксированные прямоугольные рамки, которые не адаптируются к ориентации объекта, что затрудняет точный охват повернутых фигур. Oriented bounding box (OBB) detection решает эту проблему, используя рамки, которые вращаются, чтобы плотно прилегать к объекту, выравниваясь по его углу для более точного обнаружения.

В контексте мониторинга гавани поддержка OBB-детекции в YOLO11 помогает точно идентифицировать и отслеживать суда независимо от их ориентации, гарантируя, что каждое судно, входящее в гавань или покидающее её, находится под надлежащим контролем. Это точное обнаружение предоставляет информацию о местоположении и движении судов в реальном времени, что критически важно для управления загруженными портами и предотвращения столкновений.

Обнаружение лодок с помощью OBB-детекции и YOLO11

Fig 6. Обнаружение лодок с помощью OBB-детекции и YOLO11.

Link to this sectionОценка позы и YOLO11: отслеживание ключевых точек#

Pose estimation — это метод компьютерного зрения, который отслеживает ключевые точки, такие как суставы, конечности или другие маркеры, чтобы понять, как объект движется. Вместо того чтобы рассматривать весь объект или тело как единое целое, этот метод разбивает его на основные части. Это позволяет детально анализировать движения, жесты и взаимодействия.

Одно из распространенных применений этой технологии — оценка позы человека. Отслеживая положения различных частей тела в реальном времени, она дает четкую картину того, как человек двигается. Эту информацию можно использовать для различных целей: от распознавания жестов и мониторинга активности до анализа спортивных результатов.

Точно так же в физической реабилитации терапевты могут использовать оценку позы человека и YOLO11 для мониторинга движений пациентов во время упражнений. Это помогает убедиться, что каждое движение выполняется правильно, и отслеживать прогресс с течением времени.

Мониторинг тренировки с помощью YOLO11 и оценки позы

Fig 7. YOLO11 может контролировать тренировку с помощью оценки позы.

Link to this sectionИзучаем, как YOLO11 поддерживает различные задачи компьютерного зрения#

Теперь, когда мы детально изучили все задачи компьютерного зрения, поддерживаемые YOLO11, давай разберемся, как именно YOLO11 их поддерживает.

YOLO11 — это не просто одна модель, это набор специализированных вариантов моделей, каждая из которых разработана для конкретной задачи компьютерного зрения. Это делает YOLO11 универсальным инструментом, который можно адаптировать к широкому спектру приложений. Ты также можешь дообучить эти модели на пользовательских datasets, чтобы решать уникальные задачи твоих проектов.

Вот YOLO11 model variants, предварительно обученные для выполнения конкретных задач компьютерного зрения:

  • YOLO11: Эта модель обнаруживает и помечает несколько объектов в реальном времени, что делает её идеальной для высокоскоростного визуального распознавания.
  • YOLO11-seg: Этот вариант специализируется на сегментации, используя детальные маски для отделения объектов от фона.
  • YOLO11-obb: Эта модель предназначена для обнаружения повернутых объектов путем отрисовки ограничивающих рамок, которые выравниваются по ориентации каждого объекта.
  • YOLO11-cls: Этот вариант классифицирует изображения, присваивая одну метку категории на основе общего содержимого.
  • YOLO11-pose: Эта модель оценивает ключевые точки на теле для отслеживания позы, положения конечностей и движения.

Каждый вариант доступен в разных размерах, что позволяет пользователям выбрать оптимальный баланс между скоростью и точностью для своих конкретных нужд.

Link to this sectionОсновные выводы#

Задачи компьютерного зрения меняют то, как машины понимают окружающий мир и взаимодействуют с ним. Разбивая изображения и видео на ключевые элементы, эти технологии упрощают детальный анализ объектов, движений и взаимодействий.

От повышения безопасности дорожного движения и спортивных достижений до оптимизации промышленных процессов — модели, такие как YOLO11, предоставляют данные в реальном времени, которые стимулируют инновации. По мере развития Vision AI они будут играть все более важную роль в том, как мы интерпретируем и используем визуальные данные каждый день.

Присоединяйся к our community и посети our GitHub repository, чтобы увидеть ИИ в действии. Ознакомься с our licensing options и узнай больше об AI in agriculture и computer vision in manufacturing на страницах наших решений.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения