Как использовать Ultralytics YOLO11 для сегментации экземпляров

Абирами Вина

5 минут чтения

5 ноября 2024 г.

Узнайте, как новая модель Ultralytics YOLO11 может быть использована для сегментации экземпляров с целью достижения более высокой точности в таких областях, как утилизация отходов и мониторинг факелов.

Компьютерное зрение, область искусственного интеллекта (ИИ), помогающая машинам интерпретировать и понимать визуальную информацию, позволяет решать такие задачи, как сегментация объектов. Сегментация экземпляров может использоваться для анализа изображения или видеокадра с целью определения точных границ каждого отдельного объекта на изображении, даже если на нем присутствует несколько объектов одного типа. Благодаря высокой точности сегментация экземпляров находит широкое применение - от помощи самодвижущимся автомобилям в обнаружении препятствий на дороге до идентификации опухолей на медицинских снимках.

За прошедшие годы сегментация инстанций претерпела значительные изменения. Последняя разработка была представлена на ежегодном гибридном мероприятии Ultralytics YOLO Vision 2024 (YV24) в виде модели Ultralytics YOLO11. Новая модель поддерживает те же задачи компьютерного зрения (включая сегментацию экземпляров), что и модель Ultralytics YOLOv8, поэтому пользователи, знакомые с предыдущими версиями, могут легко освоить новую модель.

Рис. 1. Пример использования модели Ultralytics YOLO11 для сегментации экземпляров.

В этой статье мы рассмотрим сегментацию экземпляров и ее отличие от других задач компьютерного зрения, таких как семантическая сегментация, а также обсудим некоторые из ее применений. Мы также рассмотрим, как можно использовать модель сегментации экземпляров YOLO11 с помощью пакета Ultralytics Python и платформы Ultralytics HUB. Давайте начнем!

Что такое сегментация экземпляров?

Сегментация фрагментов может использоваться для идентификации объектов на изображении и их обводки на пиксельном уровне. Обычно этот процесс включает в себя обнаружение объектов и рисование ограничительных ра мок вокруг них. Затем алгоритм сегментации классифицирует каждый пиксель в пределах ограничительной рамки, чтобы создать точную маску для каждого объекта.

Сегментация экземпляров также отличается от таких задач, как семантическая сегментация и паноптическая сегментация. Семантическая сегментация маркирует каждый пиксель на основе общей категории объекта, не выделяя отдельные экземпляры. Паноптическая сегментация, с другой стороны, сочетает в себе как сегментацию экземпляров, так и семантическую сегментацию, маркируя каждый пиксель как классом, так и идентификатором экземпляра, идентифицируя отдельные объекты в каждой категории.

Рис. 2. Использование YOLO11 для обнаружения и сегментации человека и собаки.

Возможности сегментации экземпляров могут применяться в различных сценариях, для которых могут потребоваться разные модели. Например, легкая модель может быть идеальной для обработки в реальном времени в мобильных приложениях, а более сложная модель может использоваться для высокоточных задач, таких как контроль качества в производстве.

Как и предыдущие модели, модель сегментации экземпляров YOLO11 также поставляется с несколькими вариациями в зависимости от ваших потребностей. К ним относятся YOLO11n-seg (Nano), YOLO11s-seg (Small), YOLO11m-seg (Medium), YOLO11l-seg (Large) и YOLO11x-seg (Extra Large). Эти модели различаются по размеру, скорости обработки, точности и требуемой вычислительной мощности. Исходя из ваших конкретных требований, вы можете выбрать модель, которая лучше всего подходит для вашей задачи.

Приложения для сегментации экземпляров для YOLO11

Расширенные возможности сегментации экземпляров в YOLO11 открывают широкие возможности применения в различных отраслях. Давайте рассмотрим некоторые из них подробнее.

Использование сегментации YOLO11 в нефтегазовой отрасли

Добыча нефти и газа предполагает управление чрезвычайно высокими перепадами давления. Такие методы, как сжигание газа, помогают сжигать природный газ, образующийся при добыче нефти. Это необходимо по соображениям безопасности. Например, при добыче сырой нефти внезапный или значительный скачок давления может привести к взрыву. Промышленные аварии в нефтегазодобывающем секторе могут привести к сильным пожарам, которые трудно локализовать и контролировать, хотя это и редкость. Сжигание газа помогает операторам безопасно сбросить давление в оборудовании и справиться с непредсказуемыми и значительными колебаниями давления путем сжигания избыточного газа.

Системы искусственного интеллекта могут улучшить этот процесс мониторинга, а риск аварий можно снизить, используя систему мониторинга факела на основе сегментации экземпляров. Мониторинг сжигания газа также важен по экологическим причинам, поскольку слишком интенсивное сжигание газа может негативно повлиять на окружающую среду. 

Модели сегментации экземпляров Ultralytics YOLO11 можно использовать для мониторинга количества огня и дыма, вызванного факельным горением. Можно рассчитать площадь пикселя обнаруженного и сегментированного факела и дыма. Используя эту информацию, операторы могут в режиме реального времени получить представление о количестве факелов и дыма, вызванных факельным горением, что поможет им предотвратить аварии и негативное воздействие на окружающую среду. 

Рис. 3. Пример мониторинга факела с помощью YOLO11 в нефтегазовом производстве.

Сегментация экземпляров с помощью YOLO11 для управления пластиковыми отходами 

Работники предприятий по утилизации и переработке отходов могут использовать системы YOLO11, основанные на сегментации, для идентификации пластиковых отходов. YOLO11 можно интегрировать с роботизированными сортировочными системами для точной идентификации различных отходов, например картона и пластика (подлежащих раздельной переработке). Это особенно важно, учитывая, что из 7 миллиардов тонн пластиковых отходов, образующихся во всем мире, только около 10 % попадает на переработку.

Автоматизация процесса идентификации и сортировки пластиковых отходов значительно сокращает время по сравнению с традиционными методами, когда работники сортируют предметы вручную. Модели компьютерного зрения могут сегментировать даже мягкие пластики, такие как обертки и пакеты, которые представляют особую сложность, поскольку часто запутываются. Модели YOLO11 также могут быть настроены на сегментацию различных типов пластика. Подробнее о том, как можно настраивать модели YOLO11, мы расскажем в следующих разделах.

Рис. 4. Идентификация пластиковых отходов с помощью Ultralytics YOLO11. 

Сегментация YOLO11 в автономных транспортных средствах

Еще один интересный случай использования сегментации экземпляров - автономные автомобили. YOLO11 позволяет самоуправляемым автомобилям повысить безопасность пассажиров и окружающих на дороге за счет точного распознавания объектов на уровне пикселей. Бортовая система камер автомобиля может захватывать изображения окружающего пространства и анализировать их с помощью YOLO11 и сегментации экземпляров. Каждый объект (пешеходы, светофоры, другие автомобили и т. д.) на изображении сегментируется, и ему присваивается метка. Такой уровень точности позволяет автономным автомобилям идентифицировать каждый объект вокруг себя. 

Рис. 5. Использование YOLO11 и сегментации экземпляров для идентификации транспортных средств и пешеходов на дороге.

Пробуем сегментацию экземпляров с помощью модели YOLO11

Теперь, когда мы изучили сегментацию экземпляров и обсудили некоторые из ее применений, давайте посмотрим, как вы можете опробовать ее на примере модели Ultralytics YOLO11. 

Есть два способа сделать это: вы можете использовать либо пакет Ultralytics Python, либо Ultralytics HUB. Мы рассмотрим оба варианта, начав с пакета Python.

Выполнение выводов с помощью YOLO11

Выполнение вывода предполагает использование модели для анализа новых, ранее не встречавшихся данных. Чтобы запустить вывод с помощью модели сегментации экземпляров YOLO11 через код, нам нужно установить пакет Ultralytics Python с помощью pip, conda или docker. Если во время установки возникнут какие-либо проблемы, вы можете обратиться к нашему руководству по общим проблемам, чтобы получить помощь в устранении неполадок. После установки пакета вы можете запустить код, показанный ниже, чтобы загрузить модель сегментации экземпляров YOLO11 и выполнить прогнозирование на изображении.

Рис. 6. Выполнение вывода на изображении с помощью YOLO11n-seg.

Обучение пользовательской модели YOLO11

С помощью той же настройки кода вы можете обучить пользовательскую модель YOLO11. Тонкая настройка модели YOLO11 позволяет создать пользовательскую версию модели, которая лучше отвечает требованиям вашего конкретного проекта. Например, ритейлеры могут использовать пользовательскую модель для точного сегментирования физических характеристик покупателя, чтобы рекомендовать одежду, которая сидит правильно. В приведенном ниже фрагменте кода показано, как загрузить и обучить модель YOLO11 для сегментации экземпляров. Вы можете начать с конфигурации YAML или предварительно обученной модели, передать веса и провести обучение на наборе данных, например COCO, чтобы добиться эффективной сегментации. 

После завершения работы вы можете делать выводы с помощью пользовательской модели для своих конкретных приложений. С помощью опции экспорта можно также экспортировать пользовательскую модель в другой формат.

Сегментация экземпляров YOLO11 на Ultralytics HUB

Теперь, когда мы изучили, как делать выводы и обучать модель сегментации экземпляров YOLO11 с помощью кода, давайте рассмотрим альтернативу без кода: Ultralytics HUB. Ultralytics HUB - это интуитивно понятная платформа Vision AI, которая упрощает процесс обучения и развертывания моделей YOLO, включая модели сегментации экземпляров YOLO11. 

Чтобы выполнить прогнозирование на изображениях, достаточно создать учетную запись, перейти в раздел "Модели" и выбрать нужный вариант модели сегментации экземпляров YOLO11. Вы можете загрузить изображение и просмотреть результаты предсказания в разделе предварительного просмотра, как показано ниже.

Рис. 7. Запуск выводов на Ultralytics HUB.

Основные выводы

YOLO11 предлагает надежные возможности сегментации экземпляров, которые открывают мир возможностей в различных отраслях промышленности. От повышения безопасности автономных транспортных средств и мониторинга сжигания газа в нефтегазовом секторе до автоматизации сортировки отходов на перерабатывающих предприятиях - точность на уровне пикселей делает YOLO11 идеальным решением для сложных задач сегментации. 

Благодаря возможности индивидуального обучения с помощью пакета Ultralytics Python и настройке без кода с помощью Ultralytics HUB пользователи могут легко интегрировать YOLO11 в свои рабочие процессы. Будь то промышленные приложения, здравоохранение, розничная торговля или мониторинг окружающей среды, YOLO11 обеспечивает гибкость и точность для удовлетворения различных потребностей в сегментации.

Чтобы узнать больше, посетите наш репозиторий GitHub и присоединяйтесь к нашему сообществу. Изучите применение ИИ в самодвижущихся автомобилях и сельском хозяйстве на страницах наших решений. 🚀

Давайте вместе построим будущее
искусственного интеллекта!

Начните свое путешествие в будущее машинного обучения

Начните бесплатно
Ссылка копируется в буфер обмена