Как использовать Ultralytics YOLO11 для обнаружения объектов

Абирами Вина

3 мин. чтения

29 ноября 2024 г.

Узнайте, как новая модель Ultralytics YOLO11 может быть использована для обнаружения объектов с целью достижения более высокой точности в различных областях промышленности.

Компьютерное зрение - это область искусственного интеллекта (ИИ), которая помогает машинам интерпретировать и понимать визуальную информацию для решения таких важных задач, как обнаружение объектов. В отличие от классификации изображений, обнаружение объектов позволяет не только определить, какие объекты присутствуют на изображении, но и точно определить их местоположение. Это делает его важнейшим инструментом для таких приложений искусственного интеллекта, как самоуправляемые автомобили, системы безопасности в реальном времени и автоматизация складов.

С течением времени технология обнаружения объектов становится все более совершенной и простой в использовании. На ежегодном гибридном мероприятии Ultralytics YOLO Vision 2024 (YV24) было объявлено о большом шаге вперед - выпуске модели Ultralytics YOLO11. YOLO11 повышает точность и производительность, поддерживая те же задачи, что и YOLOv8, что позволяет пользователям предыдущих моделей легко перейти на новую модель.

Рис. 1. Пример использования модели Ultralytics YOLO11 для обнаружения объектов.

В этой статье мы расскажем, что такое обнаружение объектов, чем оно отличается от других задач компьютерного зрения, и рассмотрим его реальные применения. Мы также расскажем вам, как использовать модель YOLO11 с пакетом Ultralytics Python и платформой Ultralytics HUB. Давайте начнем!

Что такое обнаружение объектов?

Обнаружение объектов - одна из основных задач компьютерного зрения, которая позволяет не просто идентифицировать объекты на изображении. В отличие от классификации изображений, которая определяет только наличие конкретного объекта, обнаружение объектов распознает несколько объектов и определяет их точное местоположение с помощью ограничительных рамок. 

Например, он может идентифицировать и определять местоположение лиц на групповой фотографии, автомобилей на оживленной улице или товаров на полке магазина. Сочетание распознавания объектов и локализации делает его особенно полезным для таких приложений, как видеонаблюдение, мониторинг толпы и автоматизированное управление запасами.

Рис. 2. Использование YOLO11 для обнаружения лиц.

Что отличает обнаружение объектов от других задач, таких как семантическая сегментация или сегментация экземпляров, так это его целенаправленность и эффективность. 

Семантическая сегментация маркирует каждый пиксель на изображении, но не различает отдельные объекты одного типа (например, все лица на фотографии будут сгруппированы как "лицо"). Экземплярная сегментация идет дальше, отделяя каждый объект и определяя его точную форму, даже для объектов одного класса. 

Обнаружение объектов, однако, обеспечивает более рациональный подход, идентифицируя и классифицируя объекты, одновременно отмечая их положение. Это делает его идеальным для задач реального времени, таких как обнаружение лиц на записях камер наблюдения или выявление препятствий для автономных транспортных средств.

Применение YOLO11 и обнаружение объектов

Расширенные функции обнаружения объектов делают YOLO11 полезным во многих отраслях. Давайте рассмотрим несколько примеров.

Использование YOLO11 для аналитики розничной торговли

YOLO11 и функция обнаружения объектов меняют представление об аналитике в розничной торговле, делая управление запасами и мониторинг полок более эффективным и точным. Способность модели быстро и надежно обнаруживать объекты помогает ритейлерам отслеживать уровень запасов, организовывать полки и сокращать количество ошибок при подсчете товарных запасов.

Например, YOLO11 может обнаружить на полке магазина такие специфические предметы, как солнцезащитные очки. Но зачем ритейлеру следить за полками? Сохранение запасов и организации на полках жизненно важно для того, чтобы покупатели могли найти то, что им нужно, а это напрямую влияет на продажи. Контролируя полки в режиме реального времени, ритейлеры могут быстро заметить, когда товары заканчиваются, их неправильно разместили или они переполнены, что помогает им поддерживать организованную и привлекательную выкладку, улучшающую впечатления покупателей.

Рис. 3. Пример использования YOLO11 для обнаружения товаров на полках.

YOLO11 в приложениях для умных городов

Эффективное функционирование оживленного города зависит от бесперебойного движения транспорта и безопасных улиц, и YOLO11 может помочь сделать это возможным. С YOLO11 можно интегрировать множество приложений для "умного города". 

Один из интересных примеров - использование обнаружения объектов для идентификации номерных знаков на движущихся автомобилях. Благодаря этому YOLO11 может ускорить сбор платы за проезд, улучшить управление дорожным движением и ускорить соблюдение правил. 

Рис. 4. Использование обнаружения объектов и YOLO11 для обнаружения номерных знаков.

Система искусственного интеллекта Vision AI, следящая за дорогами, может предупредить власти о нарушениях правил дорожного движения или заторах до того, как они перерастут в более серьезные проблемы. YOLO11 также может обнаруживать пешеходов и велосипедистов, делая улицы безопаснее и эффективнее для всех. 

Способность YOLO11 обрабатывать визуальные данные делает его мощным инструментом для улучшения городской инфраструктуры. Например, он может помочь оптимизировать время работы светофора, анализируя движение автомобилей и пешеходов. Он также может повысить безопасность в школьных зонах, обнаруживая детей и предупреждая водителей о необходимости снизить скорость. С помощью YOLO11 города могут принимать упреждающие меры для решения проблем и создания более эффективной среды для всех.

Обнаружение видео в реальном времени с помощью YOLO11: повышение доступности

Обнаружение объектов в реальном времени - это способность системы идентифицировать и классифицировать объекты в видеопотоке по мере их появления. Система YOLO11 разработана с учетом превосходной производительности в режиме реального времени и отлично справляется с этой задачей. Его применение выходит за рамки простого упорядочивания процессов - он также может помочь создать более инклюзивный и доступный мир.

Например, YOLO11 может помочь людям с ослабленным зрением, распознавая объекты в режиме реального времени. На основе обнаруженных объектов могут быть предоставлены аудиоописания, что помогает пользователям ориентироваться в окружающей обстановке с большей независимостью.

Подумайте о слабовидящем человеке, который ходит за продуктами. Выбрать нужные товары может быть непросто, но YOLO11 может помочь. По мере того как человек кладет товары в корзину, система, интегрированная с YOLO11, может идентифицировать каждый товар - например, бананы, авокадо или пакет молока - и предоставлять аудиоописание в режиме реального времени. Это позволит им подтвердить свой выбор и убедиться, что они получили все необходимое. Распознавая предметы повседневного спроса, YOLO11 может упростить процесс совершения покупок.

Рис. 5. Обнаружение объектов может помочь сделать мир более доступным для людей с ослабленным зрением.

Пошаговое руководство по обнаружению объектов с помощью YOLO11 

Теперь, когда мы рассмотрели основы обнаружения объектов и их разнообразные применения, давайте узнаем, как вы можете начать использовать модель Ultralytics YOLO11 для решения таких задач, как обнаружение объектов.

Существует два простых способа использования YOLO11: через пакет Ultralytics Python или Ultralytics HUB. Давайте рассмотрим оба способа, начав с пакета Python.

Выполнение выводов с помощью YOLO11

Выводы - это когда модель ИИ анализирует новые, невидимые данные, чтобы сделать предсказания, классифицировать информацию или сделать выводы на основе того, что она узнала во время обучения. Применительно к обнаружению объектов это означает идентификацию и определение местоположения конкретных объектов на изображении или видео, рисование ограничительных рамок вокруг них и их маркировку на основе обучения модели.

Чтобы сделать вывод с помощью модели обнаружения объектов YOLO11, вам сначала нужно установить пакет Ultralytics Python с помощью pip, conda или Docker. Если у вас возникнут проблемы с установкой, ознакомьтесь с руководством по устранению неполадок, чтобы найти советы и рекомендации по их решению. После установки вы можете использовать следующий код, чтобы загрузить модель обнаружения объектов YOLO11 и сделать предсказания на изображении.

Рис. 6. Выполнение умозаключения на изображении с помощью YOLO11n.

Обучение пользовательской модели YOLO11

YOLO11 также поддерживает индивидуальное обучение, чтобы лучше соответствовать вашим конкретным задачам. Настроив модель, вы сможете адаптировать ее к обнаружению объектов, имеющих отношение к вашему проекту. Например, при использовании компьютерного зрения в здравоохранении настраиваемая модель YOLO11 может использоваться для обнаружения конкретных аномалий на медицинских изображениях, таких как опухоли на снимках МРТ или переломы на рентгеновских снимках, помогая врачам быстрее и точнее ставить диагнозы.

В приведенном ниже фрагменте кода показано, как загрузить и обучить модель YOLO11 для обнаружения объектов. Вы можете начать с файла конфигурации YAML или предварительно обученной модели, перенести веса и обучиться на таких наборах данных, как COCO, для более точного обнаружения объектов.

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.yaml")  # build a new model from YAML
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)
model = YOLO("yolo11n.yaml").load("yolo11n.pt")  # build from YAML and transfer weights

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

После обучения модели вы можете экспортировать ее в различные форматы для развертывания в различных средах.

Обнаружение объектов YOLO11 на Ultralytics HUB

Для тех, кто ищет альтернативу без кода, Ultralytics HUB предоставляет простую в использовании платформу Vision AI для обучения и развертывания моделей YOLO, включая YOLO11.

Чтобы запустить обнаружение объектов на изображениях, просто создайте учетную запись, перейдите в раздел "Модели" и выберите вариант модели обнаружения объектов YOLO11. Загрузите изображение, и платформа отобразит обнаруженные объекты в разделе предварительного просмотра.

Рис. 7. Запуск выводов на Ultralytics HUB.

Сочетая гибкость пакета Python с простотой HUB, YOLO11 позволяет разработчикам и компаниям легко использовать возможности передовой технологии обнаружения объектов.

Основные выводы

YOLO11 устанавливает новый стандарт в области обнаружения объектов, сочетая высокую точность с универсальностью для удовлетворения потребностей различных отраслей. От улучшения аналитики розничной торговли до управления инфраструктурой "умного города" - YOLO11 создан для надежной работы в режиме реального времени в бесчисленных приложениях.

Благодаря возможности индивидуального обучения и простому в использовании интерфейсу Ultralytics HUB интеграция YOLO11 в ваши рабочие процессы никогда не была такой простой. Будь то разработчик, изучающий компьютерное зрение, или компания, стремящаяся к инновациям с помощью искусственного интеллекта, YOLO11 предлагает инструменты, необходимые для достижения успеха.

Чтобы узнать больше, ознакомьтесь с нашим репозиторием на GitHub и присоединяйтесь к нашему сообществу. Ознакомьтесь с приложениями ИИ в самодвижущихся автомобилях и компьютерном зрении для сельского хозяйства на страницах наших решений. 🚀

Давайте вместе построим будущее
искусственного интеллекта!

Начните свое путешествие в будущее машинного обучения

Начните бесплатно
Ссылка копируется в буфер обмена