Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас

Как использовать Ultralytics YOLO11 для детекции объектов

Абирами Вина

3 мин чтения

29 ноября 2024 г.

Узнайте, как новая модель Ultralytics YOLO11 может быть использована для детекции объектов для достижения более высокой точности в различных приложениях в широком спектре отраслей.

Компьютерное зрение — это область искусственного интеллекта (ИИ), которая помогает машинам интерпретировать и понимать визуальную информацию для выполнения важных задач, таких как детектирование объектов. В отличие от классификации изображений, детектирование объектов не только определяет, какие объекты находятся на изображении, но и точно определяет их местоположение. Это делает его важным инструментом для приложений ИИ для зрения, таких как самоуправляемые автомобили, системы безопасности в реальном времени и автоматизация складов.

Со временем технология детектирования объектов стала более продвинутой и простой в использовании. Важный шаг вперед был объявлен на ежегодном гибридном мероприятии Ultralytics, YOLO Vision 2024 (YV24), с запуском модели Ultralytics YOLO11. YOLO11 повышает точность и производительность, поддерживая те же задачи, что и YOLOv8, что упрощает переход для пользователей предыдущих моделей.

Рис. 1. Пример использования модели Ultralytics YOLO11 для детектирования объектов.

В этой статье мы разберем, что такое детектирование объектов, чем оно отличается от других задач компьютерного зрения, и рассмотрим его реальные приложения. Мы также расскажем, как использовать модель YOLO11 с помощью пакета Ultralytics Python и платформы Ultralytics HUB. Давайте начнем!

​​Что такое детектирование объектов?

Детектирование объектов — это основная задача в компьютерном зрении, которая делает больше, чем просто идентифицирует объекты на изображении. В отличие от классификации изображений, которая только определяет, присутствует ли конкретный объект, детектирование объектов распознает несколько объектов и точно определяет их местоположение с помощью ограничивающих рамок. 

Например, он может идентифицировать и определять местоположение лиц на групповой фотографии, автомобилей на оживленной улице или продуктов на полке магазина. Сочетание распознавания объектов и локализации делает его особенно полезным для таких приложений, как видеонаблюдение, мониторинг толпы и автоматизированное управление запасами.

Рис. 2. Использование YOLO11 для обнаружения лиц.

Что отличает обнаружение объектов от других задач, таких как семантическая или поэкземплярная сегментация, так это его целенаправленность и эффективность. 

Семантическая сегментация маркирует каждый пиксель на изображении, но не различает отдельные объекты одного типа (например, все лица на фотографии будут сгруппированы как "лицо"). Поэкземплярная сегментация идет дальше, разделяя каждый объект и очерчивая его точную форму, даже для объектов одного класса. 

Обнаружение объектов, однако, обеспечивает более рациональный подход, идентифицируя и классифицируя объекты, одновременно отмечая их местоположение. Это делает его идеальным для задач, выполняемых в реальном времени, таких как обнаружение лиц на записях с камер видеонаблюдения или выявление препятствий для автономных транспортных средств.

Применение YOLO11 и обнаружения объектов

Расширенные функции обнаружения объектов в YOLO11 делают его полезным во многих отраслях. Давайте рассмотрим несколько примеров.

Использование YOLO11 для розничной аналитики

YOLO11 и обнаружение объектов меняют розничную аналитику, делая управление запасами и мониторинг полок более эффективными и точными. Способность модели быстро и надежно обнаруживать объекты помогает розничным торговцам отслеживать уровень запасов, организовывать полки и уменьшать количество ошибок при подсчете запасов.

Например, YOLO11 может обнаруживать конкретные предметы, такие как солнцезащитные очки, на полке магазина. Но зачем розничному продавцу следить за полкой? Поддержание полок в заполненном и организованном состоянии жизненно важно для того, чтобы клиенты могли найти то, что им нужно, что напрямую влияет на продажи. Отслеживая полки в режиме реального времени, розничные торговцы могут быстро заметить, когда товары заканчиваются, смещены или переполнены, помогая им поддерживать организованную и привлекательную выкладку, которая улучшает качество обслуживания покупателей.

Рис. 3. Пример использования YOLO11 для обнаружения продуктов на полках.

YOLO11 в приложениях для умного города

Для эффективного функционирования оживленного города необходимы бесперебойное движение транспорта и безопасные улицы, и YOLO11 может помочь сделать это возможным. Фактически, многие приложения для умного города могут быть интегрированы с YOLO11. 

Один интересный случай включает в себя использование обнаружения объектов для идентификации номерных знаков на движущихся транспортных средствах. Благодаря этому YOLO11 может поддерживать более быстрый сбор платы за проезд, улучшенное управление дорожным движением и более быстрое обеспечение соблюдения правил. 

Рис. 4. Использование обнаружения объектов и YOLO11 для обнаружения номерных знаков.

Анализ данных, полученных от систем Vision AI, отслеживающих дороги, может предупредить власти о нарушениях правил дорожного движения или заторах до того, как они перерастут в более серьезные проблемы. YOLO11 также может обнаруживать пешеходов и велосипедистов, делая улицы более безопасными и эффективными для всех. 

Фактически, способность YOLO11 обрабатывать визуальные данные делает его мощным инструментом для улучшения городской инфраструктуры. Например, он может помочь оптимизировать время работы светофоров, анализируя движение транспортных средств и пешеходов. Он также может повысить безопасность в школьных зонах, обнаруживая детей и предупреждая водителей о необходимости снизить скорость. С помощью YOLO11 города могут принимать упреждающие меры для решения проблем и создания более эффективной среды для всех.

Обнаружение видео в реальном времени с помощью YOLO11: повышение доступности

Обнаружение объектов в реальном времени относится к способности системы идентифицировать и классифицировать объекты в прямой видеотрансляции по мере их появления. YOLO11 разработан для превосходной производительности в реальном времени и отлично поддерживает эту возможность. Его приложения выходят за рамки простого упрощения процессов — он также может помочь создать более инклюзивный и доступный мир.

Например, YOLO11 может помочь людям с нарушениями зрения, идентифицируя объекты в режиме реального времени. На основе обнаруженных объектов можно предоставлять аудиоописания, которые помогают пользователям ориентироваться в окружающей среде с большей независимостью.

Представьте себе человека с нарушениями зрения, покупающего продукты. Выбрать нужные товары может быть непросто, но YOLO11 может помочь. Когда они кладут товары в свою корзину, система, интегрированная с YOLO11, может использоваться для идентификации каждого товара — например, бананов, авокадо или пакета молока — и предоставлять аудиоописания в реальном времени. Это позволяет им подтвердить свой выбор и убедиться, что у них есть все необходимое. Распознавая повседневные предметы, YOLO11 может упростить процесс совершения покупок.

Рис. 5. Обнаружение объектов может помочь сделать мир более доступным для людей с нарушениями зрения.

Пошаговое руководство по обнаружению объектов с помощью YOLO11 

Теперь, когда мы рассмотрели основы обнаружения объектов и его разнообразные применения, давайте углубимся в то, как вы можете начать работу с моделью Ultralytics YOLO11 для таких задач, как обнаружение объектов.

Есть два простых способа использовать YOLO11: через пакет Ultralytics Python или Ultralytics HUB. Давайте рассмотрим оба метода, начиная с пакета Python.

Запуск инференсов с использованием YOLO11

Инференс — это когда модель ИИ анализирует новые, ранее не виданные данные, чтобы делать прогнозы, классифицировать информацию или предоставлять аналитические данные на основе того, что она узнала во время обучения. Что касается обнаружения объектов, это означает идентификацию и определение местоположения конкретных объектов на изображении или видео, рисование ограничивающих рамок вокруг них и их маркировку на основе обучения модели.

Чтобы выполнить инференс с использованием модели обнаружения объектов YOLO11, вам сначала необходимо установить пакет Ultralytics Python через pip, conda или Docker. Если у вас возникнут какие-либо проблемы с установкой, ознакомьтесь с руководством по устранению неполадок, чтобы получить советы и рекомендации, которые помогут вам их решить. После установки вы можете использовать следующий код для загрузки модели обнаружения объектов YOLO11 и выполнения прогнозов на изображении.

Рис. 6. Запуск инференса на изображении с использованием YOLO11n.

Обучение пользовательской модели YOLO11

YOLO11 также поддерживает пользовательское обучение, чтобы лучше соответствовать вашим конкретным случаям использования. Путем тонкой настройки модели вы можете адаптировать ее для обнаружения объектов, относящихся к вашему проекту. Например, при использовании компьютерного зрения в здравоохранении специально обученная модель YOLO11 может использоваться для обнаружения специфических отклонений на медицинских изображениях, таких как опухоли на МРТ или переломы на рентгеновских снимках, помогая врачам ставить более быстрые и точные диагнозы.

В примере кода ниже показано, как загрузить и обучить модель YOLO11 для обнаружения объектов. Вы можете начать с файла конфигурации YAML или предварительно обученной модели, перенести веса и обучать на наборах данных, таких как COCO, для более точного обнаружения объектов.

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.yaml")  # build a new model from YAML
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)
model = YOLO("yolo11n.yaml").load("yolo11n.pt")  # build from YAML and transfer weights

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

После обучения модели вы также можете экспортировать обученную модель в различных форматах для развертывания в разных средах.

Обнаружение объектов YOLO11 на Ultralytics HUB

Для тех, кто ищет альтернативу без кода, Ultralytics HUB предоставляет простую в использовании платформу Vision AI для обучения и развертывания моделей YOLO, включая YOLO11.

Чтобы запустить обнаружение объектов на изображениях, просто создайте учетную запись, перейдите в раздел «Модели» и выберите вариант модели обнаружения объектов YOLO11. Загрузите свое изображение, и платформа отобразит обнаруженные объекты в разделе предварительного просмотра.

Рис. 7. Запуск инференсов на Ultralytics HUB.

Сочетая гибкость пакета Python с простотой HUB, YOLO11 упрощает разработчикам и предприятиям использование возможностей передовой технологии обнаружения объектов.

Основные выводы

YOLO11 устанавливает новый стандарт в обнаружении объектов, сочетая высокую точность с универсальностью для удовлетворения потребностей различных отраслей. От улучшения розничной аналитики до управления инфраструктурой умного города, YOLO11 создан для надежной работы в реальном времени в бесчисленных приложениях.

Благодаря возможностям пользовательского обучения и простому в использовании интерфейсу через Ultralytics HUB, интеграция YOLO11 в ваши рабочие процессы еще никогда не была такой простой. Независимо от того, являетесь ли вы разработчиком, изучающим компьютерное зрение, или компанией, стремящейся к инновациям с помощью ИИ, YOLO11 предлагает инструменты, необходимые для достижения успеха.

Чтобы узнать больше, посетите наш репозиторий GitHub и присоединяйтесь к нашему сообществу. Изучите приложения AI в автомобилях с автоматическим управлением и компьютерное зрение для сельского хозяйства на страницах наших решений. 🚀

Давайте строить будущее
ИИ вместе!

Начните свой путь в будущее машинного обучения

Начать бесплатно
Ссылка скопирована в буфер обмена