Обнаружение объектов с помощью YOLO11: учебник по Ultralytics

Компьютерное зрение — это область искусственного интеллекта (ИИ), которая помогает машинам интерпретировать и понимать визуальную информацию для выполнения важных задач, таких как детектирование объектов. В отличие от классификации изображений, детектирование объектов не только определяет, какие объекты находятся на изображении, но и точно определяет их местоположение. Это делает его важным инструментом для приложений ИИ для зрения, таких как самоуправляемые автомобили, системы безопасности в реальном времени и автоматизация складов.

С течением времени технология обнаружения объектов становится все более совершенной и простой в использовании. На ежегодном гибридном мероприятии Ultralytics YOLO Vision 2024 (YV24) было объявлено о большом шаге вперед - выпуске моделиUltralytics YOLO11 . YOLO11 повышает точность и производительность, поддерживая те же задачи, что и YOLOv8что позволяет пользователям предыдущих моделей легко перейти на новую модель.

Рис. 1. Пример использования модели Ultralytics YOLO11 для обнаружения объектов.

‍

В этой статье мы расскажем, что такое обнаружение объектов, чем оно отличается от других задач компьютерного зрения, и рассмотрим его реальные применения. Мы также расскажем вам, как использовать модель YOLO11 с пакетомUltralytics Python и платформойUltralytics HUB. Давайте начнем!

Что такое детектирование объектов?

Детектирование объектов — это основная задача в компьютерном зрении, которая делает больше, чем просто идентифицирует объекты на изображении. В отличие от классификации изображений, которая только определяет, присутствует ли конкретный объект, детектирование объектов распознает несколько объектов и точно определяет их местоположение с помощью ограничивающих рамок.

Например, он может идентифицировать и определять местоположение лиц на групповой фотографии, автомобилей на оживленной улице или продуктов на полке магазина. Сочетание распознавания объектов и локализации делает его особенно полезным для таких приложений, как видеонаблюдение, мониторинг толпы и автоматизированное управление запасами.

Рис. 2. Использование YOLO11 для detect лиц.

‍

Что отличает обнаружение объектов от других задач, таких как семантическая или поэкземплярная сегментация, так это его целенаправленность и эффективность.

Семантическая сегментация маркирует каждый пиксель на изображении, но не различает отдельные объекты одного типа (например, все лица на фотографии будут сгруппированы как "лицо"). Поэкземплярная сегментация идет дальше, разделяя каждый объект и очерчивая его точную форму, даже для объектов одного класса.

Обнаружение объектов, однако, обеспечивает более рациональный подход, идентифицируя и классифицируя объекты, одновременно отмечая их местоположение. Это делает его идеальным для задач, выполняемых в реальном времени, таких как обнаружение лиц на записях с камер видеонаблюдения или выявление препятствий для автономных транспортных средств.

Применение YOLO11 и обнаружение объектов

Расширенные функции обнаружения объектов делают YOLO11 полезным во многих отраслях. Давайте рассмотрим несколько примеров.

Использование YOLO11 для аналитики розничной торговли

YOLO11 и функция обнаружения объектов меняют представление об аналитике в розничной торговле, делая управление запасами и мониторинг полок более эффективным и точным. Способность модели быстро и надежно detect объекты помогает ритейлерам track уровень запасов, организовывать полки и сокращать количество ошибок при подсчете товарных запасов.

Например, YOLO11 может detect на полке магазина конкретные товары, например солнцезащитные очки. Но зачем ритейлеру следить за полками? Сохранение запасов и организации на полках жизненно важно для того, чтобы покупатели могли найти то, что им нужно, а это напрямую влияет на продажи. Контролируя полки в режиме реального времени, ритейлеры могут быстро заметить, когда товары заканчиваются, их неправильно разместили или они переполнены, что помогает им поддерживать организованную и привлекательную выкладку, улучшающую впечатления покупателей.

Рис. 3. Пример использования YOLO11 для detect товаров на полках.

‍

YOLO11 в приложениях для умных городов

Эффективное функционирование оживленного города зависит от бесперебойного движения транспорта и безопасных улиц, и YOLO11 может помочь сделать это возможным. С YOLO11 можно интегрировать множество приложений для "умного города".

Один из интересных примеров - использование обнаружения объектов для идентификации номерных знаков на движущихся автомобилях. Благодаря этому YOLO11 может ускорить сбор платы за проезд, улучшить управление дорожным движением и ускорить соблюдение правил.

Рис. 4. Использование обнаружения объектов и YOLO11 для detect номерных знаков.

‍

Данные, полученные от систем искусственного интеллекта Vision, следящих за дорогами, могут предупредить власти о нарушениях правил дорожного движения или заторах до того, как они перерастут в более серьезные проблемы. YOLO11 также может detect пешеходов и велосипедистов, делая улицы безопаснее и эффективнее для всех.

Способность YOLO11обрабатывать визуальные данные делает его мощным инструментом для улучшения городской инфраструктуры. Например, он может помочь оптимизировать время работы светофора, анализируя движение автомобилей и пешеходов. Он также может повысить безопасность в школьных зонах, обнаруживая детей и предупреждая водителей о необходимости снизить скорость. С помощью YOLO11 города могут принимать упреждающие меры для решения проблем и создания более эффективной среды для всех.

Обнаружение видео в реальном времени с помощью YOLO11: повышение доступности

Обнаружение объектов в реальном времени - это способность системы идентифицировать и classify объекты в видеопотоке по мере их появления. Система YOLO11 разработана с учетом превосходной производительности в режиме реального времени и отлично справляется с этой задачей. Его применение выходит за рамки простого упорядочивания процессов - он также может помочь создать более инклюзивный и доступный мир.

Например, YOLO11 может помочь людям с ослабленным зрением, распознавая объекты в режиме реального времени. На основе обнаруженных объектов могут быть предоставлены аудиоописания, что помогает пользователям ориентироваться в окружающей обстановке с большей независимостью.

Подумайте о слабовидящем человеке, который ходит за продуктами. Выбрать нужные товары может быть непросто, но YOLO11 может помочь. По мере того как человек кладет товары в корзину, система, интегрированная с YOLO11 , может идентифицировать каждый товар - например, бананы, авокадо или пакет молока - и предоставлять аудиоописание в режиме реального времени. Это позволит им подтвердить свой выбор и убедиться, что они получили все необходимое. Распознавая предметы повседневного спроса, YOLO11 может упростить процесс совершения покупок.

Рис. 5. Обнаружение объектов может помочь сделать мир более доступным для людей с нарушениями зрения.

‍

Пошаговое руководство по обнаружению объектов с помощью YOLO11

Теперь, когда мы рассмотрели основы обнаружения объектов и их разнообразные применения, давайте узнаем, как вы можете начать использовать модель Ultralytics YOLO11 для решения таких задач, как обнаружение объектов.

Существует два простых способа использования YOLO11: через пакет Ultralytics Python или Ultralytics HUB. Давайте рассмотрим оба способа, начав с пакета Python .

Выполнение выводов с помощью YOLO11

Выводы - это когда модель ИИ анализирует новые, невидимые данные, чтобы сделать предсказания, classify информацию или сделать выводы на основе того, что она узнала во время обучения. Применительно к обнаружению объектов это означает идентификацию и определение местоположения конкретных объектов на изображении или видео, рисование ограничительных рамок вокруг них и их маркировку на основе обучения модели.

Чтобы сделать вывод с помощью модели обнаружения объектов YOLO11 , вам сначала нужно установить пакет Ultralytics Python с помощью pip, conda или Docker. Если у вас возникнут проблемы с установкой, ознакомьтесь с руководством по устранению неполадок, чтобы найти советы и рекомендации по их решению. После установки вы можете использовать следующий код, чтобы загрузить модель обнаружения объектов YOLO11 и сделать предсказания на изображении.

Рис. 6. Запуск инференса на изображении с использованием YOLO11n.

‍

Обучение пользовательской модели YOLO11

YOLO11 также поддерживает индивидуальное обучение, чтобы лучше соответствовать вашим конкретным задачам. Настроив модель, вы сможете адаптировать ее к detect объектов, имеющих отношение к вашему проекту. Например, при использовании компьютерного зрения в здравоохранении настраиваемая модель YOLO11 может использоваться для detect конкретных аномалий на медицинских изображениях, таких как опухоли на снимках МРТ или переломы на рентгеновских снимках, помогая врачам быстрее и точнее ставить диагнозы.

В приведенном ниже фрагменте кода показано, как загрузить и обучить модель YOLO11 для обнаружения объектов. Вы можете начать с файла конфигурации YAML или предварительно обученной модели, передать веса и обучиться на таких наборах данных, как COCO для более точного обнаружения объектов.

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.yaml")  # build a new model from YAML
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)
model = YOLO("yolo11n.yaml").load("yolo11n.pt")  # build from YAML and transfer weights

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

После обучения модели вы также можете экспортировать обученную модель в различных форматах для развертывания в разных средах.

Обнаружение объектов YOLO11 на Ultralytics HUB

Для тех, кто ищет альтернативу без кода, Ultralytics HUB предоставляет простую в использовании платформу Vision AI для обучения и развертывания моделей YOLO , включая YOLO11.

Чтобы запустить обнаружение объектов на изображениях, просто создайте учетную запись, перейдите в раздел "Модели" и выберите вариант модели обнаружения объектов YOLO11 . Загрузите изображение, и платформа отобразит обнаруженные объекты в разделе предварительного просмотра.

Рис. 7. Запуск выводов на Ultralytics HUB.

‍

Сочетая гибкость пакета Python с простотой HUB, YOLO11 позволяет разработчикам и компаниям использовать возможности передовой технологии обнаружения объектов.

Основные выводы

YOLO11 устанавливает новый стандарт в области обнаружения объектов, сочетая высокую точность с универсальностью для удовлетворения потребностей различных отраслей. От улучшения аналитики розничной торговли до управления инфраструктурой "умного города" - YOLO11 создан для надежной работы в режиме реального времени в бесчисленных приложениях.

Благодаря возможности индивидуального обучения и простому в использовании интерфейсу Ultralytics HUB интеграция YOLO11 в ваши рабочие процессы никогда не была такой простой. Будь то разработчик, изучающий компьютерное зрение, или компания, стремящаяся к инновациям с помощью искусственного интеллекта, YOLO11 предлагает инструменты, необходимые для достижения успеха.

Чтобы узнать больше, посетите наш репозиторий GitHub и присоединяйтесь к нашему сообществу. Изучите приложения AI в автомобилях с автоматическим управлением и компьютерное зрение для сельского хозяйства на страницах наших решений. 🚀

Как использовать Ultralytics YOLO11 для обнаружения объектов

Что такое детектирование объектов?

Применение YOLO11 и обнаружение объектов