Все, что вам нужно знать об Ultralytics YOLO11 и его применении

Абирами Вина

4 мин. чтения

4 октября 2024 г.

Узнайте все о новой модели Ultralytics YOLO11, ее возможностях и применении в реальном времени в различных отраслях. Мы расскажем вам обо всем, что нужно знать.

В понедельник, 30 сентября, компания Ultralytics официально представила Ultralytics YOLO11, новейшее достижение в области компьютерного зрения, после дебюта на YOLO Vision 2024 (YV24), ежегодном гибридном мероприятии Ultralytics. ИИ-сообщество с воодушевлением принялось изучать возможности модели. Благодаря более быстрой обработке, высокой точности и моделям, оптимизированным как для граничных устройств, так и для облачного развертывания, YOLO11 переопределяет возможности приложений компьютерного зрения в реальном времени.

В интервью основатель и генеральный директор Ultralytics Гленн Джочер сказал: "Мир движется в сторону чистой энергии, но недостаточно быстро. Мы хотим, чтобы наши модели можно было обучать за меньшее количество эпох, с меньшим количеством дополнений и меньшим количеством данных, поэтому мы упорно работаем над этим". Самая маленькая модель обнаружения объектов, YOLO11n, имеет всего 2,6 миллиона параметров - это примерно размер JPEG, что просто безумие. Самая большая модель обнаружения объектов, YOLO11x, имеет около 56 миллионов параметров, и даже это невероятно мало по сравнению с другими моделями. Вы можете обучить их на дешевом GPU, например на пятилетнем графическом процессоре Nvidia, всего лишь немного воодушевившись и выпив немного кофе".

В этой статье мы подробно рассмотрим YOLO11, изучим его особенности, улучшения, бенчмарки производительности и реальные приложения, чтобы помочь вам понять, на что способна эта модель. Давайте начнем!

Понимание YOLO11: улучшения по сравнению с прошлыми версиями

YOLO11 - это последнее достижение в серии моделей компьютерного зрения YOLO (You Only Look Once), которое предлагает значительные улучшения по сравнению с предыдущими версиями, такими как YOLOv5 и YOLOv8. Команда Ultralytics учла отзывы сообщества и результаты передовых исследований, чтобы сделать YOLO11 быстрее, точнее и эффективнее. YOLO11 поддерживает те же задачи компьютерного зрения, что и YOLOv8, включая обнаружение объектов, сегментацию экземпляров и классификацию изображений. Фактически, пользователи могут легко перейти на YOLO11 без необходимости изменения существующих рабочих процессов.

Одной из главных особенностей YOLO11 является его превосходство в точности и скорости по сравнению с предшественниками. Имея на 22 % меньше параметров, чем YOLOv8m, YOLO11m достигает более высокой средней точности (mAP) на наборе данных COCO, что означает, что она может обнаруживать объекты более точно и эффективно. По скорости обработки данных YOLO11 превосходит предыдущие модели, что делает его идеальным для приложений реального времени, где быстрое обнаружение и реагирование являются критически важными, и каждая миллисекунда на счету.

График бенчмаркинга ниже иллюстрирует, чем YOLO11 отличается от предыдущих моделей. По горизонтальной оси показана средняя точность (AP) COCO Box, которая измеряет точность обнаружения объектов. Вертикальная ось отображает задержку при использовании TensorRT10 FP16 на графическом процессоре NVIDIA T4, показывая, насколько быстро модель обрабатывает данные. 

__wf_reserved_inherit
Рис. 1. YOLO11 обеспечивает самые современные возможности обнаружения объектов в реальном времени.

Запуск модели YOLO11: Варианты с открытым исходным кодом и корпоративные варианты

С выпуском Ultralytics YOLO11 компания Ultralytics расширяет серию YOLO, предлагая модели с открытым исходным кодом и корпоративные модели для удовлетворения растущего спроса в различных отраслях.

__wf_reserved_inherit
Рис. 2. С этим запуском Ultralytics предлагает 30 новых моделей.

YOLO11 имеет пять различных размеров моделей - Nano, Small, Medium, Large и X. Пользователи могут выбрать оптимальную модель в зависимости от конкретных потребностей приложений компьютерного зрения. Пять размеров обеспечивают гибкость при решении таких задач, как классификация изображений, обнаружение объектов, сегментация экземпляров, отслеживание, оценка позы и обнаружение объектов с ориентированными ограничивающими рамками (OBB). Для каждого размера существует своя модель для каждой задачи, что в общей сложности составляет 25 моделей с открытым исходным кодом , которые составляют основу предложений Ultralytics. Эти модели идеально подходят для широкого спектра приложений, от легких задач на граничных устройствах, где модель YOLO11n обеспечивает впечатляющую эффективность, до более масштабных приложений, требующих моделей YOLO11l и YOLO11x.

Впервые Ultralytics представляет корпоративные модели, что знаменует собой важную веху в развитии наших продуктов, и мы рады поделиться этими нововведениями с нашими пользователями. В YOLO11 представлены пять собственных моделей, разработанных специально для коммерческого использования. Эти корпоративные модели, которые будут доступны в следующем месяце, обучены на новом собственном наборе данных Ultralytics, состоящем из более чем 1 миллиона изображений, что позволяет получить более надежные предварительно обученные модели. Они разработаны для сложных реальных приложений, таких как анализ медицинских снимков и обработка спутниковых изображений, где очень важно точное обнаружение объектов.

Изучение возможностей YOLO11 нового поколения

Теперь, когда мы обсудили, что предлагает YOLO11, давайте посмотрим, что делает YOLO11 таким особенным.

Одной из ключевых задач при разработке YOLO11 было найти правильный баланс между конкурирующими приоритетами: сделать модели меньше, быстрее и точнее. Как объяснил Гленн Джочер, основатель и генеральный директор Ultralytics, "работа над исследованиями и разработкой YOLO действительно сложна, потому что вы хотите двигаться в трех разных направлениях: вы хотите сделать модели меньше, вы хотите, чтобы они были более точными, но вы также хотите, чтобы они были быстрее на разных платформах, таких как CPU и GPU. Все это конкурирующие интересы, поэтому приходится идти на компромиссы и выбирать, что изменить". Несмотря на эти трудности, YOLO11 достигает впечатляющего баланса, обеспечивая улучшение скорости и точности по сравнению с предыдущими версиями, такими как YOLOv8.

__wf_reserved_inherit
Рис. 3. Пример использования YOLO11 для обнаружения объектов.

В YOLO11 реализованы такие существенные усовершенствования, как улучшенное извлечение признаков благодаря переработанной архитектуре позвоночника и шеи, что позволяет более точно обнаруживать объекты. Модель также оптимизирована для повышения скорости и эффективности, обеспечивая более быстрое время обработки при сохранении высокой точности. В дополнение к этим преимуществам YOLO11 обладает высокой адаптивностью к различным средам, легко работая на пограничных устройствах, облачных платформах и системах с графическими процессорами NVIDIA. Такая адаптивность делает его идеальным выбором для пользователей, которым нужны гибкие возможности развертывания на различных аппаратных платформах, от мобильных устройств до крупных серверов.

Приложения YOLO11 в режиме реального времени

Универсальность YOLO11 делает его надежным инструментом во многих отраслях, особенно при решении сложных задач. Например, он легко работает на пограничных устройствах и может использоваться в приложениях, требующих анализа в реальном времени в средах с ограниченной вычислительной мощностью. Отличный пример - автономное вождение, где транспортные средства должны принимать решения за доли секунды, чтобы обеспечить безопасность всех участников движения. YOLO11 помогает обнаруживать и анализировать объекты на дороге, такие как пешеходы или другие автомобили, даже в сложных условиях, например при слабом освещении или когда объекты частично скрыты. Быстрое и точное обнаружение помогает предотвратить аварии и обеспечивает безопасную навигацию самоуправляемых автомобилей.

__wf_reserved_inherit
Рис. 4. Гленн Джочер на сцене YV24, рассказывающий о приложениях YOLO11.

Еще одним интересным примером возможностей YOLO11 является его способность работать с ориентированными ограничительными рамками (OBB). Она необходима для обнаружения объектов, которые не идеально выровнены. Обнаружение объектов с OBB - функция, которая особенно полезна в таких отраслях, как сельское хозяйство, картография и видеонаблюдение, где на изображениях часто встречаются повернутые объекты, например посевы или здания на аэро- или спутниковых снимках. В отличие от традиционных моделей, YOLO11 может распознавать объекты под любым углом и обеспечивать гораздо более точные результаты для задач, требующих точности.

YOLO11 для разработчиков искусственного интеллекта: Попробуйте сами

Приступить к работе с YOLO11 просто и доступно, независимо от того, предпочитаете ли вы кодирование или не используете код. Для работы с YOLO11 с помощью кода вы можете использовать пакет Ultralytics Python, чтобы легко обучать и развертывать модели. Если вы предпочитаете работать без кода, Ultralytics HUB позволит вам опробовать YOLO11 всего за несколько кликов.

Прохождение кода YOLO11

Чтобы использовать YOLO11 с Python, вам сначала нужно установить пакет Ultralytics. В зависимости от ваших предпочтений, вы можете сделать это с помощью pip, conda или Docker. Для получения подробных инструкций и лучших практик, связанных с процессом установки, обязательно ознакомьтесь с нашим руководством по установке Ultralytics. При установке необходимых пакетов для YOLO11, если у вас возникнут какие-либо трудности, обратитесь к нашему Руководству по общим проблемам, чтобы найти решения и советы.

После установки пакета Ultralytics использование YOLO11 не вызывает затруднений. В следующем фрагменте кода показан процесс загрузки модели, ее обучения, тестирования производительности и экспорта в формат ONNX. За более подробными примерами и расширенными возможностями использования обязательно обратитесь к официальной документации Ultralytics, где вы найдете подробные руководства и лучшие практики для получения максимальной отдачи от YOLO11.

__wf_reserved_inherit
Рис. 5. Использование YOLO11 через пакет Ultralytics. 

Для пользователей, предпочитающих подход без кода, Ultralytics HUB предоставляет простой способ обучения и развертывания моделей YOLO11 с помощью всего нескольких щелчков мыши. Чтобы начать работу с HUB, достаточно создать учетную запись на платформе Ultralytics HUB, и вы сможете приступить к обучению и управлению своими моделями с помощью интуитивно понятного интерфейса.

YOLO11: формирование будущего искусственного интеллекта зрения

ИИ-сообщество постоянно развивает область компьютерного зрения, стремясь разработать более быстрые и точные модели для реальных приложений. Ultralytics YOLO11 является важной вехой в этом направлении, обеспечивая повышенную скорость, точность и гибкость. Он предназначен для работы в режиме реального времени и в краевых приложениях, что делает его идеальным для таких отраслей, как здравоохранение и автономное вождение. Независимо от того, используете ли вы пакет Ultralytics Python или хаб Ultralytics без кода, YOLO11 упрощает сложные задачи Vision AI. Он обеспечивает мощные возможности компьютерного зрения, что делает его отличным выбором для разработчиков и предприятий.

Ознакомьтесь с нашим репозиторием на GitHub и присоединяйтесь к нашему активному сообществу, чтобы узнать больше об искусственном интеллекте. Узнайте, как искусственный интеллект Vision AI способствует инновациям в таких отраслях, как здравоохранение и сельское хозяйство.

Давайте вместе построим будущее
искусственного интеллекта!

Начните свое путешествие в будущее машинного обучения

Начните бесплатно
Ссылка копируется в буфер обмена