Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Ultralytics YOLO

Сравнение Ultralytics YOLO11 с предыдущими моделями YOLO

Сравни Ultralytics YOLOv8, YOLOv9, YOLOv10 и Ultralytics YOLO11, чтобы понять, как эти модели развивались и совершенствовались с 2023 по 2025 годы.

АБАбирами Вина
4 min read
Сравнение YOLO11 с предыдущими моделями YOLO

От автоматизации повседневных задач до принятия обоснованных решений в режиме реального времени — искусственный интеллект (ИИ) меняет будущее различных отраслей. Одной из наиболее захватывающих областей ИИ является компьютерное зрение, также известное как Vision AI. Оно направлено на то, чтобы дать машинам возможность анализировать и интерпретировать визуальные данные так же, как это делают люди.

В частности, модели компьютерного зрения стимулируют инновации, повышающие как безопасность, так и эффективность. Например, такие модели используются в беспилотных автомобилях для обнаружения пешеходов и в камерах видеонаблюдения для круглосуточного контроля помещений.

Одни из самых известных моделей компьютерного зрения — это модели YOLO (You Only Look Once), которые славятся своими возможностями обнаружения объектов в реальном времени. Со временем модели YOLO совершенствовались, и каждая новая версия предлагала более высокую производительность и гибкость.

Более новые версии, такие как Ultralytics YOLO11, справляются с множеством задач, включая сегментацию экземпляров, классификацию изображений, оценку позы и отслеживание нескольких объектов, с более высокой точностью, скоростью и результативностью, чем когда-либо прежде.

В этой статье мы сравним Ultralytics YOLOv8, YOLOv9, YOLOv10 и Ultralytics YOLO11, чтобы лучше понять, как развивались эти модели. Мы проанализируем их ключевые особенности, результаты бенчмарков и различия в производительности. Давай начнем!

Link to this sectionОбзор Ultralytics YOLOv8#

YOLOv8, выпущенная компанией Ultralytics 10 января 2023 года, стала значительным шагом вперед по сравнению с предыдущими моделями YOLO. Она оптимизирована для точного обнаружения в реальном времени, объединяя проверенные подходы с инновационными обновлениями для достижения лучших результатов.

Выходя за рамки обнаружения объектов, она также поддерживает следующие задачи компьютерного зрения: сегментацию экземпляров, оценку позы, обнаружение объектов с ориентированными ограничивающими рамками (OBB) и классификацию изображений. Еще одна важная особенность YOLOv8 заключается в том, что она доступна в пяти различных вариантах модели — Nano, Small, Medium, Large и X, — поэтому ты можешь выбрать оптимальный баланс скорости и точности в соответствии со своими потребностями.

Благодаря своей универсальности и высокой производительности, YOLOv8 находит применение во многих реальных задачах, таких как системы безопасности, «умные города», здравоохранение и промышленная автоматизация.

Управление парковкой в умных городах с помощью YOLOv8

Рис. 1. Управление парковкой в «умных городах» с помощью YOLOv8.

Link to this sectionКлючевые особенности YOLOv8#

Давай подробнее рассмотрим некоторые другие ключевые особенности YOLOv8:

  • Улучшенная архитектура обнаружения: YOLOv8 использует улучшенный бэкбон CSPDarknet. Этот бэкбон оптимизирован для извлечения признаков — процесса идентификации и сбора важных паттернов или деталей из входных изображений, которые помогают модели делать точные предсказания.
  • Голова обнаружения (Detection head): Она использует безякорный (anchor-free) декоплированный дизайн, что означает, что она не опирается на предустановленные формы ограничивающих рамок (якоря), а учится предсказывать расположение объектов напрямую. Благодаря декоплированной структуре задачи классификации объекта и определения его местоположения (регрессия) выполняются отдельно, что помогает повысить точность и ускорить обучение.
  • Баланс точности и скорости: Эта модель достигает впечатляющей точности, сохраняя при этом малое время вывода, что делает ее подходящей как для облачных, так и для периферийных (edge) сред.
  • Удобство использования: YOLOv8 разработана так, чтобы с ней было легко начать работать: ты можешь приступить к прогнозированию и получению результатов всего за несколько минут с помощью пакета Ultralytics Python.

Link to this sectionYOLOv9 фокусируется на вычислительной эффективности#

YOLOv9 была выпущена 21 февраля 2024 года Чиен-Яо Вангом и Хонг-Юань Марком Ляо из Института информационных наук Academia Sinica, Тайвань. Она поддерживает такие задачи, как обнаружение объектов и сегментация экземпляров.

Эта модель основана на Ultralytics YOLOv5 и представляет две важные инновации: Programmable Gradient Information (PGI) и Generalized Efficient Layer Aggregation Network (GELAN).

PGI помогает YOLOv9 сохранять важную информацию при обработке данных через свои слои, что ведет к более точным результатам. В то же время GELAN улучшает использование слоев моделью, повышая производительность и вычислительную эффективность. Благодаря этим обновлениям YOLOv9 может справляться с задачами в реальном времени на периферийных устройствах и в мобильных приложениях, где вычислительные ресурсы часто ограничены.

Диаграмма того, как GELAN повышает точность YOLOv9

Рис. 2. Понимание того, как GELAN повышает точность YOLOv9.

Link to this sectionКлючевые особенности YOLOv9#

Давай взглянем на некоторые другие ключевые особенности YOLOv9:

  • Высокая точность при эффективности: YOLOv9 обеспечивает высокую точность обнаружения, не потребляя много вычислительной мощности, что делает ее отличным выбором для случаев с ограниченными ресурсами.
  • Легковесные модели: Легкие варианты модели YOLOv9 оптимизированы для развертывания на периферийных и мобильных устройствах.
  • Простота использования: YOLOv9 поддерживается пакетом Ultralytics Python, поэтому ее легко настроить и запустить в разных средах, будь то использование кода или командной строки.

Link to this sectionYOLOv10 позволяет выполнять обнаружение объектов без NMS#

YOLOv10 была представлена 23 мая 2024 года исследователями из Университета Цинхуа и сфокусирована на обнаружении объектов в реальном времени. Она устраняет ограничения предыдущих версий YOLO за счет удаления необходимости в подавлении немаксимумов (NMS), этапа постобработки, используемого для удаления дубликатов обнаружений, и улучшения общего дизайна модели. Это приводит к более быстрому и эффективному обнаружению объектов при сохранении передовой точности.

Важной частью того, что делает это возможным, является подход к обучению, известный как «последовательное назначение меток с двойным присвоением» (consistent dual-label assignments). Он объединяет две стратегии: одну, позволяющую нескольким предсказаниям учиться на одном и том же объекте (one-to-many), и другую, фокусирующуюся на выборе лучшего единичного предсказания (one-to-one). Поскольку обе стратегии следуют одним и тем же правилам сопоставления, модель учится избегать дубликатов самостоятельно, поэтому NMS не требуется.

Диаграмма обучения YOLOv10 без использования NMS с двойным назначением меток

Рис. 3. YOLOv10 использует последовательное назначение меток с двойным присвоением для обучения без NMS.

Архитектура YOLOv10 также использует улучшенный бэкбон CSPNet для более эффективного обучения признаков и «шею» PAN (Path Aggregation Network), которая объединяет информацию из разных слоев, что делает модель лучше при обнаружении как маленьких, так и больших объектов. Эти улучшения позволяют использовать YOLOv10 в реальных задачах в производстве, розничной торговле и автономном вождении.

Link to this sectionКлючевые особенности YOLOv10#

Вот некоторые другие выдающиеся особенности YOLOv10:

  • Свертки с большим ядром (Large-kernel convolutions): Модель использует свертки с большим ядром для захвата большего контекста из более широких областей изображения, помогая лучше понимать общую сцену.

  • Модули частичного самовнимания (Partial self-attention modules): Модель включает модули частичного самовнимания, чтобы фокусироваться на наиболее важных частях изображения без чрезмерного потребления вычислительной мощности, эффективно повышая производительность.

  • Уникальный вариант модели: Наряду с обычными размерами YOLOv10 — Nano, Small, Medium, Large и X — существует специальная версия под названием YOLOv10b (Balanced). Это более широкая модель, что означает, что она обрабатывает больше признаков на каждом слое, что помогает повысить точность, сохраняя баланс между скоростью и размером.

  • Удобство использования: YOLOv10 совместима с пакетом Ultralytics Python, что упрощает ее использование.

Link to this sectionUltralytics YOLO11: Улучшенная скорость и точность#

В этом году, 30 сентября, Ultralytics официально представила YOLO11 — одну из последних моделей в серии YOLO — на своем ежегодном гибридном мероприятии YOLO Vision 2024 (YV24).

Этот релиз принес значительные улучшения по сравнению с предыдущими версиями. YOLO11 быстрее, точнее и обладает высокой эффективностью. Она поддерживает весь спектр задач компьютерного зрения, к которым привыкли пользователи YOLOv8, включая обнаружение объектов, сегментацию экземпляров и классификацию изображений. Она также сохраняет совместимость с рабочими процессами YOLOv8, облегчая пользователям переход на новую версию.

Более того, YOLO11 разработана для удовлетворения широкого спектра вычислительных потребностей — от легких периферийных устройств до мощных облачных систем. Модель доступна как в версии с открытым исходным кодом, так и в корпоративной версии, что делает ее адаптируемой для различных сценариев использования.

Это отличный вариант для высокоточных задач, таких как медицинская визуализация и спутниковое обнаружение, а также для более широкого применения в автономных транспортных средствах, сельском хозяйстве и здравоохранении.

Ultralytics YOLO11 обнаруживает, подсчитывает и отслеживает транспортные средства

Рис. 4. Использование Ultralytics YOLO11 для обнаружения, подсчета и отслеживания трафика.

Link to this sectionКлючевые особенности YOLO11#

Вот некоторые другие уникальные особенности YOLO11:

  • Быстрое и эффективное обнаружение: YOLO11 оснащена головой обнаружения, разработанной для минимальной задержки, с упором на скорость в финальных слоях предсказания без ущерба для производительности.
  • Улучшенное извлечение признаков: Оптимизированная архитектура бэкбона и «шеи» повышают качество извлечения признаков, что ведет к более точным предсказаниям.
  • Бесшовное развертывание на различных платформах: YOLO11 оптимизирована для эффективной работы на периферийных устройствах, в облачных платформах и на GPU NVIDIA, обеспечивая адаптивность в различных средах.

Link to this sectionБенчмаркинг моделей YOLO на датасете COCO#

При изучении различных моделей не всегда легко сравнить их, просто глядя на характеристики. Именно здесь на помощь приходит бенчмаркинг. Запуская все модели на одном и том же датасете, мы можем объективно измерить и сопоставить их производительность. Давай посмотрим, как каждая модель работает на датасете COCO.

При сравнении моделей YOLO каждая новая версия приносит заметные улучшения в точности, скорости и гибкости. В частности, YOLO11m делает большой шаг вперед, так как использует на 22% меньше параметров, чем YOLOv8m, что означает, что она легче и быстрее работает. Кроме того, несмотря на меньший размер, она достигает более высокого среднего показателя точности (mAP) на датасете COCO. Эта метрика измеряет, насколько хорошо модель обнаруживает и локализует объекты, поэтому более высокий mAP означает более точные предсказания.

Бенчмаркинг YOLO11 и других моделей YOLO на наборе данных COCO

Рис. 5. Бенчмаркинг YOLO11 и других моделей YOLO на датасете COCO.

Link to this sectionТестирование и сравнение моделей YOLO на видео#

Давай исследуем, как эти модели работают в реальной ситуации.

Чтобы сравнить YOLOv8, YOLOv9, YOLOv10 и YOLO11,, все четыре модели были протестированы на одном и том же видео с трафиком с использованием порога уверенности 0.3 (модель отображает обнаружения только тогда, когда она уверена не менее чем на 30% в том, что правильно идентифицировала объект) и размера изображения 640 для справедливой оценки. Результаты обнаружения и отслеживания объектов выявили ключевые различия в точности, скорости и аккуратности.

С первого кадра YOLO11 обнаружила крупные транспортные средства, такие как грузовики, которые YOLOv10 пропустила. YOLOv8 и YOLOv9 показали достойные результаты, но они варьировались в зависимости от условий освещения и размера объекта. Более мелкие и удаленные транспортные средства оставались проблемой для всех моделей, хотя YOLO11 продемонстрировала заметные улучшения и в этих обнаружениях.

Сравнение YOLOv8, YOLOv9, YOLOv10 и YOLO11

Рис. 6. Сравнение YOLOv8, YOLOv9, YOLOv10 и YOLO11.

Что касается скорости, все модели работали в диапазоне от 10 до 20 миллисекунд на кадр, что достаточно быстро для выполнения задач в реальном времени при частоте более 50 FPS. С одной стороны, YOLOv8 и YOLOv9 обеспечивали стабильные и надежные обнаружения на протяжении всего видео. Интересно, что YOLOv10, разработанная для меньшей задержки, работала быстрее, но показывала некоторую нестабильность при обнаружении определенных типов объектов.

YOLO11, напротив, выделялась своей точностью, предлагая отличный баланс между скоростью и аккуратностью. Хотя ни одна из моделей не работала идеально в каждом кадре, прямое сравнение наглядно показало, что YOLO11 продемонстрировала наилучшую общую производительность.

Link to this sectionКакая модель YOLO лучше всего подходит для задач компьютерного зрения?#

Выбор модели для проекта зависит от его конкретных требований. Например, в одних приложениях приоритетом может быть скорость, в то время как в других может потребоваться более высокая точность или могут существовать ограничения при развертывании, которые влияют на решение.

Еще одним важным фактором является тип задач компьютерного зрения, которые тебе необходимо решить. Если ты ищешь большую гибкость в разных задачах, YOLOv8 и YOLO11 — хорошие варианты.

Выбор между YOLOv8 и YOLO11 действительно зависит от твоих потребностей. YOLOv8 — надежный вариант, если ты новичок в компьютерном зрении и ценишь большое сообщество, множество руководств и обширные сторонние интеграции.

С другой стороны, если ты ищешь передовую производительность с лучшей точностью и скоростью, YOLO11 — лучший выбор, хотя у нее меньше сообщество и меньше интеграций в силу того, что это более новый релиз.

Link to this sectionОсновные выводы#

От Ultralytics YOLOv8 до Ultralytics YOLO11 эволюция серии моделей YOLO отражает постоянное стремление к созданию более интеллектуальных моделей компьютерного зрения. Каждая версия YOLO приносит значимые обновления в плане скорости, точности и аккуратности.

Поскольку компьютерное зрение продолжает развиваться, эти модели предлагают надежные решения для реальных задач: от обнаружения объектов до автономных систем. Продолжающаяся разработка моделей YOLO показывает, как далеко продвинулась эта область и чего еще мы можем ожидать в будущем.

Чтобы узнать больше об ИИ, посети наш репозиторий на GitHub и присоединяйся к нашему сообществу. Открывай для себя достижения в различных отраслях, от Vision AI в производстве до компьютерного зрения в здравоохранении. Ознакомься с нашими вариантами лицензирования, чтобы начать свои проекты в области Vision AI уже сегодня.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения