Настраивайтесь на YOLO Vision 2025!
25 сентября 2025 г.
10:00 — 18:00 BST
Гибридное мероприятие
Yolo Vision 2024

Сравнение Ultralytics YOLO11 с предыдущими моделями YOLO

Абирами Вина

4 мин чтения

2 апреля 2025 г.

Сравните Ultralytics YOLOv8, YOLOv9, YOLOv10 и Ultralytics YOLO11, чтобы понять, как эти модели развивались и улучшались с 2023 по 2025 год.

От автоматизации повседневных задач до помощи в принятии обоснованных решений в режиме реального времени, искусственный интеллект (ИИ) преобразует будущее различных отраслей. Одной из особенно интересных областей ИИ является компьютерное зрение, также известное как Vision AI. Оно фокусируется на том, чтобы научить машины анализировать и интерпретировать визуальные данные так, как это делают люди. 

В частности, модели компьютерного зрения стимулируют инновации, повышающие как безопасность, так и эффективность. Например, эти модели используются в самоуправляемых автомобилях для обнаружения пешеходов и в камерах видеонаблюдения для круглосуточного мониторинга помещений. 

Некоторые из самых известных моделей компьютерного зрения — это модели YOLO (You Only Look Once), известные своими возможностями обнаружения объектов в реальном времени. Со временем модели YOLO улучшились, и каждая новая версия предлагает лучшую производительность и большую гибкость.

Более новые версии, такие как Ultralytics YOLO11, могут выполнять различные задачи, такие как сегментация экземпляров, классификация изображений, оценка позы и отслеживание нескольких объектов, с большей точностью, скоростью и прецизионностью, чем когда-либо прежде.

В этой статье мы сравним Ultralytics YOLOv8, YOLOv9, YOLOv10 и Ultralytics YOLO11, чтобы лучше понять, как эти модели развивались. Мы проанализируем их ключевые особенности, результаты тестов и различия в производительности. Давайте начнем!

Обзор Ultralytics YOLOv8

YOLOv8, выпущенная Ultralytics 10 января 2023 года, стала важным шагом вперед по сравнению с более ранними моделями YOLO. Она оптимизирована для точного обнаружения в реальном времени, сочетая хорошо протестированные подходы с инновационными обновлениями для достижения лучших результатов.

Выходя за рамки обнаружения объектов, она также поддерживает следующие задачи компьютерного зрения: сегментация экземпляров, оценка позы, обнаружение объектов с ориентированными ограничивающими рамками (OBB) и классификация изображений. Еще одной важной особенностью YOLOv8 является то, что она доступна в пяти различных вариантах моделей — Nano, Small, Medium, Large и X, — поэтому вы можете выбрать правильный баланс между скоростью и точностью в зависимости от ваших потребностей.

Благодаря своей универсальности и высокой производительности YOLOv8 можно использовать во многих реальных приложениях, таких как системы безопасности, умные города, здравоохранение и промышленная автоматизация.

__wf_reserved_inherit
Рис. 1. Управление парковкой в умных городах с помощью YOLOv8.

Ключевые особенности YOLOv8

Вот более подробный обзор некоторых других ключевых особенностей YOLOv8:

  • Улучшенная архитектура обнаружения: YOLOv8 использует улучшенный backbone CSPDarknet. Этот backbone оптимизирован для извлечения признаков — процесса идентификации и захвата важных закономерностей или деталей из входных изображений, которые помогают модели делать точные прогнозы.

  • Детекционная головка: В ней используется anchor-free (без привязки к якорям), разделенная конструкция, что означает, что она не полагается на заданные формы ограничивающих рамок (якоря), а вместо этого учится предсказывать местоположение объектов напрямую. Благодаря разделенной структуре задачи классификации объекта и прогнозирования его местоположения (регрессия) решаются отдельно, что помогает повысить точность и ускорить обучение.

  • Баланс между точностью и скоростью: Эта модель обеспечивает впечатляющую точность, сохраняя при этом высокую скорость inference, что делает ее подходящей как для облачных, так и для edge-сред.

  • Удобство использования: YOLOv8 разработана таким образом, чтобы с ней было легко начать работу — вы можете начать прогнозировать и видеть результаты всего за несколько минут, используя пакет Ultralytics Python.

YOLOv9 фокусируется на вычислительной эффективности

YOLOv9 была выпущена 21 февраля 2024 года Цзянь-Яо Ваном и Хун-Юанем Марком Ляо из Института информатики, Academia Sinica, Тайвань. Она поддерживает такие задачи, как обнаружение объектов и сегментация экземпляров

Эта модель построена на основе Ultralytics YOLOv5 и представляет две основные инновации: Programmable Gradient Information (PGI) и Generalized Efficient Layer Aggregation Network (GELAN). 

PGI помогает YOLOv9 сохранять важную информацию при обработке данных через свои слои, что приводит к более точным результатам. Между тем, GELAN улучшает использование слоев модели, повышая производительность и вычислительную эффективность. Благодаря этим улучшениям YOLOv9 может обрабатывать задачи в реальном времени на edge-устройствах и в мобильных приложениях, где вычислительные ресурсы часто ограничены.

__wf_reserved_inherit
Рис. 2. Понимание того, как GELAN повышает точность YOLOv9.

Ключевые особенности YOLOv9

Вот краткий обзор некоторых других ключевых особенностей YOLOv8:

  • Высокая точность и эффективность: YOLOv9 обеспечивает высокую точность обнаружения, не потребляя много вычислительной мощности, что делает ее отличным выбором при ограниченных ресурсах.
  • Легковесные модели: Легковесные варианты модели YOLOv9 оптимизированы для развертывания на edge-устройствах и в мобильных приложениях. 
  • Простота использования: YOLOv9 поддерживается пакетом Ultralytics Python, поэтому ее легко настроить и запустить в различных средах, независимо от того, используете ли вы код или командную строку.

YOLOv10 обеспечивает обнаружение объектов без NMS

YOLOv10 была представлена 23 мая 2024 года исследователями из Университета Цинхуа и ориентирована на обнаружение объектов в реальном времени. Она решает ограничения более ранних версий YOLO, устраняя необходимость в non-maximum suppression (NMS), этапе постобработки, используемом для устранения дублирующихся обнаружений, и совершенствуя общую конструкцию модели. Это приводит к более быстрому и эффективному обнаружению объектов, при этом достигается современная точность.

Важной частью того, что делает это возможным, является подход к обучению, известный как consistent dual-label assignments (согласованное назначение двойных меток). Он сочетает в себе две стратегии: одна позволяет нескольким прогнозам учиться на одном и том же объекте (one-to-many), а другая фокусируется на выборе наилучшего единичного прогноза (one-to-one). Поскольку обе стратегии следуют одним и тем же правилам сопоставления, модель учится избегать дубликатов самостоятельно, поэтому NMS не требуется.

__wf_reserved_inherit
Рис. 3. YOLOv10 использует consistent dual-label assignments для обучения без NMS.

Архитектура YOLOv10 также использует улучшенный backbone CSPNet для более эффективного изучения признаков и PAN (Path Aggregation Network), который объединяет информацию из разных слоев, что позволяет лучше обнаруживать как маленькие, так и большие объекты. Эти улучшения позволяют использовать YOLOv10 для реальных приложений в производстве, розничной торговле и автономном вождении.

Ключевые особенности YOLOv10

Вот некоторые другие выдающиеся особенности YOLOv10:

  • Свёртки с большими ядрами: Модель использует свёртки с большими ядрами, чтобы захватывать больше контекста из более широких областей изображения, помогая ей лучше понимать общую сцену.
  • Модули частичного самовнимания: Модель включает модули частичного самовнимания, чтобы сосредоточиться на наиболее важных частях изображения, не используя слишком много вычислительной мощности, что эффективно повышает производительность.
  • Уникальный вариант модели: Наряду с обычными размерами YOLOv10 — Nano, Small, Medium, Large и X — существует также специальная версия под названием YOLOv10b (Balanced). Это более широкая модель, что означает, что она обрабатывает больше признаков на каждом слое, что помогает повысить точность, сохраняя при этом баланс между скоростью и размером.
  • Удобство использования: YOLOv10 совместим с Python-пакетом Ultralytics, что делает его простым в использовании.

Ultralytics YOLO11: Повышенная скорость и точность

В этом году, 30 сентября, компания Ultralytics официально представила YOLO11 — одну из последних моделей в серии YOLO — на своем ежегодном гибридном мероприятии YOLO Vision 2024 (YV24).

Этот релиз представил значительные улучшения по сравнению с предыдущими версиями. YOLO11 быстрее, точнее и эффективнее. Он поддерживает полный спектр задач компьютерного зрения, знакомых пользователям YOLOv8, включая обнаружение объектов, сегментацию экземпляров и классификацию изображений. Он также сохраняет совместимость с рабочими процессами YOLOv8, что упрощает плавный переход пользователей на новую версию.

Кроме того, YOLO11 разработан для удовлетворения широкого спектра вычислительных потребностей — от легких периферийных устройств до мощных облачных систем. Модель доступна как в версии с открытым исходным кодом, так и в корпоративной версии, что делает ее адаптируемой для различных вариантов использования.

Это отличный вариант для задач, требующих высокой точности, таких как медицинская визуализация и спутниковое обнаружение, а также для более широкого применения в автономных транспортных средствах, сельском хозяйстве и здравоохранении.

__wf_reserved_inherit
Рис. 4. Использование Ultralytics YOLO11 для обнаружения, подсчета и отслеживания трафика.

Ключевые особенности YOLO11

Вот некоторые другие уникальные особенности YOLO11:

  • Быстрое и эффективное обнаружение: YOLO11 имеет головку обнаружения, разработанную для минимизации задержки и ориентированную на скорость на последних слоях прогнозирования без ущерба для производительности.
  • Улучшенное извлечение признаков: Оптимизированная архитектура backbone и neck улучшает извлечение признаков, что приводит к более точным прогнозам. 
  • Простое развертывание на различных платформах: YOLO11 оптимизирован для эффективной работы на периферийных устройствах, облачных платформах и графических процессорах NVIDIA, что обеспечивает адаптивность в различных средах.

Бенчмаркинг моделей YOLO на наборе данных COCO

При изучении различных моделей не всегда легко сравнить их, просто взглянув на их характеристики. Здесь-то и приходит на помощь бенчмаркинг. Запуская все модели на одном и том же наборе данных, мы можем объективно измерить и сравнить их производительность. Давайте посмотрим, как каждая модель работает на наборе данных COCO.

При сравнении моделей YOLO каждая новая версия приносит заметные улучшения в отношении точности, скорости и гибкости. В частности, YOLO11m делает здесь скачок, поскольку использует на 22% меньше параметров, чем YOLOv8m, что означает, что она легче и быстрее в работе. Кроме того, несмотря на меньший размер, она достигает более высокого среднего значения точности (mAP) на наборе данных COCO. Этот показатель измеряет, насколько хорошо модель обнаруживает и локализует объекты, поэтому более высокий mAP означает более точные прогнозы. 

__wf_reserved_inherit
Рис. 5. Бенчмаркинг YOLO11 и других моделей YOLO на наборе данных COCO.

Тестирование и сравнение моделей YOLO на видео

Давайте рассмотрим, как эти модели работают в реальной ситуации.

Чтобы сравнить YOLOv8, YOLOv9, YOLOv10 и YOLO11, все четыре были запущены на одном и том же видео о дорожном движении с использованием порога уверенности 0,3 (модель отображает обнаружения только тогда, когда она уверена как минимум на 30%, что правильно идентифицировала объект) и размера изображения 640 для справедливой оценки. Результаты обнаружения и отслеживания объектов выявили ключевые различия в точности обнаружения, скорости и точности. 

С первого кадра YOLO11 обнаружила крупные транспортные средства, такие как грузовики, которые YOLOv10 пропустила. YOLOv8 и YOLOv9 показали достойную производительность, но она варьировалась в зависимости от условий освещения и размера объекта. Меньшие, удаленные транспортные средства оставались проблемой для всех моделей, хотя YOLO11 также показала заметные улучшения в этих обнаружениях.

__wf_reserved_inherit
Рис. 6. Сравнение YOLOv8, YOLOv9, YOLOv10 и YOLO11.

С точки зрения скорости, все модели работали в диапазоне от 10 до 20 миллисекунд на кадр, достаточно быстро, чтобы обрабатывать задачи в реальном времени со скоростью более 50 FPS. С одной стороны, YOLOv8 и YOLOv9 обеспечивали стабильное и надежное обнаружение на протяжении всего видео. Интересно, что YOLOv10, разработанная для снижения задержки, была быстрее, но показала некоторые несоответствия в обнаружении определенных типов объектов. 

YOLO11, с другой стороны, выделялась своей точностью, предлагая сильный баланс между скоростью и точностью. Хотя ни одна из моделей не работала идеально в каждом кадре, сравнение бок о бок ясно показало, что YOLO11 обеспечивает наилучшую общую производительность. 

Какая модель YOLO лучше всего подходит для задач компьютерного зрения?

Выбор модели для проекта зависит от его конкретных требований. Например, в некоторых приложениях может быть приоритетной скорость, в то время как другие могут требовать более высокой точности или сталкиваться с ограничениями развертывания, которые влияют на решение. 

Еще одним важным фактором является тип задач компьютерного зрения, которые вам необходимо решать. Если вам нужна большая гибкость в различных задачах, YOLOv8 и YOLO11 — хорошие варианты.

Выбор между YOLOv8 и YOLO11 действительно зависит от ваших потребностей. YOLOv8 — отличный вариант, если вы новичок в компьютерном зрении и цените большое сообщество, больше учебных материалов и широкую интеграцию со сторонними сервисами

С другой стороны, если вам нужна передовая производительность с большей точностью и скоростью, YOLO11 — лучший выбор, хотя у нее меньше сообщество и меньше интеграций, поскольку это более новый релиз.

Основные выводы

Эволюция серии моделей YOLO от Ultralytics YOLOv8 до Ultralytics YOLO11 отражает последовательное стремление к созданию более интеллектуальных моделей компьютерного зрения. Каждая версия YOLO приносит значимые улучшения с точки зрения скорости, точности и прецизионности. 

По мере развития компьютерного зрения эти модели предлагают надежные решения реальных задач, от обнаружения объектов до автономных систем. Постоянное развитие моделей YOLO показывает, как далеко продвинулась эта область и чего еще можно ожидать в будущем.

Чтобы узнать больше об ИИ, посетите наш репозиторий GitHub и присоединяйтесь к нашему сообществу. Откройте для себя достижения в различных отраслях, от Vision AI в производстве до компьютерного зрения в здравоохранении. Ознакомьтесь с нашими вариантами лицензирования, чтобы начать свои проекты в области Vision AI уже сегодня.

Давайте строить будущее
ИИ вместе!

Начните свой путь в будущее машинного обучения

Начать бесплатно
Ссылка скопирована в буфер обмена