Сравнение Ultralytics YOLO11 с предыдущими моделями YOLO

2 апреля 2025 г.
Сравните Ultralytics YOLOv8, YOLOv9, YOLOv10 и Ultralytics YOLO11, чтобы понять, как эти модели развивались и улучшались с 2023 по 2025 год.

2 апреля 2025 г.
Сравните Ultralytics YOLOv8, YOLOv9, YOLOv10 и Ultralytics YOLO11, чтобы понять, как эти модели развивались и улучшались с 2023 по 2025 год.
От автоматизации повседневных задач до помощи в принятии обоснованных решений в режиме реального времени, искусственный интеллект (ИИ) преобразует будущее различных отраслей. Одной из особенно интересных областей ИИ является компьютерное зрение, также известное как Vision AI. Оно фокусируется на том, чтобы научить машины анализировать и интерпретировать визуальные данные так, как это делают люди.
В частности, модели компьютерного зрения стимулируют инновации, повышающие как безопасность, так и эффективность. Например, эти модели используются в самоуправляемых автомобилях для обнаружения пешеходов и в камерах видеонаблюдения для круглосуточного мониторинга помещений.
Некоторые из самых известных моделей компьютерного зрения — это модели YOLO (You Only Look Once), известные своими возможностями обнаружения объектов в реальном времени. Со временем модели YOLO улучшились, и каждая новая версия предлагает лучшую производительность и большую гибкость.
Более новые версии, такие как Ultralytics YOLO11, могут выполнять различные задачи, такие как сегментация экземпляров, классификация изображений, оценка позы и отслеживание нескольких объектов, с большей точностью, скоростью и прецизионностью, чем когда-либо прежде.
В этой статье мы сравним Ultralytics YOLOv8, YOLOv9, YOLOv10 и Ultralytics YOLO11, чтобы лучше понять, как эти модели развивались. Мы проанализируем их ключевые особенности, результаты тестов и различия в производительности. Давайте начнем!
YOLOv8, выпущенная Ultralytics 10 января 2023 года, стала важным шагом вперед по сравнению с более ранними моделями YOLO. Она оптимизирована для точного обнаружения в реальном времени, сочетая хорошо протестированные подходы с инновационными обновлениями для достижения лучших результатов.
Выходя за рамки обнаружения объектов, она также поддерживает следующие задачи компьютерного зрения: сегментация экземпляров, оценка позы, обнаружение объектов с ориентированными ограничивающими рамками (OBB) и классификация изображений. Еще одной важной особенностью YOLOv8 является то, что она доступна в пяти различных вариантах моделей — Nano, Small, Medium, Large и X, — поэтому вы можете выбрать правильный баланс между скоростью и точностью в зависимости от ваших потребностей.
Благодаря своей универсальности и высокой производительности YOLOv8 можно использовать во многих реальных приложениях, таких как системы безопасности, умные города, здравоохранение и промышленная автоматизация.
Вот более подробный обзор некоторых других ключевых особенностей YOLOv8:
YOLOv9 была выпущена 21 февраля 2024 года Цзянь-Яо Ваном и Хун-Юанем Марком Ляо из Института информатики, Academia Sinica, Тайвань. Она поддерживает такие задачи, как обнаружение объектов и сегментация экземпляров.
Эта модель построена на основе Ultralytics YOLOv5 и представляет две основные инновации: Programmable Gradient Information (PGI) и Generalized Efficient Layer Aggregation Network (GELAN).
PGI помогает YOLOv9 сохранять важную информацию при обработке данных через свои слои, что приводит к более точным результатам. Между тем, GELAN улучшает использование слоев модели, повышая производительность и вычислительную эффективность. Благодаря этим улучшениям YOLOv9 может обрабатывать задачи в реальном времени на edge-устройствах и в мобильных приложениях, где вычислительные ресурсы часто ограничены.
Вот краткий обзор некоторых других ключевых особенностей YOLOv8:
YOLOv10 была представлена 23 мая 2024 года исследователями из Университета Цинхуа и ориентирована на обнаружение объектов в реальном времени. Она решает ограничения более ранних версий YOLO, устраняя необходимость в non-maximum suppression (NMS), этапе постобработки, используемом для устранения дублирующихся обнаружений, и совершенствуя общую конструкцию модели. Это приводит к более быстрому и эффективному обнаружению объектов, при этом достигается современная точность.
Важной частью того, что делает это возможным, является подход к обучению, известный как consistent dual-label assignments (согласованное назначение двойных меток). Он сочетает в себе две стратегии: одна позволяет нескольким прогнозам учиться на одном и том же объекте (one-to-many), а другая фокусируется на выборе наилучшего единичного прогноза (one-to-one). Поскольку обе стратегии следуют одним и тем же правилам сопоставления, модель учится избегать дубликатов самостоятельно, поэтому NMS не требуется.
Архитектура YOLOv10 также использует улучшенный backbone CSPNet для более эффективного изучения признаков и PAN (Path Aggregation Network), который объединяет информацию из разных слоев, что позволяет лучше обнаруживать как маленькие, так и большие объекты. Эти улучшения позволяют использовать YOLOv10 для реальных приложений в производстве, розничной торговле и автономном вождении.
Вот некоторые другие выдающиеся особенности YOLOv10:
В этом году, 30 сентября, компания Ultralytics официально представила YOLO11 — одну из последних моделей в серии YOLO — на своем ежегодном гибридном мероприятии YOLO Vision 2024 (YV24).
Этот релиз представил значительные улучшения по сравнению с предыдущими версиями. YOLO11 быстрее, точнее и эффективнее. Он поддерживает полный спектр задач компьютерного зрения, знакомых пользователям YOLOv8, включая обнаружение объектов, сегментацию экземпляров и классификацию изображений. Он также сохраняет совместимость с рабочими процессами YOLOv8, что упрощает плавный переход пользователей на новую версию.
Кроме того, YOLO11 разработан для удовлетворения широкого спектра вычислительных потребностей — от легких периферийных устройств до мощных облачных систем. Модель доступна как в версии с открытым исходным кодом, так и в корпоративной версии, что делает ее адаптируемой для различных вариантов использования.
Это отличный вариант для задач, требующих высокой точности, таких как медицинская визуализация и спутниковое обнаружение, а также для более широкого применения в автономных транспортных средствах, сельском хозяйстве и здравоохранении.
Вот некоторые другие уникальные особенности YOLO11:
При изучении различных моделей не всегда легко сравнить их, просто взглянув на их характеристики. Здесь-то и приходит на помощь бенчмаркинг. Запуская все модели на одном и том же наборе данных, мы можем объективно измерить и сравнить их производительность. Давайте посмотрим, как каждая модель работает на наборе данных COCO.
При сравнении моделей YOLO каждая новая версия приносит заметные улучшения в отношении точности, скорости и гибкости. В частности, YOLO11m делает здесь скачок, поскольку использует на 22% меньше параметров, чем YOLOv8m, что означает, что она легче и быстрее в работе. Кроме того, несмотря на меньший размер, она достигает более высокого среднего значения точности (mAP) на наборе данных COCO. Этот показатель измеряет, насколько хорошо модель обнаруживает и локализует объекты, поэтому более высокий mAP означает более точные прогнозы.
Давайте рассмотрим, как эти модели работают в реальной ситуации.
Чтобы сравнить YOLOv8, YOLOv9, YOLOv10 и YOLO11, все четыре были запущены на одном и том же видео о дорожном движении с использованием порога уверенности 0,3 (модель отображает обнаружения только тогда, когда она уверена как минимум на 30%, что правильно идентифицировала объект) и размера изображения 640 для справедливой оценки. Результаты обнаружения и отслеживания объектов выявили ключевые различия в точности обнаружения, скорости и точности.
С первого кадра YOLO11 обнаружила крупные транспортные средства, такие как грузовики, которые YOLOv10 пропустила. YOLOv8 и YOLOv9 показали достойную производительность, но она варьировалась в зависимости от условий освещения и размера объекта. Меньшие, удаленные транспортные средства оставались проблемой для всех моделей, хотя YOLO11 также показала заметные улучшения в этих обнаружениях.
С точки зрения скорости, все модели работали в диапазоне от 10 до 20 миллисекунд на кадр, достаточно быстро, чтобы обрабатывать задачи в реальном времени со скоростью более 50 FPS. С одной стороны, YOLOv8 и YOLOv9 обеспечивали стабильное и надежное обнаружение на протяжении всего видео. Интересно, что YOLOv10, разработанная для снижения задержки, была быстрее, но показала некоторые несоответствия в обнаружении определенных типов объектов.
YOLO11, с другой стороны, выделялась своей точностью, предлагая сильный баланс между скоростью и точностью. Хотя ни одна из моделей не работала идеально в каждом кадре, сравнение бок о бок ясно показало, что YOLO11 обеспечивает наилучшую общую производительность.
Выбор модели для проекта зависит от его конкретных требований. Например, в некоторых приложениях может быть приоритетной скорость, в то время как другие могут требовать более высокой точности или сталкиваться с ограничениями развертывания, которые влияют на решение.
Еще одним важным фактором является тип задач компьютерного зрения, которые вам необходимо решать. Если вам нужна большая гибкость в различных задачах, YOLOv8 и YOLO11 — хорошие варианты.
Выбор между YOLOv8 и YOLO11 действительно зависит от ваших потребностей. YOLOv8 — отличный вариант, если вы новичок в компьютерном зрении и цените большое сообщество, больше учебных материалов и широкую интеграцию со сторонними сервисами.
С другой стороны, если вам нужна передовая производительность с большей точностью и скоростью, YOLO11 — лучший выбор, хотя у нее меньше сообщество и меньше интеграций, поскольку это более новый релиз.
Эволюция серии моделей YOLO от Ultralytics YOLOv8 до Ultralytics YOLO11 отражает последовательное стремление к созданию более интеллектуальных моделей компьютерного зрения. Каждая версия YOLO приносит значимые улучшения с точки зрения скорости, точности и прецизионности.
По мере развития компьютерного зрения эти модели предлагают надежные решения реальных задач, от обнаружения объектов до автономных систем. Постоянное развитие моделей YOLO показывает, как далеко продвинулась эта область и чего еще можно ожидать в будущем.
Чтобы узнать больше об ИИ, посетите наш репозиторий GitHub и присоединяйтесь к нашему сообществу. Откройте для себя достижения в различных отраслях, от Vision AI в производстве до компьютерного зрения в здравоохранении. Ознакомьтесь с нашими вариантами лицензирования, чтобы начать свои проекты в области Vision AI уже сегодня.