Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас

Преимущества Ultralytics YOLO11 как безъякорного детектора

Абирами Вина

5 мин чтения

5 декабря 2024 г.

Узнайте, как Ultralytics YOLO11 поддерживает обнаружение объектов без якорей и какие преимущества дает эта модельная архитектура различным приложениям.

Если мы оглянемся на историю моделей Vision AI, то концепция обнаружения объектов — основная задача компьютерного зрения, которая включает в себя идентификацию и локализацию объектов на изображении или видео — существует с 1960-х годов. Однако ключевая причина ее значимости в передовых инновациях сегодня заключается в том, что методы обнаружения объектов и архитектуры моделей с тех пор продвинулись и быстро улучшились. 

В предыдущей статье мы обсудили эволюцию обнаружения объектов и путь, который привел к моделям Ultralytics YOLO . Сегодня мы сосредоточимся на изучении более конкретной вехи этого пути: перехода от детекторов, основанных на якорях, к детекторам без якорей. 

Детекторы на основе якорей используют предопределенные рамки, называемые «якорями», для прогнозирования местоположения объектов на изображении. В отличие от них, детекторы без якорей пропускают эти предопределенные рамки и вместо этого прогнозируют местоположение объектов напрямую.

Хотя это изменение может показаться простым и логичным, на самом деле оно привело к значительному повышению точности и эффективности обнаружения объектов. В этой статье мы узнаем, как безъякорные детекторы изменили компьютерное зрение благодаря таким достижениям, как Ultralytics YOLO11.

Что такое детекторы на основе anchor boxes?

Детекторы на основе якорей используют предопределенные рамки, известные как якоря, чтобы помочь определить местоположение объектов на изображении. Представьте себе эти якоря как сетку рамок разных размеров и форм, размещенных над изображением. Затем модель регулирует эти рамки, чтобы соответствовать обнаруженным объектам. Например, если модель идентифицирует автомобиль, она изменит рамку якоря, чтобы более точно соответствовать положению и размеру автомобиля.

Каждый якорь связан с возможным объектом на изображении, и в процессе обучения модель учится настраивать ячейки якоря, чтобы они лучше соответствовали местоположению, размеру и соотношению сторон объекта. Это позволяет модели detect объекты разного масштаба и ориентации. Однако выбор правильного набора якорных ячеек может занять много времени, а процесс их точной настройки чреват ошибками.

__wf_reserved_inherit
Рис. 1. Что такое Anchor Box?

Хотя детекторы на основе якорей, такие как YOLOv4, хорошо работают во многих приложениях, у них есть некоторые недостатки. Например, якорные блоки не всегда хорошо совмещаются с объектами разных форм и размеров, что затрудняет detect небольших объектов или объектов неправильной формы. Процесс выбора и точной настройки размеров якорных блоков также может занимать много времени и требует больших ручных усилий. Кроме того, модели на основе якорей часто испытывают трудности с обнаружением объектов, которые находятся в тени или перекрываются, поскольку предопределенные ячейки могут плохо адаптироваться к этим более сложным сценариям.

Переход к обнаружению объектов без якорей

Детекторы без привязки к якорям начали привлекать внимание в 2018 году с появлением таких моделей, как CornerNet и CenterNet, которые предложили новый подход к обнаружению объектов, устранив необходимость в предопределенных ограничивающих рамках. В отличие от традиционных моделей, которые полагаются на ограничивающие рамки разных размеров и форм для прогнозирования местоположения объектов, модели без якорей прогнозируют местоположение объектов напрямую. Они фокусируются на ключевых точках или признаках объекта, таких как центр, что упрощает процесс обнаружения и делает его более быстрым и точным.

Вот как обычно работают модели без привязки к якорям:

  • Определение ключевых точек: Вместо использования предопределенных рамок некоторые модели определяют важные точки на объекте, такие как центр или определенные углы. Эти ключевые точки помогают моделям понять, где находится объект и насколько он велик.
  • Центр прогнозирования: Некоторые модели фокусируются на прогнозировании центра объекта. Как только центр определен, модель может предсказать размер и положение всего объекта оттуда.
  • Тепловая карта регрессии: Многие модели без привязки используют тепловые карты, где каждый пиксель представляет возможное местоположение объекта. Более сильные значения тепловой карты указывают на более высокую уверенность в том, что объект присутствует в этой точке.
__wf_reserved_inherit
Рис. 2. Обнаружение на основе якорей против обнаружения без якорей.

Поскольку безъякорные модели не зависят от якорных ящиков, они имеют более простую конструкцию. Это означает, что они более эффективны с вычислительной точки зрения. Поскольку им не нужно обрабатывать множество якорных ящиков, они могут быстрее detect объекты, что является важным преимуществом в приложениях реального времени, таких как автономное вождение и видеонаблюдение. 

Безъякорные модели также гораздо лучше справляются с маленькими, нерегулярными или закрытыми объектами. Поскольку они сосредоточены на обнаружении ключевых точек, а не на попытках подогнать их под якорные коробки, они гораздо более гибкие. Это позволяет им точно detect объекты в загроможденном или сложном окружении, где модели, основанные на якорях, могут не справиться.

Ultralytics YOLO11: детектор без якоря

Модели YOLO , изначально созданные для скорости и эффективности, постепенно перешли от методов, основанных на якорях, к безъякорному обнаружению, что сделало такие модели, как YOLO11 , более быстрыми, гибкими и лучше подходящими для широкого спектра приложений, работающих в режиме реального времени.

Вот краткий обзор эволюции безъякорной конструкции в разных версиях YOLO :

  • Ultralytics YOLOv5u: Представлена безъякорная сплит-головка Ultralytics , устраняющая необходимость в предопределенных якорных ящиках. Вместо этого модель напрямую предсказывает, где находятся объекты на изображении, упрощая процесс и повышая гибкость и скорость.
  • YOLOv6: Был использован новый метод, названный Anchor-Aided Training (AAT), в котором якоря использовались только во время обучения. Это позволило модели извлечь выгоду из структуры методов, основанных на якорях, во время обучения, но при этом использовать обнаружение без якорей во время выполнения для повышения скорости и адаптивности.
  • Ultralytics YOLOv8: Полностью перешли на безъякорное обнаружение с помощью головки Anchor-Free Split Ultralytics . Это сделало модель более быстрой и точной, особенно для маленьких или странной формы объектов, которые не очень хорошо подходят для якорных блоков.
  • Ultralytics YOLO11: Развивает подход YOLOv8, основанный на отсутствии якорей, оптимизируя обнаружение еще больше за счет полного исключения якорных блоков. Это обеспечивает более быстрое и точное обнаружение для приложений реального времени, таких как мониторинг поведения животных и аналитика розничной торговли.
__wf_reserved_inherit
Рис. 3. Сравнение Ultralytics YOLOv8 и Ultralytics YOLO11.

Применение YOLO11 в реальном мире

Отличным примером преимуществ безъякорного обнаружения с помощью YOLO11 являются автономные автомобили. В самоуправляемых автомобилях быстрое и точное обнаружение пешеходов, других транспортных средств и препятствий имеет решающее значение для безопасности. Безъякорный подход YOLO11 упрощает процесс обнаружения, напрямую предсказывая ключевые точки объектов, такие как центр пешехода или границы другого транспортного средства, вместо того чтобы полагаться на предопределенные якорные точки. 

__wf_reserved_inherit
Рис. 4. Преимущества безъякорного обнаружения в YOLO11 (изображение автора).

YOLO11 не нужно настраивать или подгонять сетку якорей к каждому объекту, что может быть вычислительно дорого и медленно. Вместо этого он фокусируется на ключевых характеристиках, что делает его более быстрым и эффективным. Например, когда пешеход выходит на траекторию движения автомобиля, YOLO11 может быстро определить его местоположение, точно указывая на ключевые точки, даже если человек частично скрыт или движется. Способность адаптироваться к различным формам и размерам без использования якорных блоков позволяет YOLO11 detect объекты более надежно и на более высоких скоростях, что крайне важно для принятия решений в режиме реального времени в системах автономного вождения.

Другие области применения, в которых возможности YOLO11без якоря действительно выделяются, включают в себя:

  • Розничная торговля и управление запасами: YOLO11 позволяет отслеживать товары на полках, даже если они сложены в стопки или частично завалены. Это помогает быстрее и точнее отслеживать товарные запасы и сокращает количество ошибок.
  • Медицинская визуализация: YOLO11 также эффективен в здравоохранении, где он может detect опухоли или другие аномалии на медицинских снимках. Его способность работать с объектами неправильной формы помогает повысить точность диагностики сложных заболеваний.
  • Мониторинг дикой природы: В исследованиях дикой природы YOLO11 может track животных в густых лесах или на труднопроходимой местности, помогая ученым следить за поведением или защищать исчезающие виды.
  • Спортивная аналитика: YOLO11 можно использовать для track игроков, движения мяча или других элементов в режиме реального времени во время спортивных событий, чтобы предоставить ценные сведения командам, тренерам и телеведущим.

Соображения, которые следует учитывать при работе с моделями без привязки к anchor boxes

Хотя модели без привязки, такие как YOLO11 , имеют множество преимуществ, они все же имеют определенные ограничения. Одно из главных практических соображений заключается в том, что даже безъякорные модели могут испытывать трудности с окклюзиями или сильно перекрывающимися объектами. Это объясняется тем, что компьютерное зрение нацелено на воспроизведение человеческого зрения, и так же, как мы иногда сталкиваемся с трудностями при идентификации закрытых объектов, модели ИИ могут столкнуться с подобными проблемами.

Еще один интересный фактор связан с обработкой предсказаний модели. Хотя архитектура моделей без якорей проще, чем с якорями, в некоторых случаях требуется дополнительная доработка. Например, для очистки перекрывающихся предсказаний или повышения точности в переполненных сценах могут потребоваться методы постобработки, такие как немаксимальное подавлениеNMS).

Бросьте якорь на будущее искусственного интеллекта вместе с YOLO11

Переход от обнаружения на основе якорей к обнаружению без якорей стал значительным прогрессом в области обнаружения объектов. Модели без якорей, такие как YOLO11, упрощают процесс, что приводит к повышению точности и скорости.

На примере YOLO11 мы убедились, что безъякорное обнаружение объектов лучше всего работает в таких приложениях реального времени, как самоуправляемые автомобили, видеонаблюдение и медицинская визуализация, где очень важно быстрое и точное обнаружение. Такой подход позволяет YOLO11 легче адаптироваться к различным размерам объектов и сложным сценам, обеспечивая лучшую производительность в различных средах.

По мере развития компьютерного зрения обнаружение объектов будет только ускоряться, становиться более гибким и эффективным.

Изучите наш репозиторий на GitHub и присоединяйтесь к нашему активному сообществу, чтобы быть в курсе всех новостей об ИИ. Узнайте, как Vision AI влияет на такие сектора, как производство и сельское хозяйство.

Давайте строить будущее
ИИ вместе!

Начните свой путь в будущее машинного обучения

Начать бесплатно