Преимущества Ultralytics YOLO11 как безъякорного детектора

Абирами Вина

5 минут чтения

5 декабря 2024 г.

Узнайте, как Ultralytics YOLO11 поддерживает обнаружение объектов без якорей и какие преимущества дает эта архитектура модели для различных приложений.

Если взглянуть на историю создания моделей искусственного интеллекта, то можно заметить, что концепция обнаружения объектов - основной задачи компьютерного зрения, которая заключается в идентификации и определении местоположения объектов на изображении или видео - существует с 1960-х годов. Однако ключевой причиной ее значимости в передовых инновациях сегодня является то, что с тех пор методы обнаружения объектов и архитектуры моделей быстро усовершенствовались. 

В предыдущей статье мы обсудили эволюцию обнаружения объектов и путь, который привел к моделям Ultralytics YOLO. Сегодня мы сосредоточимся на изучении более конкретной вехи этого пути: перехода от детекторов, основанных на якорях, к детекторам без якорей. 

Детекторы, основанные на якорях, опираются на заранее определенные ячейки, называемые "якорями", для предсказания местоположения объектов на изображении. В отличие от них, безъякорные детекторы пропускают эти предопределенные ячейки и вместо этого предсказывают местоположение объектов напрямую.

Хотя это изменение может показаться простым и логичным, на самом деле оно привело к значительному повышению точности и эффективности обнаружения объектов. В этой статье мы узнаем, как безъякорные детекторы изменили компьютерное зрение благодаря таким достижениям, как Ultralytics YOLO11.

Что такое детекторы на основе якорей?

Детекторы на основе якорей используют предопределенные ячейки, называемые якорями, для определения местоположения объектов на изображении. Представьте себе эти якоря как сетку из ящиков разных размеров и форм, расположенных на изображении. Затем модель настраивает эти ячейки в соответствии с обнаруженными объектами. Например, если модель идентифицирует автомобиль, она изменит якорный ящик, чтобы он более точно соответствовал положению и размеру автомобиля.

Каждый якорь связан с возможным объектом на изображении, и в процессе обучения модель учится настраивать ячейки якоря, чтобы они лучше соответствовали местоположению, размеру и соотношению сторон объекта. Это позволяет модели обнаруживать объекты разного масштаба и ориентации. Однако выбор правильного набора якорных ячеек может занять много времени, а процесс их точной настройки чреват ошибками.

__wf_reserved_inherit
Рис. 1. Что такое анкерный ящик?

Хотя детекторы на основе якорей, такие как YOLOv4, хорошо работают во многих приложениях, у них есть некоторые недостатки. Например, якорные блоки не всегда хорошо совмещаются с объектами разных форм и размеров, что затрудняет обнаружение небольших или неправильной формы объектов. Процесс выбора и точной настройки размеров якорных блоков также может занимать много времени и требует больших ручных усилий. Кроме того, модели на основе якорей часто испытывают трудности с обнаружением объектов, которые находятся в тени или перекрываются, поскольку предопределенные ячейки могут плохо адаптироваться к этим более сложным сценариям.

Переход к безъякорному обнаружению объектов

Безъякорные детекторы начали привлекать внимание в 2018 году благодаря таким моделям, как CornerNet и CenterNet, которые использовали новый подход к обнаружению объектов, отказавшись от использования предопределенных якорных блоков. В отличие от традиционных моделей, которые используют якорные ящики разных размеров и форм для предсказания местоположения объектов, безъякорные модели предсказывают местоположение объектов напрямую. Они фокусируются на ключевых точках или особенностях объекта, например на его центре, что упрощает процесс обнаружения и делает его более быстрым и точным.

Вот как обычно работают безъякорные модели:

  • Обнаружение ключевой точки: Вместо того чтобы использовать предопределенные ячейки, некоторые модели определяют важные точки на объекте, например центр или определенные углы. Эти ключевые точки помогают моделям определить, где находится объект и насколько он велик.
  • Центр предсказание: Некоторые модели сосредоточены на предсказании центра объекта. Как только центр найден, модель может предсказать размер и положение всего объекта.
  • Регрессия по тепловым картам: Многие модели без привязки используют тепловые карты, где каждый пиксель представляет возможное местоположение объекта. Более сильные значения тепловых карт указывают на большую уверенность в том, что объект присутствует в данной точке.
__wf_reserved_inherit
Рис. 2. Обнаружение на основе якорей и обнаружение без якорей.

Поскольку безъякорные модели не зависят от якорных ящиков, они имеют более простую конструкцию. Это означает, что они более эффективны с вычислительной точки зрения. Поскольку им не нужно обрабатывать множество якорных ящиков, они могут быстрее обнаруживать объекты, что является важным преимуществом в приложениях реального времени, таких как автономное вождение и видеонаблюдение. 

Безъякорные модели также гораздо лучше справляются с маленькими, нерегулярными или закрытыми объектами. Поскольку они сосредоточены на обнаружении ключевых точек, а не на попытках подогнать их под якорные коробки, они гораздо более гибкие. Это позволяет им точно обнаруживать объекты в загроможденном или сложном окружении, где модели, основанные на якорях, могут не справиться.

Ultralytics YOLO11: детектор без якоря

Модели YOLO, изначально созданные для скорости и эффективности, постепенно перешли от методов, основанных на якорях, к безъякорному обнаружению, что сделало такие модели, как YOLO11, более быстрыми, гибкими и лучше подходящими для широкого спектра приложений, работающих в режиме реального времени.

Вот краткий обзор эволюции безъякорной конструкции в разных версиях YOLO:

  • Ultralytics YOLOv5u: Представлена безъякорная сплит-головка Ultralytics, устраняющая необходимость в предопределенных якорных ящиках. Вместо этого модель напрямую предсказывает, где находятся объекты на изображении, упрощая процесс и повышая гибкость и скорость.
  • YOLOv6: Был использован новый метод, названный Anchor-Aided Training (AAT), в котором якоря использовались только во время обучения. Это позволило модели извлечь выгоду из структуры методов, основанных на якорях, во время обучения, но при этом использовать обнаружение без якорей во время выполнения для повышения скорости и адаптивности.
  • Ultralytics YOLOv8: Полностью перешли на безъякорное обнаружение с помощью головки Anchor-Free Split Ultralytics. Это сделало модель более быстрой и точной, особенно для маленьких или странной формы объектов, которые не очень хорошо подходят для якорных блоков.
  • Ultralytics YOLO11: Развивает подход YOLOv8, основанный на отсутствии якорей, оптимизируя обнаружение еще больше за счет полного исключения якорных блоков. Это обеспечивает более быстрое и точное обнаружение для приложений реального времени, таких как мониторинг поведения животных и аналитика розничной торговли.
__wf_reserved_inherit
Рис. 3. Сравнение Ultralytics YOLOv8 и Ultralytics YOLO11.

Применение YOLO11 в реальном мире

Отличным примером преимуществ безъякорного обнаружения с помощью YOLO11 являются автономные автомобили. В самоуправляемых автомобилях быстрое и точное обнаружение пешеходов, других транспортных средств и препятствий имеет решающее значение для безопасности. Безъякорный подход YOLO11 упрощает процесс обнаружения, напрямую предсказывая ключевые точки объектов, такие как центр пешехода или границы другого транспортного средства, вместо того чтобы полагаться на предопределенные якорные точки. 

__wf_reserved_inherit
Рис. 4. Преимущества безъякорного обнаружения в YOLO11 (изображение автора).

YOLO11 не нужно настраивать или подгонять сетку якорей к каждому объекту, что может быть вычислительно дорого и медленно. Вместо этого он фокусируется на ключевых характеристиках, что делает его более быстрым и эффективным. Например, когда пешеход выходит на траекторию движения автомобиля, YOLO11 может быстро определить его местоположение, точно указывая на ключевые точки, даже если человек частично скрыт или движется. Способность адаптироваться к различным формам и размерам без использования якорных блоков позволяет YOLO11 обнаруживать объекты более надежно и на более высоких скоростях, что крайне важно для принятия решений в режиме реального времени в системах автономного вождения.

Другие области применения, в которых возможности YOLO11 без якоря действительно выделяются, включают в себя:

  • Розничная торговля и управление запасами: YOLO11 позволяет отслеживать товары на полках, даже если они сложены в стопки или частично завалены. Это помогает быстрее и точнее отслеживать товарные запасы и сокращает количество ошибок.
  • Медицинская визуализация: YOLO11 также эффективен в здравоохранении, где он может обнаружить опухоли или другие аномалии на медицинских снимках. Его способность работать с объектами неправильной формы помогает повысить точность диагностики сложных заболеваний.
  • Мониторинг дикой природы: В исследованиях дикой природы YOLO11 может отслеживать животных в густых лесах или на труднопроходимой местности, помогая ученым следить за поведением или защищать исчезающие виды.
  • Спортивная аналитика: YOLO11 можно использовать для отслеживания игроков, движения мяча или других элементов в режиме реального времени во время спортивных событий, чтобы предоставить ценные сведения командам, тренерам и телеведущим.

При работе с безъякорными моделями необходимо учитывать следующие моменты

Хотя модели без привязки, такие как YOLO11, имеют множество преимуществ, они все же имеют определенные ограничения. Одно из главных практических соображений заключается в том, что даже безъякорные модели могут испытывать трудности с окклюзиями или сильно перекрывающимися объектами. Это объясняется тем, что компьютерное зрение нацелено на воспроизведение человеческого зрения, и так же, как мы иногда сталкиваемся с трудностями при идентификации закрытых объектов, модели ИИ могут столкнуться с подобными проблемами.

Еще один интересный фактор связан с обработкой предсказаний модели. Хотя архитектура моделей без якорей проще, чем с якорями, в некоторых случаях требуется дополнительная доработка. Например, для очистки перекрывающихся предсказаний или повышения точности в переполненных сценах могут потребоваться методы постобработки, такие как немаксимальное подавление (NMS).

Бросьте якорь на будущее искусственного интеллекта вместе с YOLO11

Переход от обнаружения на основе якорей к обнаружению без якорей стал значительным прогрессом в области обнаружения объектов. Модели без якорей, такие как YOLO11, упрощают процесс, что приводит к повышению точности и скорости.

На примере YOLO11 мы убедились, что безъякорное обнаружение объектов лучше всего работает в таких приложениях реального времени, как самоуправляемые автомобили, видеонаблюдение и медицинская визуализация, где очень важно быстрое и точное обнаружение. Такой подход позволяет YOLO11 легче адаптироваться к различным размерам объектов и сложным сценам, обеспечивая лучшую производительность в различных средах.

По мере развития компьютерного зрения обнаружение объектов будет становиться все быстрее, гибче и эффективнее.

Изучите наш репозиторий на GitHub и присоединяйтесь к нашему сообществу, чтобы быть в курсе всех событий, связанных с искусственным интеллектом. Узнайте, как ИИ Vision влияет на такие отрасли, как производство и сельское хозяйство.

Давайте вместе построим будущее
искусственного интеллекта!

Начните свое путешествие в будущее машинного обучения

Начните бесплатно
Ссылка копируется в буфер обмена