Преимущества Ultralytics YOLO11 как безъякорного детектора

5 декабря 2024 г.
Узнайте, как Ultralytics YOLO11 поддерживает обнаружение объектов без якорей и какие преимущества дает эта модельная архитектура различным приложениям.

5 декабря 2024 г.
Узнайте, как Ultralytics YOLO11 поддерживает обнаружение объектов без якорей и какие преимущества дает эта модельная архитектура различным приложениям.
Если мы оглянемся на историю моделей Vision AI, то концепция обнаружения объектов — основная задача компьютерного зрения, которая включает в себя идентификацию и локализацию объектов на изображении или видео — существует с 1960-х годов. Однако ключевая причина ее значимости в передовых инновациях сегодня заключается в том, что методы обнаружения объектов и архитектуры моделей с тех пор продвинулись и быстро улучшились.
В предыдущей статье мы обсудили эволюцию обнаружения объектов и путь, который привел к моделям Ultralytics YOLO . Сегодня мы сосредоточимся на изучении более конкретной вехи этого пути: перехода от детекторов, основанных на якорях, к детекторам без якорей.
Детекторы на основе якорей используют предопределенные рамки, называемые «якорями», для прогнозирования местоположения объектов на изображении. В отличие от них, детекторы без якорей пропускают эти предопределенные рамки и вместо этого прогнозируют местоположение объектов напрямую.
Хотя это изменение может показаться простым и логичным, на самом деле оно привело к значительному повышению точности и эффективности обнаружения объектов. В этой статье мы узнаем, как безъякорные детекторы изменили компьютерное зрение благодаря таким достижениям, как Ultralytics YOLO11.
Детекторы на основе якорей используют предопределенные рамки, известные как якоря, чтобы помочь определить местоположение объектов на изображении. Представьте себе эти якоря как сетку рамок разных размеров и форм, размещенных над изображением. Затем модель регулирует эти рамки, чтобы соответствовать обнаруженным объектам. Например, если модель идентифицирует автомобиль, она изменит рамку якоря, чтобы более точно соответствовать положению и размеру автомобиля.
Каждый якорь связан с возможным объектом на изображении, и в процессе обучения модель учится настраивать ячейки якоря, чтобы они лучше соответствовали местоположению, размеру и соотношению сторон объекта. Это позволяет модели detect объекты разного масштаба и ориентации. Однако выбор правильного набора якорных ячеек может занять много времени, а процесс их точной настройки чреват ошибками.

Хотя детекторы на основе якорей, такие как YOLOv4, хорошо работают во многих приложениях, у них есть некоторые недостатки. Например, якорные блоки не всегда хорошо совмещаются с объектами разных форм и размеров, что затрудняет detect небольших объектов или объектов неправильной формы. Процесс выбора и точной настройки размеров якорных блоков также может занимать много времени и требует больших ручных усилий. Кроме того, модели на основе якорей часто испытывают трудности с обнаружением объектов, которые находятся в тени или перекрываются, поскольку предопределенные ячейки могут плохо адаптироваться к этим более сложным сценариям.
Детекторы без привязки к якорям начали привлекать внимание в 2018 году с появлением таких моделей, как CornerNet и CenterNet, которые предложили новый подход к обнаружению объектов, устранив необходимость в предопределенных ограничивающих рамках. В отличие от традиционных моделей, которые полагаются на ограничивающие рамки разных размеров и форм для прогнозирования местоположения объектов, модели без якорей прогнозируют местоположение объектов напрямую. Они фокусируются на ключевых точках или признаках объекта, таких как центр, что упрощает процесс обнаружения и делает его более быстрым и точным.
Вот как обычно работают модели без привязки к якорям:

Поскольку безъякорные модели не зависят от якорных ящиков, они имеют более простую конструкцию. Это означает, что они более эффективны с вычислительной точки зрения. Поскольку им не нужно обрабатывать множество якорных ящиков, они могут быстрее detect объекты, что является важным преимуществом в приложениях реального времени, таких как автономное вождение и видеонаблюдение.
Безъякорные модели также гораздо лучше справляются с маленькими, нерегулярными или закрытыми объектами. Поскольку они сосредоточены на обнаружении ключевых точек, а не на попытках подогнать их под якорные коробки, они гораздо более гибкие. Это позволяет им точно detect объекты в загроможденном или сложном окружении, где модели, основанные на якорях, могут не справиться.
Модели YOLO , изначально созданные для скорости и эффективности, постепенно перешли от методов, основанных на якорях, к безъякорному обнаружению, что сделало такие модели, как YOLO11 , более быстрыми, гибкими и лучше подходящими для широкого спектра приложений, работающих в режиме реального времени.
Вот краткий обзор эволюции безъякорной конструкции в разных версиях YOLO :

Отличным примером преимуществ безъякорного обнаружения с помощью YOLO11 являются автономные автомобили. В самоуправляемых автомобилях быстрое и точное обнаружение пешеходов, других транспортных средств и препятствий имеет решающее значение для безопасности. Безъякорный подход YOLO11 упрощает процесс обнаружения, напрямую предсказывая ключевые точки объектов, такие как центр пешехода или границы другого транспортного средства, вместо того чтобы полагаться на предопределенные якорные точки.

YOLO11 не нужно настраивать или подгонять сетку якорей к каждому объекту, что может быть вычислительно дорого и медленно. Вместо этого он фокусируется на ключевых характеристиках, что делает его более быстрым и эффективным. Например, когда пешеход выходит на траекторию движения автомобиля, YOLO11 может быстро определить его местоположение, точно указывая на ключевые точки, даже если человек частично скрыт или движется. Способность адаптироваться к различным формам и размерам без использования якорных блоков позволяет YOLO11 detect объекты более надежно и на более высоких скоростях, что крайне важно для принятия решений в режиме реального времени в системах автономного вождения.
Другие области применения, в которых возможности YOLO11без якоря действительно выделяются, включают в себя:
Хотя модели без привязки, такие как YOLO11 , имеют множество преимуществ, они все же имеют определенные ограничения. Одно из главных практических соображений заключается в том, что даже безъякорные модели могут испытывать трудности с окклюзиями или сильно перекрывающимися объектами. Это объясняется тем, что компьютерное зрение нацелено на воспроизведение человеческого зрения, и так же, как мы иногда сталкиваемся с трудностями при идентификации закрытых объектов, модели ИИ могут столкнуться с подобными проблемами.
Еще один интересный фактор связан с обработкой предсказаний модели. Хотя архитектура моделей без якорей проще, чем с якорями, в некоторых случаях требуется дополнительная доработка. Например, для очистки перекрывающихся предсказаний или повышения точности в переполненных сценах могут потребоваться методы постобработки, такие как немаксимальное подавлениеNMS).
Переход от обнаружения на основе якорей к обнаружению без якорей стал значительным прогрессом в области обнаружения объектов. Модели без якорей, такие как YOLO11, упрощают процесс, что приводит к повышению точности и скорости.
На примере YOLO11 мы убедились, что безъякорное обнаружение объектов лучше всего работает в таких приложениях реального времени, как самоуправляемые автомобили, видеонаблюдение и медицинская визуализация, где очень важно быстрое и точное обнаружение. Такой подход позволяет YOLO11 легче адаптироваться к различным размерам объектов и сложным сценам, обеспечивая лучшую производительность в различных средах.
По мере развития компьютерного зрения обнаружение объектов будет только ускоряться, становиться более гибким и эффективным.
Изучите наш репозиторий на GitHub и присоединяйтесь к нашему активному сообществу, чтобы быть в курсе всех новостей об ИИ. Узнайте, как Vision AI влияет на такие сектора, как производство и сельское хозяйство.