Преимущества Ultralytics YOLO11 как безъякорного детектора

5 декабря 2024 г.
Узнайте, как Ultralytics YOLO11 поддерживает обнаружение объектов без якорей и какие преимущества дает эта архитектура модели для различных приложений.
%2525202.png)
5 декабря 2024 г.
Узнайте, как Ultralytics YOLO11 поддерживает обнаружение объектов без якорей и какие преимущества дает эта архитектура модели для различных приложений.
Если взглянуть на историю создания моделей искусственного интеллекта, то можно заметить, что концепция обнаружения объектов - основной задачи компьютерного зрения, которая заключается в идентификации и определении местоположения объектов на изображении или видео - существует с 1960-х годов. Однако ключевой причиной ее значимости в передовых инновациях сегодня является то, что с тех пор методы обнаружения объектов и архитектуры моделей быстро усовершенствовались.
В предыдущей статье мы обсудили эволюцию обнаружения объектов и путь, который привел к моделям Ultralytics YOLO. Сегодня мы сосредоточимся на изучении более конкретной вехи этого пути: перехода от детекторов, основанных на якорях, к детекторам без якорей.
Детекторы, основанные на якорях, опираются на заранее определенные ячейки, называемые "якорями", для предсказания местоположения объектов на изображении. В отличие от них, безъякорные детекторы пропускают эти предопределенные ячейки и вместо этого предсказывают местоположение объектов напрямую.
Хотя это изменение может показаться простым и логичным, на самом деле оно привело к значительному повышению точности и эффективности обнаружения объектов. В этой статье мы узнаем, как безъякорные детекторы изменили компьютерное зрение благодаря таким достижениям, как Ultralytics YOLO11.
Детекторы на основе якорей используют предопределенные ячейки, называемые якорями, для определения местоположения объектов на изображении. Представьте себе эти якоря как сетку из ящиков разных размеров и форм, расположенных на изображении. Затем модель настраивает эти ячейки в соответствии с обнаруженными объектами. Например, если модель идентифицирует автомобиль, она изменит якорный ящик, чтобы он более точно соответствовал положению и размеру автомобиля.
Каждый якорь связан с возможным объектом на изображении, и в процессе обучения модель учится настраивать ячейки якоря, чтобы они лучше соответствовали местоположению, размеру и соотношению сторон объекта. Это позволяет модели обнаруживать объекты разного масштаба и ориентации. Однако выбор правильного набора якорных ячеек может занять много времени, а процесс их точной настройки чреват ошибками.
Хотя детекторы на основе якорей, такие как YOLOv4, хорошо работают во многих приложениях, у них есть некоторые недостатки. Например, якорные блоки не всегда хорошо совмещаются с объектами разных форм и размеров, что затрудняет обнаружение небольших или неправильной формы объектов. Процесс выбора и точной настройки размеров якорных блоков также может занимать много времени и требует больших ручных усилий. Кроме того, модели на основе якорей часто испытывают трудности с обнаружением объектов, которые находятся в тени или перекрываются, поскольку предопределенные ячейки могут плохо адаптироваться к этим более сложным сценариям.
Безъякорные детекторы начали привлекать внимание в 2018 году благодаря таким моделям, как CornerNet и CenterNet, которые использовали новый подход к обнаружению объектов, отказавшись от использования предопределенных якорных блоков. В отличие от традиционных моделей, которые используют якорные ящики разных размеров и форм для предсказания местоположения объектов, безъякорные модели предсказывают местоположение объектов напрямую. Они фокусируются на ключевых точках или особенностях объекта, например на его центре, что упрощает процесс обнаружения и делает его более быстрым и точным.
Вот как обычно работают безъякорные модели:
Поскольку безъякорные модели не зависят от якорных ящиков, они имеют более простую конструкцию. Это означает, что они более эффективны с вычислительной точки зрения. Поскольку им не нужно обрабатывать множество якорных ящиков, они могут быстрее обнаруживать объекты, что является важным преимуществом в приложениях реального времени, таких как автономное вождение и видеонаблюдение.
Безъякорные модели также гораздо лучше справляются с маленькими, нерегулярными или закрытыми объектами. Поскольку они сосредоточены на обнаружении ключевых точек, а не на попытках подогнать их под якорные коробки, они гораздо более гибкие. Это позволяет им точно обнаруживать объекты в загроможденном или сложном окружении, где модели, основанные на якорях, могут не справиться.
Модели YOLO, изначально созданные для скорости и эффективности, постепенно перешли от методов, основанных на якорях, к безъякорному обнаружению, что сделало такие модели, как YOLO11, более быстрыми, гибкими и лучше подходящими для широкого спектра приложений, работающих в режиме реального времени.
Вот краткий обзор эволюции безъякорной конструкции в разных версиях YOLO:
Отличным примером преимуществ безъякорного обнаружения с помощью YOLO11 являются автономные автомобили. В самоуправляемых автомобилях быстрое и точное обнаружение пешеходов, других транспортных средств и препятствий имеет решающее значение для безопасности. Безъякорный подход YOLO11 упрощает процесс обнаружения, напрямую предсказывая ключевые точки объектов, такие как центр пешехода или границы другого транспортного средства, вместо того чтобы полагаться на предопределенные якорные точки.
YOLO11 не нужно настраивать или подгонять сетку якорей к каждому объекту, что может быть вычислительно дорого и медленно. Вместо этого он фокусируется на ключевых характеристиках, что делает его более быстрым и эффективным. Например, когда пешеход выходит на траекторию движения автомобиля, YOLO11 может быстро определить его местоположение, точно указывая на ключевые точки, даже если человек частично скрыт или движется. Способность адаптироваться к различным формам и размерам без использования якорных блоков позволяет YOLO11 обнаруживать объекты более надежно и на более высоких скоростях, что крайне важно для принятия решений в режиме реального времени в системах автономного вождения.
Другие области применения, в которых возможности YOLO11 без якоря действительно выделяются, включают в себя:
Хотя модели без привязки, такие как YOLO11, имеют множество преимуществ, они все же имеют определенные ограничения. Одно из главных практических соображений заключается в том, что даже безъякорные модели могут испытывать трудности с окклюзиями или сильно перекрывающимися объектами. Это объясняется тем, что компьютерное зрение нацелено на воспроизведение человеческого зрения, и так же, как мы иногда сталкиваемся с трудностями при идентификации закрытых объектов, модели ИИ могут столкнуться с подобными проблемами.
Еще один интересный фактор связан с обработкой предсказаний модели. Хотя архитектура моделей без якорей проще, чем с якорями, в некоторых случаях требуется дополнительная доработка. Например, для очистки перекрывающихся предсказаний или повышения точности в переполненных сценах могут потребоваться методы постобработки, такие как немаксимальное подавление (NMS).
Переход от обнаружения на основе якорей к обнаружению без якорей стал значительным прогрессом в области обнаружения объектов. Модели без якорей, такие как YOLO11, упрощают процесс, что приводит к повышению точности и скорости.
На примере YOLO11 мы убедились, что безъякорное обнаружение объектов лучше всего работает в таких приложениях реального времени, как самоуправляемые автомобили, видеонаблюдение и медицинская визуализация, где очень важно быстрое и точное обнаружение. Такой подход позволяет YOLO11 легче адаптироваться к различным размерам объектов и сложным сценам, обеспечивая лучшую производительность в различных средах.
По мере развития компьютерного зрения обнаружение объектов будет становиться все быстрее, гибче и эффективнее.
Изучите наш репозиторий на GitHub и присоединяйтесь к нашему сообществу, чтобы быть в курсе всех событий, связанных с искусственным интеллектом. Узнайте, как ИИ Vision влияет на такие отрасли, как производство и сельское хозяйство.