Безъякорные детекторы
Откройте для себя возможности безъякорных детекторов - упрощенного обнаружения объектов с повышенной точностью, эффективностью и адаптируемостью к реальным условиям применения.
Безъякорные детекторы представляют собой современную эволюцию в компьютерном зрении (КВЗ), предлагая более рациональный и гибкий подход к обнаружению объектов. Вместо того чтобы полагаться на заранее определенный набор якорных ящиков для предсказания местоположения объекта, эти модели идентифицируют объекты напрямую. Это часто достигается путем предсказания центральной точки объекта и его размеров или путем определения ключевых точек, таких как углы. Такая смена парадигмы упрощает конвейер обнаружения, уменьшает количество гиперпараметров, которые необходимо настраивать, и часто повышает производительность, особенно для объектов с разнообразными или необычными формами.
Безъякорные и безъякорные детекторы. Детекторы, основанные на якорях
Основное различие заключается в том, как генерируются кандидаты в объекты.
- Детекторы, основанные на якорях: Такие модели, как YOLOv5 и Faster R-CNN, используют предопределенный набор якорных ящиков с различными размерами и соотношением сторон в разных местах изображения. Сеть уточняет эти ячейки, чтобы они соответствовали истинным объектам. Этот подход требует больших вычислительных затрат и тщательного подбора конфигураций якорных ящиков, что может быть не очень хорошо применимо к различным наборам данных, таким как COCO.
- Безъякорные детекторы: Эти модели не нуждаются в предопределенных ячейках. Они напрямую предсказывают свойства объекта на основе особенностей изображения. Это приводит к упрощению конструкции и позволяет ускорить вывод в реальном времени и улучшить обнаружение объектов неправильной формы. Современные архитектуры, в том числе Ultralytics YOLO11, используют этот дизайн для повышения эффективности и гибкости.
Переход к безъякорной конструкции стал ключевым событием в эволюции обнаружения объектов, пионером которого стали такие модели, как YOLOX, представленные Megvii в исследовательской работе 2021 года. Вы можете посмотреть техническое сравнение YOLO11 и YOLOX, чтобы понять их архитектурные различия.
Как работают безъякорные извещатели?
Безъякорные детекторы обычно используют одну из двух основных стратегий:
- Основанные на ключевых точках: Эти методы определяют местоположение объектов путем выявления ключевых точек, таких как углы или центральные точки. Модель учится группировать эти ключевые точки для формирования полного прогноза границ.
- Основанные на центре: Эти подходы предсказывают центр объекта, а затем регрессируют расстояние от центра на четыре стороны ограничительного поля. Это распространенная и эффективная техника, используемая во многих современных детекторах.
Эти методы упрощают процесс присвоения меток во время обучения модели и часто используют такие передовые технологии, как сложные функции потерь и сильное расширение данных для повышения производительности.
Применение в реальном мире
Гибкость и эффективность безъякорных детекторов делают их весьма эффективными в различных областях:
- Автономное вождение: В системах для автономных автомобилей эти детекторы могут точно распознавать пешеходов, другие автомобили и препятствия различных форм и размеров. Такая адаптивность очень важна для навигационных систем, разрабатываемых такими компаниями, как Waymo.
- Анализ медицинских изображений: Безъякорные модели отлично справляются с обнаружением аномалий неправильной формы, таких как опухоли или повреждения на медицинских снимках. Например, использование YOLO11 для обнаружения опухолей позволяет воспользоваться преимуществами его безъякорной природы для более точной локализации на медицинских изображениях.
- Аналитика розничной торговли: Эти модели могут эффективно отслеживать полки магазинов на предмет отсутствия товаров на складе или анализировать поток покупателей, даже если речь идет о плотно упакованных товарах или товарах странной формы. Это ключевая часть управления запасами на основе ИИ.
- Безопасность и наблюдение: Идентификация людей или объектов в местах скопления людей - распространенная задача в интеллектуальном видеонаблюдении. Безъякорные детекторы хорошо справляются с объектами разного масштаба, что делает их идеальными для таких приложений.
Инструменты и технологии
Разработка моделей без якорей поддерживается основными фреймворками глубокого обучения, такими как PyTorch и TensorFlow. Экосистема Ultralytics предоставляет комплексные инструменты для создания и развертывания этих передовых детекторов. Вы можете изучить нашу документацию и использовать Ultralytics HUB для управления наборами данных, обучения моделей и развертывания. Для продолжения обучения такие платформы, как Coursera, предлагают базовые курсы, а ресурсы вроде Papers With Code содержат список самых современных моделей.