Глоссарий

Немаксимальное подавление (NMS)

Откройте для себя метод немаксимального подавления (NMS) для обнаружения объектов. Узнайте, как оно улучшает результаты, повышает точность и обеспечивает работу приложений искусственного интеллекта, таких как YOLO.

Non-Maximum Suppression (NMS) - это фундаментальный алгоритм постобработки, используемый в компьютерном зрении, в частности, в задачах обнаружения объектов. Его основная задача - очистить выходные данные модели обнаружения, отфильтровав лишние и перекрывающиеся ограничительные поля, чтобы каждый объект был идентифицирован только один раз. Когда модель обнаружения объектов, такая как Ultralytics YOLO, делает прогнозы, она часто генерирует несколько окон-кандидатов вокруг одного и того же объекта, каждый из которых имеет разный балл доверия. NMS интеллектуально выбирает единственную лучшую ограничительную рамку для каждого объекта и подавляет или устраняет все другие перекрывающиеся рамки, которые считаются не самыми лучшими.

Как работает подавление без максимума

Алгоритм NMS работает путем итераций по предсказанным ограничительным рамкам и принятия решений на основе двух ключевых показателей: баллов доверия и порога пересечения над объединением (IoU). Процесс можно свести к следующим шагам:

  1. Сортировать по доверию: Все предсказанные ограничительные рамки сначала сортируются в порядке убывания на основе их баллов доверия. Граница с наибольшей оценкой считается наиболее вероятной.
  2. Выберите лучший бокс: Выбирается ограничивающая рамка с наивысшим показателем достоверности, а все остальные рамки, имеющие высокий IoU с выбранной рамкой (т. е. значительно перекрывающие друг друга), удаляются из списка.
  3. Повтор: процесс повторяется с оставшимися ограничивающими рамками, пока все рамки не будут либо выбраны, либо подавлены.

Порог IoU - это критический гиперпараметр, определяемый пользователем. Низкий порог IoU приведет к меньшему количеству обнаружений, поскольку будет подавлять ящики, имеющие даже небольшое перекрытие, в то время как высокий порог может позволить несколько обнаружений одного и того же объекта. Тонкая настройка этого порога часто является частью оптимизации работы модели на конкретном наборе данных.

Области применения подавления без максимума

NMS является важнейшим компонентом многих реальных приложений ИИ, которые зависят от точности обнаружения объектов.

  • Автономные транспортные средства: В самоуправляемых автомобилях системы обнаружения объектов должны точно идентифицировать пешеходов, велосипедистов и другие транспортные средства по различным данным с камер и LiDAR. NMS гарантирует, что один пешеход не будет обнаружен как несколько человек, обеспечивая чистые данные для систем планирования пути и принятия решений. Это предотвращает нестабильное поведение, например, ненужное торможение, вызванное избыточными обнаружениями. Более подробную информацию можно найти в исследовании по обнаружению 3D-объектов для автономного вождения.
  • Медицинская визуализация: В анализе медицинских изображений NMS используется для уточнения обнаружения аномалий, таких как опухоли или поражения, на снимках КТ или МРТ. Например, при использовании такой модели, как YOLO11, для обнаружения опухолей, NMS помогает обеспечить точное определение одной опухоли с помощью одной ограничительной рамки, что повышает точность диагностики и планирования лечения в исследованиях в области медицинской визуализации.

Сравнение с аналогичными методами

NMS - это этап постобработки, применяемый после того, как модель обнаружения объектов сгенерировала начальный набор ограничивающих рамок-кандидатов. Его не следует путать с архитектурой обнаружения, например, с различием между детекторами, основанными на якорях, и детекторами без якорей. Эти архитектуры определяют , как предлагаются потенциальные рамки, а NMS уточняет эти предложения.

Интересно, что вычислительные затраты и потенциальные узкие места, связанные с NMS, подтолкнули исследования в области детекторов объектов без NMS. Такие модели, как YOLOv10, интегрируют механизмы во время обучения, чтобы избежать предсказания избыточных ящиков, стремясь уменьшить задержку в выводах и обеспечить действительно сквозное обнаружение. Это контрастирует с традиционными подходами, такими как Ultralytics YOLOv8 или YOLOv5, где NMS остается стандартной и необходимой частью конвейера вывода. Вы можете изучить технические сравнения, например YOLOv10 против YOLOv8, в нашей документации. Такие варианты, как Soft-NMS, предлагают альтернативные подходы, которые снижают оценки перекрывающихся ящиков вместо того, чтобы полностью их исключить.

Интеграция с инструментами Ultralytics

NMS легко интегрируется в экосистему Ultralytics. Модели Ultralytics YOLO автоматически применяют NMS во время предсказание (predict) и проверка (val) режимов, обеспечивая пользователям чистые и точные результаты обнаружения по умолчанию. Параметры, управляющие поведением NMS (например, порог IoU и порог уверенности), часто можно настроить под конкретные нужды приложения.

Платформы, подобные Ultralytics HUB, еще больше абстрагируют эти детали, позволяя пользователям обучать модели и развертывать их, где NMS обрабатывается автоматически как часть оптимизированного конвейера. Такая интеграция гарантирует, что пользователи, независимо от их глубоких технических знаний в области MLOps, смогут получить самые современные результаты обнаружения объектов в различных задачах компьютерного зрения. Конкретные детали реализации фреймворка Ultralytics можно изучить в справочнике по утилитам Ultralytics. Дополнительные определения можно найти в основном глоссарии Ultralytics.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему искусственного интеллекта. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединяйтесь сейчас
Ссылка копируется в буфер обмена