Глоссарий

Немаксимальное подавление (НМС)

Открой для себя систему Non-Maximum Suppression (NMS) для обнаружения объектов. Узнай, как оно улучшает результаты, повышает точность и обеспечивает работу таких приложений искусственного интеллекта, как YOLO.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Немаксимальное подавление (НМС) - важнейшая техника постобработки, широко используемая в компьютерном зрении (КЗ), особенно в конвейерах обнаружения объектов. Ее основная роль заключается в улучшении исходных данных, генерируемых моделями обнаружения, которые часто определяют несколько перекрывающихся ограничивающих рамок для одного и того же объекта. Интеллектуально фильтруя эти избыточные рамки, NMS гарантирует, что каждый отдельный объект в изображении или видеокадре будет представлен единственной, оптимальной рамкой. Это значительно повышает четкость и точность конечных результатов обнаружения, делая их более полезными для последующих задач.

Как работает подавление без максимума

Модели обнаружения объектов, такие как различные Ultralytics YOLO как правило, сканируют изображение и предлагают множество потенциальных границ вокруг обнаруженных объектов. Каждая предложенная рамка сопровождается баллом доверия, который указывает на уверенность модели в том, что рамка содержит объект и принадлежит к определенному классу. NMS работает, систематически сокращая эти предложения, основываясь на их баллах доверия и пространственном перекрытии.

Обычно процесс проходит по следующим этапам:

  1. Все предложенные ограничительные рамки сортируются по баллам доверия, обычно в порядке убывания.
  2. Граничная область с наибольшим баллом доверия выбирается в качестве окончательного обнаружения.
  3. Все остальные ограничивающие боксы, которые имеют значительное перекрытие с этим выбранным боксом, подавляются или удаляются. Перекрытие измеряется с помощью метрики Intersection over Union (IoU), и подавление происходит, если IoU превышает заданный порог (например, 0,5). Подробное объяснение этой основной концепции можно найти в таких ресурсах, как руководство по NMS в PyImageSearch.
  4. Процесс повторяется итеративно: выбирается следующая по высоте коробка из оставшихся, а перекрывающиеся коробки подавляются.
  5. Это продолжается до тех пор, пока все ящики не будут либо выбраны в качестве окончательных обнаружений, либо подавлены.

Это гарантирует, что останутся только самые уверенные, непересекающиеся боксы, обеспечивая гораздо более чистый и интерпретируемый результат, как это показано во многих учебниках по компьютерному зрению.

Важность в искусственном интеллекте и машинном обучении

В более широких областях искусственного интеллекта (AI) и машинного обучения (ML) NMS является основополагающим фактором для достижения надежной производительности обнаружения объектов. Без NMS выходной сигнал такого детектора, как YOLO11 был бы загроможден множеством ячеек для одних и тех же объектов. Эта избыточность может привести к ошибкам в последующих приложениях, таких как подсчет объектов(руководство по подсчету объектов), отслеживание объектов или сложное понимание сцены в робототехнике.

Устраняя эти избыточные обнаружения (часто способствующие ложным срабатываниям), NMS значительно повышает точность предсказаний модели. Такое уточнение очень важно для приложений, требующих высокой надежности и точности. Влияние NMS отражается в таких оценочных метриках, как средняя точность (mAP), которые обычно рассчитываются после применения NMS, как подробно описано в руководстве по метрикам производительностиYOLO .

Применение в реальном мире

NMS - это краеугольная технология, позволяющая реализовать множество практических приложений ИИ:

Сравнение с аналогичными техниками

NMS - это этап постобработки, применяемый после того, как модель обнаружения объектов сгенерировала свой начальный набор ограничительных рамок-кандидатов. Его не следует путать с самой архитектурой обнаружения, например, с различием между детекторами, основанными на якорях, и детекторами без якорей. Эти архитектуры определяют , как предлагаются потенциальные боксы, а NMS уточняет эти предложения.

Интересно, что вычислительные затраты и потенциальные узкие места, связанные с NMS, подтолкнули исследования в области детекторов объектов без NMS. Такие модели, как YOLOv10, интегрируют механизмы во время обучения (например, последовательные двойные назначения), чтобы избежать предсказания лишних ящиков, стремясь сократить время ожидания вывода и обеспечить действительно сквозное обнаружение(подход YOLOv10 без НМС). Это контрастирует с традиционными подходами, такими как Ultralytics YOLOv8 или YOLOv5где NMS остается стандартной и важной частью конвейера выводов. Ты можешь изучить технические сравнения, например, YOLOv10 против YOLOv8, в нашей документации. Такие варианты, как Soft-NMS(статья о Soft-NMS), предлагают альтернативные подходы, которые уменьшают оценки перекрывающихся боксов вместо того, чтобы полностью их исключить.

Интеграция с Ultralytics Tools

NMS легко интегрируется в экосистему Ultralytics . Модели Ultralytics YOLO автоматически применяют NMS во время предсказание (predict) и валидация (val) В таких режимах пользователи по умолчанию получают чистые и точные результаты обнаружения. Параметры, управляющие поведением NMS (например, порог IoU и порог уверенности), часто можно настраивать под конкретные нужды приложения.

Платформы вроде Ultralytics HUB еще больше абстрагируют эти детали, позволяя пользователям обучать модели(облачное руководство по обучению) и разворачивать их, где NMS обрабатывается автоматически как часть оптимизированного конвейера. Такая интеграция гарантирует, что пользователи, независимо от их глубоких технических знаний в области MLOps, смогут воспользоваться самыми современными результатами обнаружения объектов для различных задач компьютерного зрения. Конкретные детали реализации в рамках фреймворка Ultralytics можно изучить в справке по утилитамUltralytics . За дополнительными определениями загляни в основной глоссарийUltralytics .

Читать полностью