Открой для себя систему Non-Maximum Suppression (NMS) для обнаружения объектов. Узнай, как оно улучшает результаты, повышает точность и обеспечивает работу таких приложений искусственного интеллекта, как YOLO.
Немаксимальное подавление (НМС) - важнейшая техника постобработки, широко используемая в компьютерном зрении (КЗ), особенно в конвейерах обнаружения объектов. Ее основная роль заключается в улучшении исходных данных, генерируемых моделями обнаружения, которые часто определяют несколько перекрывающихся ограничивающих рамок для одного и того же объекта. Интеллектуально фильтруя эти избыточные рамки, NMS гарантирует, что каждый отдельный объект в изображении или видеокадре будет представлен единственной, оптимальной рамкой. Это значительно повышает четкость и точность конечных результатов обнаружения, делая их более полезными для последующих задач.
Модели обнаружения объектов, такие как различные Ultralytics YOLO как правило, сканируют изображение и предлагают множество потенциальных границ вокруг обнаруженных объектов. Каждая предложенная рамка сопровождается баллом доверия, который указывает на уверенность модели в том, что рамка содержит объект и принадлежит к определенному классу. NMS работает, систематически сокращая эти предложения, основываясь на их баллах доверия и пространственном перекрытии.
Обычно процесс проходит по следующим этапам:
Это гарантирует, что останутся только самые уверенные, непересекающиеся боксы, обеспечивая гораздо более чистый и интерпретируемый результат, как это показано во многих учебниках по компьютерному зрению.
В более широких областях искусственного интеллекта (AI) и машинного обучения (ML) NMS является основополагающим фактором для достижения надежной производительности обнаружения объектов. Без NMS выходной сигнал такого детектора, как YOLO11 был бы загроможден множеством ячеек для одних и тех же объектов. Эта избыточность может привести к ошибкам в последующих приложениях, таких как подсчет объектов(руководство по подсчету объектов), отслеживание объектов или сложное понимание сцены в робототехнике.
Устраняя эти избыточные обнаружения (часто способствующие ложным срабатываниям), NMS значительно повышает точность предсказаний модели. Такое уточнение очень важно для приложений, требующих высокой надежности и точности. Влияние NMS отражается в таких оценочных метриках, как средняя точность (mAP), которые обычно рассчитываются после применения NMS, как подробно описано в руководстве по метрикам производительностиYOLO .
NMS - это краеугольная технология, позволяющая реализовать множество практических приложений ИИ:
NMS - это этап постобработки, применяемый после того, как модель обнаружения объектов сгенерировала свой начальный набор ограничительных рамок-кандидатов. Его не следует путать с самой архитектурой обнаружения, например, с различием между детекторами, основанными на якорях, и детекторами без якорей. Эти архитектуры определяют , как предлагаются потенциальные боксы, а NMS уточняет эти предложения.
Интересно, что вычислительные затраты и потенциальные узкие места, связанные с NMS, подтолкнули исследования в области детекторов объектов без NMS. Такие модели, как YOLOv10, интегрируют механизмы во время обучения (например, последовательные двойные назначения), чтобы избежать предсказания лишних ящиков, стремясь сократить время ожидания вывода и обеспечить действительно сквозное обнаружение(подход YOLOv10 без НМС). Это контрастирует с традиционными подходами, такими как Ultralytics YOLOv8 или YOLOv5где NMS остается стандартной и важной частью конвейера выводов. Ты можешь изучить технические сравнения, например, YOLOv10 против YOLOv8, в нашей документации. Такие варианты, как Soft-NMS(статья о Soft-NMS), предлагают альтернативные подходы, которые уменьшают оценки перекрывающихся боксов вместо того, чтобы полностью их исключить.
NMS легко интегрируется в экосистему Ultralytics . Модели Ultralytics YOLO автоматически применяют NMS во время предсказание (predict
) и валидация (val
) В таких режимах пользователи по умолчанию получают чистые и точные результаты обнаружения. Параметры, управляющие поведением NMS (например, порог IoU и порог уверенности), часто можно настраивать под конкретные нужды приложения.
Платформы вроде Ultralytics HUB еще больше абстрагируют эти детали, позволяя пользователям обучать модели(облачное руководство по обучению) и разворачивать их, где NMS обрабатывается автоматически как часть оптимизированного конвейера. Такая интеграция гарантирует, что пользователи, независимо от их глубоких технических знаний в области MLOps, смогут воспользоваться самыми современными результатами обнаружения объектов для различных задач компьютерного зрения. Конкретные детали реализации в рамках фреймворка Ultralytics можно изучить в справке по утилитамUltralytics . За дополнительными определениями загляни в основной глоссарийUltralytics .