Узнайте, что такое Intersection over Union (IoU), как он рассчитывается и его важная роль в обнаружении объектов и оценке моделей ИИ.
Intersection over Union (IoU) — это фундаментальная метрика оценки, используемая в компьютерном зрении (CV), особенно для задач обнаружения объектов. Она измеряет степень перекрытия между двумя границами: прогнозируемым ограничивающим прямоугольником, сгенерированным моделью, и истинным ограничивающим прямоугольником, который является размеченной вручную правильной границей. Результирующая оценка, значение от 0 до 1, количественно определяет, насколько точно модель обнаружила объект на изображении. Оценка 1 представляет собой идеальное совпадение, а оценка 0 указывает на полное отсутствие перекрытия. Эта метрика имеет решающее значение для оценки точности локализации моделей, таких как Ultralytics YOLO11.
По своей сути, IoU вычисляет отношение пересечения (площади перекрытия) к объединению (общей площади, покрытой обоими прямоугольниками) предсказанных и истинных ограничивающих прямоугольников. Представьте себе два перекрывающихся квадрата. «Пересечение» — это общая область, где они перекрываются. «Объединение» — это общая площадь, которую покрывают оба квадрата вместе, считая перекрывающуюся часть только один раз. Разделив пересечение на объединение, IoU предоставляет стандартизированную меру того, насколько хорошо предсказанный прямоугольник соответствует фактическому объекту. Эта простая, но мощная концепция является краеугольным камнем современного глубокого обучения (DL) для обнаружения объектов.
Ключевой частью использования IoU является установка «порога IoU». Этот порог — это предопределенное значение (например, 0,5), которое определяет, является ли прогноз правильным. Если оценка IoU для прогнозируемой рамки выше этого порога, она классифицируется как «истинно положительная». Если оценка ниже, это «ложноположительная». Этот порог напрямую влияет на другие показатели производительности, такие как Точность и Полнота, и является критическим компонентом при расчете средней точности (mAP), стандартной метрики для оценки моделей обнаружения объектов на эталонных наборах данных, таких как COCO.
IoU необходим для проверки производительности бесчисленных систем ИИ. Вот несколько примеров:
IoU — это не просто метрика оценки; она также является неотъемлемой частью самого процесса обучения. Многие современные архитектуры обнаружения объектов, включая варианты Ultralytics YOLOv8 и YOLO11, используют IoU или его вариации непосредственно в своих функциях потерь. Эти продвинутые потери на основе IoU, такие как Generalized IoU (GIoU), Distance-IoU (DIoU) или Complete-IoU (CIoU), помогают модели научиться прогнозировать ограничивающие прямоугольники, которые не только хорошо перекрываются, но и учитывают такие факторы, как расстояние между центрами и согласованность соотношения сторон. Это приводит к более быстрой сходимости и лучшей производительности локализации по сравнению с традиционными потерями регрессии. Подробные сравнения различных моделей YOLO можно найти в нашей документации.
Мониторинг IoU во время обучения модели и настройки гиперпараметров помогает разработчикам улучшать модели для лучшей локализации. Такие инструменты, как Ultralytics HUB, позволяют отслеживать IoU и другие метрики, оптимизируя цикл улучшения модели. Несмотря на широкое распространение, стандартный IoU иногда может быть нечувствительным, особенно для неперекрывающихся прямоугольников. Это ограничение стимулировало разработку вышеупомянутых вариантов IoU. Тем не менее, IoU остается краеугольным камнем оценки компьютерного зрения.
Хотя IoU имеет жизненно важное значение, важно понимать его взаимосвязь с другими метриками: