Глоссарий

Пересечение через Союз (IoU)

Узнай, что такое Intersection over Union (IoU), как он рассчитывается и какую важную роль играет в обнаружении объектов и оценке моделей ИИ.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Intersection over Union (IoU) - это фундаментальная метрика, широко используемая в компьютерном зрении (КЗ), особенно в таких задачах, как обнаружение объектов и сегментация изображений. Она определяет, насколько точно предсказанная граница (например, ограничительная рамка при обнаружении объектов) совпадает с реальной, истинной границей объекта. По сути, IoU измеряет степень перекрытия между предсказанной и истинной областью, предоставляя простой, но эффективный балл для оценки производительности локализации. Понимание IoU необходимо для оценки и сравнения эффективности моделей компьютерного зрения, особенно для пользователей, знакомых с базовыми концепциями машинного обучения (ML).

Важность IoU в оценке моделей

IoU служит критическим показателем эффективности при оценке того, насколько хорошо работают модели, такие как Ultralytics YOLOопределяют местоположение объектов в изображении. В то время как классификация говорит нам о том , какой объект присутствует (см. "Классификация изображений"), IoU показывает , насколько хорошо модель определила его местоположение. Такая пространственная точность жизненно важна во многих сценариях реального мира, где точная локализация так же важна, как и правильная классификация. Высокие показатели IoU говорят о том, что предсказания модели точно совпадают с реальными границами объекта. Многие бенчмарки по обнаружению объектов, например популярная оценка набора данных COCO и более старая задача PASCAL VOC, в значительной степени полагаются на пороговые значения IoU, чтобы определить, считается ли обнаружение правильным. Ты можешь изучить различные эталонные наборы данных, такие как COCO и PASCAL VOC, в нашей документации.

Вычисление IoU

Расчет заключается в том, чтобы разделить площадь, на которой пересекаются предсказанная граница и истинная граница (пересечение), на общую площадь, покрываемую обеими границами вместе взятыми (объединение). Это соотношение дает оценку от 0 до 1. Оценка 1 означает идеальное совпадение, то есть предсказанный бокс точно перекрывает истинный. Оценка 0 означает отсутствие какого-либо перекрытия. Обычная практика многих протоколов оценки обнаружения объектов - считать предсказание верным, если показатель IoU соответствует или превышает определенный порог, чаще всего 0,5. Однако могут использоваться и более строгие пороги (например, 0,75 или даже 0,9), в зависимости от потребности приложения в точности, как это видно на примере таких метрик, как mAP@.5:.95, используемых в оценках COCO. Этот порог напрямую влияет на такие метрики, как точность и отзыв.

Применение IoU в реальном мире

Способность IoU измерять точность локализации делает его незаменимым в различных сферах:

  • Автономные транспортные средства: В ИИ для самоуправляемых автомобилей точное обнаружение пешеходов, велосипедистов и других транспортных средств имеет первостепенное значение для безопасности. Модель обнаружения объектов, например YOLO11 предсказывает ограничивающие рамки вокруг этих объектов. Высокое IoU между предсказанной рамкой и фактическим местоположением объекта гарантирует, что система автомобиля имеет точное представление о своем окружении, что крайне важно для навигации и предотвращения столкновений. Стандарты безопасности автономных автомобилей часто неявно полагаются на высокую точность локализации.
  • Анализ медицинских изображений: При использовании ИИ в здравоохранении, в частности для анализа медицинских изображений, IoU помогает оценить модели, предназначенные для обнаружения опухолей или аномалий на снимках (например, КТ или МРТ). Например, модель, сегментирующая опухоль(Image Segmentation), должна точно ее очертить. IoU измеряет перекрытие между предсказанной моделью областью опухоли и областью, отмеченной рентгенологом (ground truth), что гарантирует клиническую значимость выводов модели. Высокий IoU жизненно важен для точной диагностики и планирования лечения, что подчеркивается в различных исследованиях ИИ в области медицинской визуализации. Ты можешь найти соответствующие наборы данных, такие как Brain Tumor Detection Dataset, в наших ресурсах наборов данных.

IoU против других показателей оценки. Другие метрики оценки

Хотя IoU специально измеряет качество локализации для одного предсказания в сравнении с "грунтовой истиной", его часто используют вместе с другими метриками для получения полной картины производительности.

  • Средняя точность (mAP): Это широко используемая совокупная метрика в обнаружении объектов. Она рассчитывает среднюю точность по различным порогам IoU (например, от 0,5 до 0,95) и часто по нескольким классам объектов. В отличие от IoU, которая оценивает отдельные предсказания, mAP дает одно число, суммирующее общую производительность модели в плане как классификации, так и точности локализации в разных рабочих точках. Подробнее об этих метриках ты можешь узнать в нашем руководстве по метрикам производительностиYOLO .
  • Precision и Recall: Сам по себе IoU не измеряет напрямую правильность классификации, а только совпадение локализации. Precision измеряет точность положительных предсказаний (сколько обнаруженных ящиков действительно содержат объект), а Recall - способность модели находить все релевантные экземпляры (сколько реальных объектов было обнаружено). Пороговые значения IoU используются при расчете precision и recall, чтобы определить, является ли обнаружение истинно положительным. Понимание взаимосвязи между precision и recall является ключевым для интерпретации таких метрик, как mAP и F1-score.

Повышение производительности модели с помощью IoU

IoU - это не просто метрика оценки, она также является неотъемлемой частью самого процесса обучения. Многие современные архитектуры обнаружения объектов, включая варианты Ultralytics YOLOv8 и YOLOv10, используют IoU или его вариации (например, обобщенный IoU (GIoU), Distance-IoU (DIoU) или Complete-IoU (CIoU)) непосредственно в своих функциях потерь. Эти усовершенствованные потери на основе IoU помогают модели научиться предсказывать ограничительные рамки, которые не только хорошо перекрываются, но и учитывают такие факторы, как расстояние между центрами и согласованность соотношения сторон, что приводит к более быстрой сходимости и лучшей производительности локализации по сравнению с традиционными потерями регрессии. Ты можешь найти подробные сравнения между различными моделями YOLO в нашей документации.

Мониторинг IoU во время обучения модели и настройки гиперпараметров помогает разработчикам совершенствовать модели для лучшей локализации. Такие инструменты, как Ultralytics HUB, позволяют отслеживать IoU и другие метрики, оптимизируя цикл улучшения модели. Несмотря на широкую распространенность, стандартный IoU иногда может быть нечувствительным, особенно для непересекающихся боксов или боксов очень разного масштаба. Это послужило причиной разработки вышеупомянутых вариантов IoU. Тем не менее IoU остается краеугольным камнем оценки компьютерного зрения и ключевым понятием в глубоком обучении (DL).

Читать полностью