Двухэтапные детекторы объектов
Откройте для себя возможности двухэтапных детекторов объектов — решений, ориентированных на точность, для точного обнаружения объектов в сложных задачах компьютерного зрения.
Двухэтапные детекторы объектов - это класс сложных
моделей глубокого обучения, предназначенных для идентификации и
определения местоположения объектов на изображениях с высокой точностью. В отличие от своих более быстрых аналогов, эти архитектуры разделяют задачу
задачу обнаружения объектов на две отдельные фазы:
определение потенциальных областей, в которых могут находиться объекты, и последующая классификация этих областей с уточнением их
координат. Такой подход к разделению процесса исторически сделал двухэтапные детекторы золотым стандартом для задач, где
точность имеет первостепенное значение, часто в ущерб скорости и
вычислительных ресурсов.
Двухэтапный рабочий процесс
Архитектура двухступенчатого детектора работает как воронка, сужая данные от широкого изображения до конкретных,
классифицированных объектов. Этот процесс обычно включает в себя
опорная сеть, например ResNet, для извлечения признаков,
Затем следуют два критических этапа:
-
Предложение региона: На первом этапе используется компонент, часто называемый сетью предложения регионов (RPN).
Эта сеть сканирует карты характеристик, созданные
для выявления "регионов интереса" (РИ). На этом этапе модель не классифицирует
объект; по сути, она действует как фоновый фильтр, отмечая области, которые, вероятно, содержат что-то, в отличие от
пустых областей. Эта концепция была закреплена в основополагающем
исследовательской работе Faster R-CNN.
-
Классификация и уточнение: На втором этапе предложенные регионы объединяются в группы фиксированного
размера и подаются в определенную головку обнаружения. Эта
головка выполняет две одновременные задачи: присваивает объекту метку определенного класса (например, "человек", "транспортное средство").
"транспортное средство") объекту и использует
регрессия ограничительной рамки для корректировки координат,
обеспечивая плотное прилегание рамки к объекту.
Двухэтапные и одноэтапные детекторы: сравнение
Понимание разницы между двухступенчатыми и
одноступенчатыми детекторами объектов является
для выбора правильной модели для конкретного применения.
-
Двухступенчатые детекторы (например, Faster R-CNN, Mask R-CNN): В этих моделях приоритет отдается точности. Благодаря
разделяя предложение и классификацию, они отлично справляются со сложными сценами с перекрывающимися объектами или мелкими деталями.
хорошо. Однако этот механизм двойной проверки вводит более высокую
задержку в выводах, что делает их сложными для
в средах, требующих немедленного реагирования.
-
Одноэтапные детекторы (например, YOLO, SSD): Архитектуры, подобные
Ultralytics YOLO рассматривают обнаружение как единственную регрессионную
проблема. За один проход они напрямую отображают пиксели изображения на координаты ограничительной рамки и вероятности классов. Хотя
исторически менее точные, чем двухэтапные модели, современные итерации, такие как
YOLO11 эффективно сократили разрыв в точности, сохранив при этом
сохраняя при этом скорость вычислений в реальном времени.
Ключевые архитектуры в истории
Несколько архитектур определили эволюцию двухэтапного обнаружения:
Применение в реальном мире
Поскольку двухступенчатые детекторы отлично справляются с локализацией мелких объектов и минимизацией
Благодаря тому, что двухступенчатые детекторы позволяют локализовать небольшие объекты и минимизировать количество ложных срабатываний, они по-прежнему востребованы в определенных отраслях промышленности.
-
Анализ медицинских изображений:
В радиологии выявление небольших узлов или опухолей на снимках КТ требует максимально возможной чувствительности. Двухэтапные
модели часто используются для минимизации риска пропустить критический диагноз, о чем подробно говорится в различных исследованиях
ИИ в здравоохранении.
-
Автоматизированный контроль качества:
В производстве выявление микроскопических дефектов на печатных платах или обработанных деталях требует анализа с высоким разрешением
анализа. Возможности точной локализации двухступенчатых детекторов помогают обнаружить дефекты, которые могут быть пропущены
при использовании более быстрых и менее детализированных моделей.
Реализация высокоточного обнаружения
Хотя Ultralytics специализируется на современных одноступенчатых моделях, современные версии, такие как YOLO11 , обеспечивают высокую точность, обычно присущую двухступенчатым детекторам, но при этом работают быстрее.
точность, обычно присущую двухступенчатым детекторам, но при этом значительно быстрее
обучение и вывод модели.
Вот как реализовать предварительно обученную модель YOLO11 с помощью ultralytics пакет для достижения
высокоточные результаты обнаружения:
from ultralytics import YOLO
# Load a high-accuracy pre-trained YOLO11 model (Large variant)
# 'yolo11l.pt' offers a balance of high accuracy comparable to older two-stage models
model = YOLO("yolo11l.pt")
# Run inference on a local image
results = model("path/to/image.jpg")
# Display the results with bounding boxes
results[0].show()
Связанные понятия
-
Якорные коробки: Предопределенные формы ящиков
Используются во многих двухэтапных детекторах для оценки размера и соотношения сторон объекта на этапе предложения.
-
Немаксимальное подавление (NMS):
Метод постобработки, используемый как в одноступенчатых, так и в двухступенчатых детекторах для устранения избыточных перекрывающихся блоков,
обеспечивая только наиболее достоверное обнаружение.
-
Пересечение над объединением (IoU):
Метрика, используемая для измерения перекрытия между предсказанным блоком и истиной, необходимая для обучения RPN
и уточняющих головок.