Глоссарий

Двухэтапные детекторы объектов

Откройте для себя возможности двухэтапных детекторов объектов — решений, ориентированных на точность, для точного обнаружения объектов в сложных задачах компьютерного зрения.

Двухэтапные детекторы объектов - это класс сложных моделей глубокого обучения, предназначенных для идентификации и определения местоположения объектов на изображениях с высокой точностью. В отличие от своих более быстрых аналогов, эти архитектуры разделяют задачу задачу обнаружения объектов на две отдельные фазы: определение потенциальных областей, в которых могут находиться объекты, и последующая классификация этих областей с уточнением их координат. Такой подход к разделению процесса исторически сделал двухэтапные детекторы золотым стандартом для задач, где точность имеет первостепенное значение, часто в ущерб скорости и вычислительных ресурсов.

Двухэтапный рабочий процесс

Архитектура двухступенчатого детектора работает как воронка, сужая данные от широкого изображения до конкретных, классифицированных объектов. Этот процесс обычно включает в себя опорная сеть, например ResNet, для извлечения признаков, Затем следуют два критических этапа:

Предложение региона: На первом этапе используется компонент, часто называемый сетью предложения регионов (RPN). Эта сеть сканирует карты характеристик, созданные для выявления "регионов интереса" (РИ). На этом этапе модель не классифицирует объект; по сути, она действует как фоновый фильтр, отмечая области, которые, вероятно, содержат что-то, в отличие от пустых областей. Эта концепция была закреплена в основополагающем исследовательской работе Faster R-CNN.
Классификация и уточнение: На втором этапе предложенные регионы объединяются в группы фиксированного размера и подаются в определенную головку обнаружения. Эта головка выполняет две одновременные задачи: присваивает объекту метку определенного класса (например, "человек", "транспортное средство"). "транспортное средство") объекту и использует регрессия ограничительной рамки для корректировки координат, обеспечивая плотное прилегание рамки к объекту.

Двухэтапные и одноэтапные детекторы: сравнение

Понимание разницы между двухступенчатыми и одноступенчатыми детекторами объектов является для выбора правильной модели для конкретного применения.

Двухступенчатые детекторы (например, Faster R-CNN, Mask R-CNN): В этих моделях приоритет отдается точности. Благодаря разделяя предложение и классификацию, они отлично справляются со сложными сценами с перекрывающимися объектами или мелкими деталями. хорошо. Однако этот механизм двойной проверки вводит более высокую задержку в выводах, что делает их сложными для в средах, требующих немедленного реагирования.
Одноэтапные детекторы (например, YOLO, SSD): Архитектуры, подобные Ultralytics YOLO рассматривают обнаружение как единственную регрессионную проблема. За один проход они напрямую отображают пиксели изображения на координаты ограничительной рамки и вероятности классов. Хотя исторически менее точные, чем двухэтапные модели, современные итерации, такие как YOLO11 эффективно сократили разрыв в точности, сохранив при этом сохраняя при этом скорость вычислений в реальном времени.

Ключевые архитектуры в истории

Несколько архитектур определили эволюцию двухэтапного обнаружения:

R-CNN (Region-based Convolutional Neural Networks): Родоначальник этого семейства, который использовал селективный поиск для предложения регионов перед подачей их в Конволюционная нейронная сеть (CNN).
Быстрая R-CNN: Улучшение оригинала за счет разделения вычислений по всему изображению, что значительно повышает эффективность обучения.
Mask R-CNN: Расширение Faster R-CNN, которое добавляет ветвь для предсказания масок сегментации, что позволяет сегментацию экземпляров наряду со стандартным обнаружение.

Применение в реальном мире

Поскольку двухступенчатые детекторы отлично справляются с локализацией мелких объектов и минимизацией Благодаря тому, что двухступенчатые детекторы позволяют локализовать небольшие объекты и минимизировать количество ложных срабатываний, они по-прежнему востребованы в определенных отраслях промышленности.

Анализ медицинских изображений: В радиологии выявление небольших узлов или опухолей на снимках КТ требует максимально возможной чувствительности. Двухэтапные модели часто используются для минимизации риска пропустить критический диагноз, о чем подробно говорится в различных исследованиях ИИ в здравоохранении.
Автоматизированный контроль качества: В производстве выявление микроскопических дефектов на печатных платах или обработанных деталях требует анализа с высоким разрешением анализа. Возможности точной локализации двухступенчатых детекторов помогают обнаружить дефекты, которые могут быть пропущены при использовании более быстрых и менее детализированных моделей.

Реализация высокоточного обнаружения

Хотя Ultralytics специализируется на современных одноступенчатых моделях, современные версии, такие как YOLO11 , обеспечивают высокую точность, обычно присущую двухступенчатым детекторам, но при этом работают быстрее. точность, обычно присущую двухступенчатым детекторам, но при этом значительно быстрее обучение и вывод модели.

Вот как реализовать предварительно обученную модель YOLO11 с помощью ultralytics пакет для достижения высокоточные результаты обнаружения:

from ultralytics import YOLO

# Load a high-accuracy pre-trained YOLO11 model (Large variant)
# 'yolo11l.pt' offers a balance of high accuracy comparable to older two-stage models
model = YOLO("yolo11l.pt")

# Run inference on a local image
results = model("path/to/image.jpg")

# Display the results with bounding boxes
results[0].show()

Связанные понятия

Якорные коробки: Предопределенные формы ящиков Используются во многих двухэтапных детекторах для оценки размера и соотношения сторон объекта на этапе предложения.
Немаксимальное подавление (NMS): Метод постобработки, используемый как в одноступенчатых, так и в двухступенчатых детекторах для устранения избыточных перекрывающихся блоков, обеспечивая только наиболее достоверное обнаружение.
Пересечение над объединением (IoU): Метрика, используемая для измерения перекрытия между предсказанным блоком и истиной, необходимая для обучения RPN и уточняющих головок.

Двухэтапные детекторы объектов

Обучение моделям Ultralytics YOLO для оптимизации рабочих процессов в разных отраслях

Гибкое корпоративное лицензирование для развития ваших инноваций

Обучайте модели искусственного интеллекта за считанные секунды с помощью Ultralytics YOLO

Двухэтапный рабочий процесс

Двухэтапные и одноэтапные детекторы: сравнение

Ключевые архитектуры в истории

Применение в реальном мире

Реализация высокоточного обнаружения

Связанные понятия

Читать больше в этой категории

Понимание важности аннотации с участием человека

Что такое дистилляция наборов данных? Краткий обзор

Очки Oakley Meta AI переосмысливают концепцию очков с помощью Vision AI

Присоединяйтесь к сообществу Ultralytics