Глоссарий

Ограничительная рамка

Узнайте, как ограничивающие рамки позволяют обнаруживать объекты, использовать искусственный интеллект и системы машинного обучения. Изучите их роль в приложениях компьютерного зрения!

Ограничительная рамка - это прямоугольное обозначение, используемое в компьютерном зрении для указания местоположения объекта в кадре изображения или видео. Она служит фундаментальным компонентом обнаружения объектов, обеспечивая простой, но эффективный способ определения положения и масштаба объекта. В процессе машинного обучения модели обучаются на больших массивах изображений с помеченными ограничительными рамками, чтобы научиться самостоятельно идентифицировать и локализовать объекты. Выходные данные этих моделей включают координаты бокса, метку класса (например, "автомобиль", "человек") и балл доверия, указывающий на уверенность модели в своем предсказании.

Как работают ограничительные рамки

Граничная область обычно определяется набором координат, которые задают ее положение и размер. Наиболее распространенными представлениями являются:

  • Координаты левого верхнего угла с шириной и высотой (x, y, w, h): В этом формате указываются координаты x и y левого верхнего угла, а также ширина и высота поля.
  • Угловые точки (x_min, y_min, x_max, y_max): В этом формате задаются координаты левого верхнего и правого нижнего углов прямоугольника.

Эти координаты используются для обучения моделей глубокого обучения, которые учатся предсказывать эти значения для новых, невидимых изображений. Точность предсказанной границы часто оценивается с помощью метрики, называемой Intersection over Union (IoU), которая измеряет перекрытие между предсказанной границей и истинной границей. Современные модели обнаружения объектов, такие как Ultralytics YOLO11, хорошо оптимизированы для создания точных ограничительных рамок в режиме реального времени.

Типы ограничительных рамок

Существует два основных типа ограничивающих рамок:

  1. Граничная рамка с выравниванием по оси: Это наиболее распространенный тип, в котором стороны прямоугольника выровнены по горизонтальной и вертикальной осям изображения. Они просты в представлении и обработке, но могут быть неэффективны для объектов, которые вращаются или имеют неправильную форму, так как в рамку может попасть значительная фоновая область.
  2. Oriented Bounding Box (OBB): Этот тип бокса включает дополнительный параметр для вращения, что позволяет ему более плотно облегать наклоненные объекты. OBB особенно полезны в специализированных приложениях, таких как анализ спутниковых изображений или аэрофотосъемка с беспилотников, где объекты часто рассматриваются под разными углами. Такие модели, как YOLO11, поддерживают ориентированное обнаружение объектов для более эффективной работы с такими сценариями.

Взаимосвязь с другими концепциями

Граничные поля тесно связаны с другими задачами компьютерного зрения, но служат для разных целей.

  • Обнаружение объектов и сегментация изображений: Если при обнаружении объектов для определения их местоположения используются ограничительные рамки, то сегментация изображений позволяет получить более детальное представление о форме объекта. Например, сегментация экземпляров идет дальше, определяя точную границу каждого отдельного объекта на уровне пикселей, а не просто рисуя прямоугольник вокруг него. Это полезно для приложений, требующих точной информации о форме. Более подробную информацию можно найти в этом руководстве по сегментации экземпляров.
  • Граничная коробка по сравнению с якорной коробкой: В некоторых моделях обнаружения объектов, известных как детекторы, основанные на якорях, предварительно заданные ячейки, называемые "якорными ящиками", используются в качестве ссылок, чтобы помочь модели предсказать конечную ограничительную рамку. В отличие от них, детекторы без якорей предсказывают ограничительные рамки напрямую, без этих предустановок, что часто упрощает архитектуру модели.

Применение в реальных сценариях

Граничные коробки являются неотъемлемой частью многочисленных практических приложений ИИ:

  1. Автономные транспортные средства: Самостоятельно управляемые автомобили в значительной степени полагаются на распознавание объектов, чтобы идентифицировать и определять местоположение пешеходов, других транспортных средств и светофоров с помощью ограничительных блоков. Такая пространственная осведомленность, часто достигаемая с помощью моделей глубокого обучения, очень важна для безопасной навигации. Такие компании, как Waymo, активно демонстрируют эту технологию. Ultralytics предлагает взглянуть на ИИ в самоуправляемых автомобилях.
  2. Аналитика розничной торговли: В розничной торговле ограничивающие поля помогают управлять запасами на основе ИИ, обнаруживая товары на полках, отслеживая уровни запасов и анализируя поведение покупателей по схемам движения(подсчет объектов).
  3. Безопасность и наблюдение: Границы позволяют автоматизированным системам мониторинга обнаруживать и отслеживать людей или объекты в режиме реального времени, подавая сигналы о подозрительных действиях. Это очень важно для таких приложений, как системы охранной сигнализации.
  4. Анализ медицинских изображений: В здравоохранении ограничительные рамки помогают врачам, выделяя на снимках потенциальные аномалии, такие как опухоли, что способствует более быстрой диагностике. Примеры этого можно увидеть в разделе "Радиология": Исследование искусственного интеллекта и на нашей странице, посвященной анализу медицинских изображений.
  5. Сельское хозяйство: Bounding boxes используются в точном сельском хозяйстве для решения таких задач, как определение плодов для сбора урожая, мониторинг состояния посевов или обнаружение вредителей, о чем подробно рассказывается в нашем блоге о компьютерном зрении в сельском хозяйстве.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему искусственного интеллекта. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединяйтесь сейчас
Ссылка копируется в буфер обмена