Настраивайтесь на YOLO Vision 2025!
25 сентября 2025 г.
10:00 — 18:00 BST
Гибридное мероприятие
Yolo Vision 2024
Глоссарий

Ограничивающая рамка

Узнайте, как ограничивающие рамки позволяют системам обнаружения объектов, ИИ и машинного обучения. Изучите их роль в приложениях компьютерного зрения!

Ограничивающая рамка — это прямоугольная аннотация, используемая в компьютерном зрении для указания местоположения объекта на изображении или видеокадре. Она служит фундаментальным компонентом обнаружения объектов, обеспечивая простой, но эффективный способ определения положения и масштаба объекта. В машинном обучении модели обучаются на больших наборах данных изображений с помеченными ограничивающими рамками, чтобы научиться самостоятельно идентифицировать и локализовать объекты. Результат работы этих моделей включает координаты рамки, метку класса (например, «автомобиль», «человек») и оценку достоверности, указывающую на уверенность модели в своем прогнозе.

Как работают ограничивающие рамки (Bounding Boxes)

Ограничивающая рамка обычно определяется набором координат, которые указывают ее положение и размер. Наиболее распространенные представления:

  • Координаты верхнего левого угла с шириной и высотой (x, y, w, h): Этот формат определяет координаты x и y верхнего левого угла, а также ширину и высоту прямоугольника.
  • Угловые точки (x_min, y_min, x_max, y_max): Этот формат определяет координаты верхнего левого и нижнего правого углов прямоугольника.

Эти координаты используются для обучения моделей глубокого обучения, которые учатся прогнозировать эти значения для новых, ранее не виденных изображений. Точность прогнозируемого ограничивающего прямоугольника часто оценивается с использованием метрики, называемой Intersection over Union (IoU) (пересечение над объединением), которая измеряет перекрытие между прогнозируемым прямоугольником и прямоугольником, соответствующим истинному значению. Современные модели обнаружения объектов, такие как Ultralytics YOLO11, высоко оптимизированы для создания точных ограничивающих прямоугольников в режиме реального времени.

Типы ограничивающих рамок

Существует два основных типа ограничивающих рамок:

  1. Ограничивающая рамка, выровненная по осям: Это наиболее распространенный тип, где стороны прямоугольника выровнены по горизонтальной и вертикальной осям изображения. Их просто представлять и обрабатывать, но они могут быть неэффективными для объектов, которые повернуты или имеют неправильную форму, поскольку рамка может включать значительную область фона.
  2. Ориентированная ограничивающая рамка (OBB): Этот тип рамки включает дополнительный параметр для поворота, что позволяет ей более плотно прилегать к наклонным объектам. OBB особенно полезны в специализированных приложениях, таких как анализ спутниковых изображений или аэрофотосъемка с дронов, где объекты часто просматриваются под разными углами. Модели, такие как YOLO11, поддерживают обнаружение ориентированных объектов, чтобы более эффективно справляться с этими сценариями.

Связь с другими концепциями

Ограничивающие рамки тесно связаны с другими задачами компьютерного зрения, но служат определенной цели.

  • Обнаружение объектов и сегментация изображений: В то время как обнаружение объектов использует ограничивающие рамки для определения местоположения объектов, сегментация изображений предлагает более детальное понимание формы объекта. Сегментация экземпляров, например, идет еще дальше, очерчивая точную границу каждого отдельного объекта на уровне пикселей, а не просто рисуя прямоугольник вокруг него. Это полезно для приложений, требующих точной информации о форме. Дополнительную информацию можно найти в этом руководстве по сегментации экземпляров.
  • Bounding Box (Ограничивающий прямоугольник) vs. Anchor Box (Якорный прямоугольник): В некоторых моделях обнаружения объектов, известных как детекторы на основе якорей, предварительно определенные прямоугольники, называемые «якорными прямоугольниками», используются в качестве ориентиров, чтобы помочь модели предсказать окончательный ограничивающий прямоугольник. В отличие от этого, детекторы без якорей предсказывают ограничивающие прямоугольники непосредственно без этих предустановок, часто упрощая архитектуру модели.

Приложения в реальных сценариях

Ограничивающие рамки являются неотъемлемой частью многочисленных практических приложений ИИ:

  1. Автономные транспортные средства: Автомобили с автоматическим управлением в значительной степени полагаются на обнаружение объектов для идентификации и локализации пешеходов, других транспортных средств и светофоров с использованием ограничивающих рамок. Это пространственное восприятие, часто достигаемое с помощью моделей глубокого обучения, имеет решающее значение для безопасной навигации. Такие компании, как Waymo, широко демонстрируют эту технологию. Ultralytics предлагает информацию об ИИ в самоуправляемых автомобилях.
  2. Розничная аналитика: В розничной торговле ограничивающие рамки помогают в управлении запасами на основе ИИ, обнаруживая продукты на полках, отслеживая уровни запасов и анализируя поведение клиентов посредством моделей посещаемости (подсчет объектов).
  3. Безопасность и наблюдение: Ограничивающие рамки позволяют автоматизированным системам мониторинга обнаруживать и отслеживать людей или объекты в режиме реального времени, вызывая оповещения о подозрительных действиях. Это является основой для создания таких приложений, как системы охранной сигнализации.
  4. Анализ медицинских изображений: В здравоохранении ограничивающие рамки помогают врачам, выделяя потенциальные аномалии, такие как опухоли на снимках, помогая в более быстрой диагностике. Вы можете увидеть примеры этого в исследованиях Radiology: Artificial Intelligence и на нашей странице анализа медицинских изображений.
  5. Сельское хозяйство: Ограничивающие рамки используются в точном земледелии для таких задач, как идентификация фруктов для сбора урожая, мониторинг здоровья сельскохозяйственных культур или обнаружение вредителей, как подробно описано в нашем блоге о компьютерном зрении в сельском хозяйстве.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас
Ссылка скопирована в буфер обмена