Узнайте, как обнаружение ориентированных ограничивающих рамок (OBB) улучшает обнаружение объектов, точно идентифицируя повернутые объекты на изображениях в различных реальных приложениях.
Узнайте, как обнаружение ориентированных ограничивающих рамок (OBB) улучшает обнаружение объектов, точно идентифицируя повернутые объекты на изображениях в различных реальных приложениях.
Распознавание объектов, независимо от того, как они расположены или в какую сторону они обращены, дается нам, людям, естественным образом. Будь то автомобили на перекрестке или лодки в гавани, мы можем легко сказать, что это такое и в каком направлении они движутся. Однако для систем искусственного интеллекта (AI) это не так просто.
Например, компьютерное зрение, раздел ИИ, специализирующийся на понимании изображений и видео, позволяет решать такие задачи, как обнаружение объектов, которое помогает машинам идентифицировать и определять местоположение объектов в кадре. Традиционное обнаружение объектов использует ограничивающие рамки, выровненные по осям, для выделения объектов. Эти рамки имеют прямые стороны и фиксированные прямые углы. Такой подход хорошо работает, когда объекты расположены вертикально и не слишком близко друг к другу.
Но когда объекты наклонены, повернуты или находятся близко друг к другу, традиционное обнаружение объектов часто с трудом захватывает их точно. Для обработки этих более сложных ситуаций были введены такие методы, как обнаружение ориентированных ограничивающих рамок (OBB). В отличие от стандартных ограничивающих рамок, OBB могут поворачиваться, чтобы соответствовать углу и форме объекта, обеспечивая более плотную и точную посадку.
Модели компьютерного зрения, такие как Ultralytics YOLO11которые поддерживают обнаружение OBB, позволяют использовать их в реальном времени, особенно в сценариях, где ориентация объекта имеет значение, например, при наблюдении с воздуха. Кроме того, обнаружение БД используется в здравоохранении, сельском хозяйстве и анализе документов.
В этой статье мы рассмотрим, что такое OBB-детектирование, как оно работает и где оно применяется в реальных сценариях. Начнем!

Ориентированный ограничивающий прямоугольник (oriented bounding box, OBB) — это тип прямоугольника, используемый в компьютерном зрении для представления обнаруженных объектов на изображении. В то время как стандартные ограничивающие прямоугольники выровнены по горизонтальной и вертикальной осям изображения, OBB могут поворачиваться, чтобы соответствовать фактическому углу объекта.
Эта способность вращаться дает несколько преимуществ. OBB могут более точно соответствовать ориентации объекта, позволяя коробке плотно прилегать к форме и направлению объекта. В результате обнаружение становится более точным и четким.
OBB особенно полезны, когда объекты не расположены идеально вертикально, например, автомобиль, поворачивающий на изогнутой дороге на аэрофотосъемке, наклоненная книга на столе или повернутая опухоль на медицинском снимке. Более точно соответствуя углу объекта, OBB повышают эффективность обнаружения, уменьшают фоновые помехи и особенно хорошо подходят для приложений, где ориентация объекта имеет такое же значение, как и его положение.

Обнаружение OBB и традиционное обнаружение объектов на первый взгляд могут показаться похожими, но они используются по-разному и для разных ситуаций. Давайте подробнее рассмотрим, как они соотносятся, на примере.
Модели компьютерного зрения, такие как YOLO11, могут быть обучены detect и classify объекты в различных реальных приложениях, например, в промышленной инспекции. Рассмотрим заводскую сборочную линию, где по конвейеру движутся различные детали машин. Некоторые детали могут быть расположены аккуратно, но другие могут быть слегка повернуты, наклонены или перекрывать друг друга из-за вибрации или скорости.
Традиционное обнаружение объектов использует прямые прямоугольные рамки, которые выровнены по горизонтальным и вертикальным краям изображения. Поэтому, когда деталь повернута, рамка может не подходить должным образом - она может оставить часть объекта за пределами рамки или включить слишком много фона. Это может сделать обнаружение менее точным и затруднить системе уверенную идентификацию детали.
Теперь, допустим, вы используете обнаружение OBB. В этом случае модель может нарисовать рамку, которая поворачивается, чтобы соответствовать точному углу каждой детали. Наклонная шестерня или угловой компонент будут плотно заключены в рамку, которая соответствует их форме и направлению. Это означает лучшую точность, меньше ошибок и более надежные результаты, особенно в отношении таких вариантов использования, как автоматизированный контроль качества или роботизированная сортировка.
Теперь, когда у нас есть лучшее понимание того, что такое обнаружение OBB, давайте рассмотрим некоторые из наиболее широко используемых моделей Vision AI, которые его поддерживают.
Специально для обнаружения повернутых или наклонных объектов было разработано несколько передовых моделей компьютерного зрения. Среди них модели Ultralytics YOLO , особенно известные своей надежностью и эффективностью в обнаружении БД.
Более ранние версии, такие как Ultralytics YOLOv5 были предназначены для стандартного обнаружения объектов. Более поздние итерации, такие как Ultralytics YOLOv8 и более новая YOLO11, представили встроенную поддержку обнаружения OBB. YOLO11, в частности, предлагает самую современную точность без ущерба для скорости, что делает его эффективным вариантом для приложений, работающих в режиме реального времени.
Предварительно обученные моделиYOLO11 OBB, такие как obb, обучаются на таких наборах данных, как DOTAv1, который состоит из аэрофотоснимков, аннотированных различными классами объектов, такими как самолеты, корабли и теннисные корты, которые появляются под разными углами и в разных ориентациях.
Кроме того, эти модели выпускаются в пяти различных размерах - от нано (obb) до сверхбольших (obb) - для удовлетворения различных потребностей в производительности. Такая универсальность позволяет применять их в различных отраслях - от мониторинга городской инфраструктуры и осмотра техники до чтения искаженного текста в отсканированных документах.
Во многих реальных ситуациях объекты, которые необходимо detect , могут полностью отличаться от объектов в стандартных обучающих наборах данных. Например, такие объекты, как инструменты на производственной линии, упаковки товаров или компоненты на печатной плате, могут быть повернуты, неправильно расположены или иметь другую форму.
Для точного detect таких пользовательских объектов, особенно когда ориентация имеет значение, важно обучать модели, подобные YOLO11 , используя ваши собственные изображения и метки. Этот процесс известен как пользовательское обучение.
Вот подробный обзор пошагового процесса обучения YOLO11 обнаружению OBB:
Объекты, расположенные не по центру или наклоненные, довольно часто встречаются в реальных сценариях. Давайте рассмотрим несколько примеров, когда обнаружение OBB действительно имеет значение, точно обнаруживая эти объекты.
Обнаружение OBB может вывести анализ медицинских изображений на новый уровень, повысив точность. Медицинские изображения часто включают анатомические структуры, такие как опухоли, органы или кости. Эти структуры часто имеют неправильную форму и различную ориентацию. Поскольку OBB могут вращаться, чтобы соответствовать углу объекта, они обеспечивают более точную локализацию и измерение, что имеет решающее значение для диагностики и планирования лечения.
Этот подход особенно эффективен при анализе рентгеновских снимков костных переломов, где положение и выравнивание костей являются ключевыми факторами. Например, обнаружение OBB использовалось для анализа рентгеновских снимков локтевого сустава у детей. Адаптация к ориентации костей помогла повысить точность обнаружения.

Аэросъемка - важный инструмент в таких сферах, как общественная безопасность, экологический мониторинг и градостроительство. Изображения, полученные с помощью беспилотников или спутников, помогают идентифицировать такие объекты, как корабли, автомобили и здания. Однако на таких изображениях объекты часто выглядят маленькими и расположены под необычными углами, что затрудняет их точное detect .
Обнаружение OBB решает эту проблему, наклоняя ограничивающие рамки в соответствии с углом каждого объекта. Это приводит к более точным измерениям размера и ориентации объекта, поддерживая принятие более эффективных решений в таких областях, как градостроительство, оборона, реагирование на стихийные бедствия и мониторинг окружающей среды.
Интересным примером обнаружения OBB является отслеживание судов в морском наблюдении. Спутниковые снимки часто фиксируют суда под разными углами и в разных размерах из-за погодных условий, освещения или движения. OBB могут адаптироваться к этим изменениям, улучшая обнаружение, особенно для небольших или частично скрытых судов.

Сортировка урожая после сбора - важнейший этап обеспечения качества продукции перед ее упаковкой и отправкой на рынок. В то время как многие системы хорошо работают с круглыми фруктами, такими как яблоки и апельсины, с длинными и узкими культурами, например морковью или побегами зизании, справиться гораздо сложнее. Их форма меняется, и они часто оказываются под разными углами, что затрудняет их точное detect и сортировку.
Для решения этой проблемы исследователи разработали систему, использующую обнаружение ориентированных граничных блоков (OBB) для более точной идентификации и оценки таких культур. Система может detect несколько культур на одном изображении, даже если они наклонены или перекрывают друг друга, и оценить их качество и положение в режиме реального времени.
Вот некоторые из преимуществ использования OBB-детектирования:
Несмотря на то, что обнаружение OBB помогает повысить точность обнаружения в сложных сценах, следует учитывать несколько ограничений:
Детекция ориентированных ограничивающих рамок упрощает решениям компьютерного зрения распознавание объектов, которые не являются идеально прямыми или выровненными. Захватывая как положение, так и ориентацию объектов, обнаружение OBB повышает точность в реальных сценариях использования, таких как сканирование медицинских изображений, мониторинг сельскохозяйственных угодий или анализ спутниковых фотографий.
Благодаря таким моделям, как YOLO11 , обнаружение OBB становится все более доступным, и это становится практичным выбором для многих отраслей. Если вы имеете дело с наклонными, перекрывающимися или странной формы объектами, обнаружение OBB добавляет дополнительный уровень точности, который стандартные методы часто упускают.
Интересуетесь ИИ? Изучите наш репозиторий GitHub, присоединяйтесь к нашему сообществу и ознакомьтесь с нашими вариантами лицензирования, чтобы дать старт своему проекту в области компьютерного зрения. Узнайте больше об инновациях, таких как ИИ в розничной торговле и компьютерное зрение в логистике, на страницах наших решений.