Узнайте, как обнаружение ориентированных ограничительных рамок (OBB) улучшает обнаружение объектов, точно определяя повернутые объекты на изображениях в реальных приложениях.

Узнайте, как обнаружение ориентированных ограничительных рамок (OBB) улучшает обнаружение объектов, точно определяя повернутые объекты на изображениях в реальных приложениях.
Распознавание объектов, независимо от того, как они расположены и в какую сторону обращены, является для нас естественным. Будь то автомобили на перекрестке или лодки в гавани, мы легко можем определить, что это такое и в какую сторону они направлены. Однако для систем искусственного интеллекта (ИИ) все не так просто.
Например, компьютерное зрение, отрасль искусственного интеллекта, ориентированная на понимание изображений и видео, позволяет решать такие задачи, как обнаружение объектов, которое помогает машинам идентифицировать и находить объекты в сцене. Традиционное обнаружение объектов опирается на выровненные по оси ограничительные рамки, чтобы нарисовать рамки вокруг объектов. Эти рамки имеют прямые стороны и фиксированные прямые углы. Такой подход хорошо работает, когда объекты расположены вертикально и не слишком близко друг к другу.
Но когда объекты наклонены, повернуты или расположены близко друг к другу, традиционное обнаружение объектов часто не позволяет точно их распознать. Чтобы справиться с этими более сложными ситуациями, были разработаны такие методы, как обнаружение ориентированных ограничительных рамок (OBB). В отличие от стандартных ограничительных рамок, ООБ могут поворачиваться в соответствии с углом и формой объекта, что обеспечивает более плотное и точное прилегание.
Модели компьютерного зрения, такие как Ultralytics YOLO11, поддерживающие обнаружение OBB, позволяют решать целый ряд задач в режиме реального времени, особенно в сценариях, где ориентация объекта имеет значение, например, при наблюдении с воздуха. Кроме того, обнаружение OBB также используется в здравоохранении, сельском хозяйстве и анализе документов.
В этой статье мы рассмотрим, что такое обнаружение OBB, как оно работает и где применяется в реальных сценариях. Давайте начнем!
Ориентированная ограничительная рам ка - это тип прямоугольной рамки, используемой в компьютерном зрении для представления обнаруженных объектов на изображении. В то время как стандартные ограничительные рамки выровнены по горизонтальной и вертикальной осям изображения, OBB могут поворачиваться в соответствии с реальным углом объекта.
Возможность поворота дает несколько преимуществ. OBB могут более точно соответствовать ориентации объекта, позволяя коробке плотно прилегать к форме и направлению объекта. В результате обнаружение становится более точным и аккуратным.
OBB особенно полезны, когда объекты расположены не совсем вертикально, например, автомобиль, поворачивающий на извилистой дороге при съемке с воздуха, наклонная книга на столе или повернутая опухоль при медицинском сканировании. Благодаря более точному соответствию углу наклона объекта, БДБ повышают эффективность обнаружения, снижают фоновые помехи и особенно полезны для приложений, в которых ориентация объекта имеет такое же значение, как и его положение.
Обнаружение OBB и традиционное обнаружение объектов могут показаться на первый взгляд похожими, но они используются по-разному и в разных ситуациях. Давайте рассмотрим их сравнение на примере.
Модели компьютерного зрения, такие как YOLO11, могут быть обучены обнаруживать и классифицировать объекты в различных реальных приложениях, например, в промышленной инспекции. Рассмотрим заводскую сборочную линию, где по конвейеру движутся различные детали машин. Некоторые детали могут быть расположены аккуратно, но другие могут быть слегка повернуты, наклонены или перекрывать друг друга из-за вибрации или скорости.
При традиционном обнаружении объектов используются вертикальные прямоугольные рамки, которые выравниваются по горизонтали и вертикали изображения. Поэтому, когда деталь поворачивается, коробка может не подойти должным образом - она может оставить часть объекта или включить слишком много фона. Это может сделать обнаружение менее точным, и системе будет сложнее уверенно идентифицировать деталь.
Теперь предположим, что вместо этого вы используете обнаружение OBB. В этом случае модель может нарисовать коробку, которая поворачивается в соответствии с точным углом каждой детали. Наклоненная шестеренка или деталь, расположенная под углом, будет плотно окружена коробкой, которая соответствует ее форме и направлению. Это означает более высокую точность, меньшее количество ошибок и более надежные результаты, особенно в таких случаях, как автоматизированный контроль качества или роботизированная сортировка.
Теперь, когда мы лучше понимаем, что такое обнаружение OBB, давайте рассмотрим некоторые из наиболее широко используемых моделей искусственного интеллекта Vision, которые его поддерживают.
Специально для обнаружения повернутых или наклонных объектов было разработано несколько передовых моделей компьютерного зрения. Среди них модели Ultralytics YOLO, особенно известные своей надежностью и эффективностью в обнаружении БДБ.
Ранние версии, такие как Ultralytics YOLOv5, были предназначены для стандартного обнаружения объектов. В более поздних версиях, таких как Ultralytics YOLOv8 и более новая YOLO11, появилась встроенная поддержка обнаружения OBB. YOLO11, в частности, предлагает самую современную точность без ущерба для скорости, что делает его эффективным вариантом для приложений, работающих в режиме реального времени.
Предварительно обученные модели YOLO11 OBB, такие как YOLO11n-obb, обучаются на таких наборах данных, как DOTAv1, который состоит из аэрофотоснимков, аннотированных различными классами объектов, такими как самолеты, корабли и теннисные корты, которые появляются под разными углами и в разных ориентациях.
Кроме того, эти модели выпускаются в пяти различных размерах - от нано (n-obb) до сверхбольших (x-obb) - для удовлетворения различных потребностей в производительности. Такая универсальность позволяет применять их в различных отраслях - от мониторинга городской инфраструктуры и осмотра техники до чтения искаженного текста в отсканированных документах.
Во многих реальных ситуациях объекты, которые необходимо обнаружить, могут полностью отличаться от объектов в стандартных обучающих наборах данных. Например, такие объекты, как инструменты на производственной линии, упаковки товаров или компоненты на печатной плате, могут быть повернуты, неправильно расположены или иметь другую форму.
Для точного обнаружения таких пользовательских объектов, особенно когда ориентация имеет значение, важно обучать модели, подобные YOLO11, используя ваши собственные изображения и метки. Этот процесс известен как пользовательское обучение.
Вот подробный обзор пошагового процесса обучения YOLO11 обнаружению OBB:
Объекты, смещенные от центра или наклоненные, довольно часто встречаются в реальных сценариях. Давайте рассмотрим несколько примеров, когда обнаружение OBB дает реальную пользу, точно определяя такие объекты.
Обнаружение OBB может сделать анализ медицинских изображений еще одним шагом вперед, повысив точность. Медицинские изображения часто содержат анатомические структуры, такие как опухоли, органы или кости. Эти структуры часто имеют неправильную форму и различную ориентацию. Поскольку БДП могут поворачиваться в соответствии с углом наклона объекта, они обеспечивают более точную локализацию и измерение, что очень важно для диагностики и планирования лечения.
Этот подход особенно эффективен при анализе рентгеновских снимков переломов костей, где ключевыми факторами являются положение и выравнивание костей. Например, обнаружение OBB было использовано для анализа рентгеновских снимков локтевых суставов у детей. Подстраиваясь под ориентацию костей, он помог повысить точность обнаружения.
Аэросъемка - важный инструмент в таких сферах, как общественная безопасность, экологический мониторинг и градостроительство. Изображения, полученные с помощью беспилотников или спутников, помогают идентифицировать такие объекты, как корабли, автомобили и здания. Однако на таких изображениях объекты часто выглядят маленькими и расположены под необычными углами, что затрудняет их точное обнаружение.
Обнаружение OBB решает эту проблему, наклоняя ограничивающие рамки в соответствии с углом наклона каждого объекта. Это приводит к более точным измерениям размера и ориентации объекта, что способствует принятию более эффективных решений в таких областях, как городское планирование, оборона, реагирование на стихийные бедствия и мониторинг окружающей среды.
Интересным примером обнаружения OBB является отслеживание судов в морском наблюдении. На спутниковых снимках корабли часто запечатлены под разными углами и с разными размерами из-за погоды, освещения или движения. БДБ могут адаптироваться к этим изменениям, улучшая обнаружение, особенно небольших или частично скрытых судов.
Сортировка урожая после сбора - важнейший этап обеспечения качества продукции перед ее упаковкой и отправкой на рынок. В то время как многие системы хорошо работают с круглыми фруктами, такими как яблоки и апельсины, с длинными и узкими культурами, например морковью или побегами зизании, справиться гораздо сложнее. Их форма меняется, и они часто оказываются под разными углами, что затрудняет их точное обнаружение и сортировку.
Для решения этой проблемы исследователи разработали систему, использующую обнаружение ориентированных граничных блоков (OBB) для более точной идентификации и оценки таких культур. Система может обнаружить несколько культур на одном изображении, даже если они наклонены или перекрывают друг друга, и оценить их качество и положение в режиме реального времени.
Вот некоторые преимущества использования функции обнаружения OBB:
Несмотря на то, что обнаружение OBB помогает повысить точность обнаружения в сложных сценах, оно имеет ряд ограничений, которые необходимо учитывать:
Определение ориентированных ограничительных рамок облегчает решениям для компьютерного зрения распознавание объектов, которые не являются идеально прямыми или выровненными. Захватывая положение и ориентацию объектов, обнаружение OBB повышает точность распознавания в реальных условиях, например при сканировании медицинских изображений, мониторинге сельскохозяйственных угодий или анализе спутниковых фотографий.
Благодаря таким моделям, как YOLO11, обнаружение OBB становится все более доступным, и это становится практичным выбором для многих отраслей. Если вы имеете дело с наклонными, перекрывающимися или странной формы объектами, обнаружение OBB добавляет дополнительный уровень точности, который стандартные методы часто упускают.
Любопытно узнать об искусственном интеллекте? Изучите наш репозиторий GitHub, общайтесь с нашим сообществом и ознакомьтесь с нашими вариантами лицензирования, чтобы начать свой проект по компьютерному зрению. Узнайте больше о таких инновациях, как ИИ в розничной торговле и компьютерное зрение в логистической отрасли, на страницах наших решений.