OBB(방향성 경계 상자) 감지 기능이 실제 애플리케이션에서 이미지의 회전된 물체를 정확하게 식별하여 물체 감지를 향상시키는 방법을 살펴보세요.

OBB(방향성 경계 상자) 감지 기능이 실제 애플리케이션에서 이미지의 회전된 물체를 정확하게 식별하여 물체 감지를 향상시키는 방법을 살펴보세요.
사물의 배열 방식이나 방향에 관계없이 사물을 인식하는 것은 인간에게 자연스러운 일입니다. 교차로에 있는 자동차든 항구에 있는 배든 우리는 그것이 무엇인지, 어느 방향을 가리키고 있는지 쉽게 알 수 있습니다. 하지만 인공지능(AI) 시스템의 경우 그렇게 간단하지 않습니다.
예를 들어, 이미지와 동영상을 이해하는 데 중점을 둔 AI의 한 분야인 컴퓨터 비전은 객체 감지와 같은 작업을 통해 기계가 장면 내에서 객체를 식별하고 위치를 찾을 수 있도록 도와줍니다. 기존의 객체 감지는 축으로 정렬된 경계 상자를 사용하여 객체 주위에 상자를 그립니다. 이 상자는 직선과 고정된 직각을 갖습니다. 이 방식은 물체가 똑바로 세워져 있고 서로 너무 가깝지 않을 때 잘 작동합니다.
그러나 물체가 기울어지거나 회전하거나 서로 가까이 있는 경우 기존의 물체 감지 기능으로는 정확하게 캡처하는 데 어려움을 겪는 경우가 많습니다. 이러한 복잡한 상황을 처리하기 위해 방향성 바운딩 박스(OBB) 감지와 같은 기술이 도입되었습니다. 표준 바운딩 박스와 달리 OBB는 물체의 각도와 모양에 맞게 회전할 수 있으므로 더 단단하고 정확하게 맞출 수 있습니다.
특히 항공 감시와 같이 물체 방향이 중요한 시나리오에서는 OBB 감지를 지원하는 Ultralytics YOLO11과 같은 컴퓨터 비전 모델을 통해 다양한 실시간 애플리케이션을 구현할 수 있습니다. 그 외에도 OBB 감지는 의료, 농업, 문서 분석 등에도 사용됩니다.
이 글에서는 OBB 감지가 무엇인지, 어떻게 작동하는지, 실제 시나리오에서 어디에 적용되고 있는지 살펴봅니다. 시작해 보겠습니다!
방향이 지정된 바운딩 박스는 컴퓨터 비전에서 이미지에서 감지된 객체를 표현하는 데 사용되는 직사각형 상자의 한 유형입니다. 표준 바운딩 박스는 이미지의 가로축과 세로축에 맞춰 정렬되지만, OBB는 물체의 실제 각도에 맞게 회전할 수 있습니다.
이 회전 기능은 테이블에 여러 가지 이점을 가져다줍니다. OBB는 물체의 방향에 더 가깝게 정렬할 수 있으므로 상자가 물체의 모양과 방향에 꼭 맞을 수 있습니다. 결과적으로 감지가 더욱 정확하고 정밀해집니다.
OBB는 항공 영상에서 커브길에서 회전하는 자동차, 책상 위에 기울어진 책, 의료 스캔에서 회전하는 종양과 같이 물체가 완벽하게 똑바로 서 있지 않을 때 특히 유용합니다. OBB는 물체의 각도를 보다 정확하게 일치시킴으로써 감지 성능을 개선하고 배경 간섭을 줄이며 물체의 위치만큼이나 물체의 방향이 중요한 애플리케이션에 특히 유용합니다.
OBB 감지와 기존 객체 감지는 언뜻 비슷해 보이지만 서로 다른 방식과 상황에서 사용됩니다. 예시를 통해 두 가지를 비교하여 자세히 살펴보겠습니다.
YOLO11과 같은 컴퓨터 비전 모델은 산업 검사와 같은 다양한 실제 애플리케이션에서 물체를 감지하고 분류하도록 훈련할 수 있습니다. 다양한 기계 부품이 컨베이어 벨트를 따라 움직이는 공장 조립 라인을 생각해 봅시다. 일부 부품은 깔끔하게 배치되어 있지만 다른 부품은 진동이나 속도로 인해 약간 회전하거나 기울어지거나 겹칠 수 있습니다.
기존의 객체 감지 기능은 이미지의 가로 및 세로 가장자리에 정렬된 직사각형의 직립형 상자를 사용합니다. 따라서 부품이 회전하면 상자가 제대로 맞지 않아 물체의 일부가 누락되거나 배경이 너무 많이 포함될 수 있습니다. 이로 인해 감지 정확도가 떨어지고 시스템에서 부품을 확실하게 식별하기가 어려워질 수 있습니다.
이제 OBB 감지를 대신 사용한다고 가정해 보겠습니다. 이 경우 모델은 각 부품의 정확한 각도와 일치하도록 회전하는 상자를 그릴 수 있습니다. 기울어진 기어나 각진 부품은 그 모양과 방향에 맞는 상자로 단단히 둘러싸이게 됩니다. 이는 특히 자동화된 품질 관리 또는 로봇 분류와 같은 사용 사례와 관련하여 더 나은 정밀도, 더 적은 오류, 더 신뢰할 수 있는 결과를 의미합니다.
이제 OBB 감지가 무엇인지 더 잘 이해했으니, 이를 지원하는 가장 널리 사용되는 Vision AI 모델 몇 가지를 살펴보겠습니다.
회전하거나 기울어진 물체를 감지하기 위해 특별히 개발된 고급 컴퓨터 비전 모델이 여러 가지 있습니다. 그중에서도 특히 신뢰할 수 있고 효율적인 OBB 감지 기능으로 잘 알려진 것이 바로 Ultralytics YOLO 모델입니다.
Ultralytics YOLOv5와 같은 이전 버전은 표준 객체 감지를 위해 설계되었습니다. 이후 버전인 Ultralytics YOLOv8과 최신 버전인 YOLO11은 OBB 감지에 대한 기본 지원을 도입했습니다. 특히 YOLO11은 속도 저하 없이 최첨단 정확도를 제공하므로 실시간 애플리케이션을 위한 강력한 옵션이 될 수 있습니다.
YOLO11n-obb와 같은 사전 학습된 YOLO11 OBB 모델은 다양한 각도와 방향에서 나타나는 비행기, 선박, 테니스 코트와 같은 다양한 객체 클래스로 주석이 달린 항공 이미지로 구성된 DOTAv1과 같은 데이터 세트로 학습됩니다.
또한 나노(n-obb)부터 초대형(x-obb)까지 5가지 크기로 제공되므로 다양한 성능 요구 사항에 맞게 선택할 수 있습니다. 이러한 다용도성 덕분에 도시 인프라 모니터링과 기계 검사부터 스캔 문서의 왜곡된 텍스트 판독에 이르기까지 다양한 산업 분야에 적용할 수 있습니다.
많은 실제 상황에서 감지해야 하는 물체는 표준 훈련 데이터 세트의 물체와 완전히 다를 수 있습니다. 예를 들어 생산 라인의 도구, 제품 패키지 또는 회로 기판의 부품과 같은 물체는 회전하거나 불규칙하게 배치되거나 모양이 다를 수 있습니다.
특히 방향이 중요한 경우 이러한 사용자 지정 객체를 정확하게 감지하려면 자체 이미지와 레이블을 사용하여 YOLO11과 같은 모델을 학습시키는 것이 중요합니다. 이 과정을 사용자 지정 학습이라고 합니다.
OBB 감지를 위해 YOLO11을 훈련시키는 단계별 프로세스를 자세히 살펴보세요:
중심을 벗어나거나 기울어진 물체는 실제 시나리오에서 매우 흔하게 볼 수 있습니다. 이러한 물체를 정확하게 감지하여 OBB 감지가 실질적인 차이를 만드는 몇 가지 예를 살펴보겠습니다.
OBB 감지는 정밀도를 개선하여 의료 이미지 분석을 한 단계 더 발전시킬 수 있습니다. 의료 이미지에는 종양, 장기 또는 뼈와 같은 해부학적 구조가 포함되는 경우가 많습니다. 이러한 구조는 종종 불규칙한 모양과 다양한 방향으로 나타납니다. OBB는 물체의 각도에 맞춰 회전할 수 있기 때문에 진단 및 치료 계획에 중요한 정확한 위치 파악과 측정을 제공합니다.
이 접근 방식은 뼈의 위치와 정렬이 핵심 요소인 골절의 엑스레이 이미지를 분석할 때 특히 효과적입니다. 예를 들어, 소아 팔꿈치 엑스레이를 분석하는 데 OBB 감지가 사용되었습니다. 뼈의 방향에 맞게 조정함으로써 감지 정확도를 높이는 데 도움이 되었습니다.
항공 감시는 공공 안전, 환경 모니터링, 도시 계획과 같은 분야에서 필수적인 도구입니다. 드론이나 인공위성으로 촬영한 이미지는 선박, 차량, 건물과 같은 물체를 식별하는 데 도움이 될 수 있습니다. 그러나 이러한 이미지에서 물체는 종종 작고 비정상적인 각도로 나타나기 때문에 정확하게 감지하기가 더 어렵습니다.
OBB 감지는 각 물체의 각도에 맞게 경계 상자를 기울임으로써 이 문제를 해결합니다. 이를 통해 물체의 크기와 방향을 보다 정확하게 측정하여 도시 계획, 방위, 재난 대응, 환경 모니터링과 같은 분야에서 더 나은 의사 결정을 내릴 수 있습니다.
OBB 감지의 흥미로운 예로는 해상 감시에서 선박 추적을 들 수 있습니다. 위성 이미지는 날씨, 조명 또는 움직임으로 인해 다양한 각도와 크기로 선박을 포착하는 경우가 많습니다. OBB는 이러한 변화에 적응하여 특히 작거나 부분적으로 가려진 선박의 탐지를 개선할 수 있습니다.
수확 후 농작물을 분류하는 것은 포장하여 시장에 보내기 전에 품질을 보장하기 위한 중요한 단계입니다. 사과나 오렌지와 같은 둥근 과일에는 많은 시스템이 잘 작동하지만 당근이나 지자니아 새싹처럼 길고 좁은 작물은 다루기가 훨씬 더 어려울 수 있습니다. 모양이 다양하고 각도가 다른 경우가 많기 때문에 정확하게 감지하고 분류하기가 까다롭습니다.
이 문제를 해결하기 위해 연구원들은 방향성 경계 상자(OBB) 감지를 사용하여 이러한 작물을 더 정확하게 식별하고 등급을 매기는 시스템을 개발했습니다. 이 시스템은 한 이미지에서 여러 작물이 기울어지거나 겹쳐져 있어도 이를 감지하고 실시간으로 품질과 위치를 평가할 수 있습니다.
OBB 감지 기능을 사용하면 얻을 수 있는 몇 가지 이점은 다음과 같습니다:
복잡한 장면에서 감지 정확도를 향상시키는 데 도움이 되지만 OBB 감지에는 고려해야 할 몇 가지 제한 사항이 있습니다:
방향성 경계 상자 감지 기능을 사용하면 컴퓨터 비전 솔루션이 완벽하게 직선이 아니거나 정렬되지 않은 물체를 더 쉽게 인식할 수 있습니다. OBB 감지는 물체의 위치와 방향을 모두 캡처함으로써 의료 이미지 스캔, 농지 모니터링, 위성 사진 분석과 같은 실제 사용 사례에서 정확도를 높여줍니다.
YOLO11과 같은 모델을 통해 OBB 감지에 대한 접근성이 높아지면서 많은 산업 분야에서 실용적인 선택이 되고 있습니다. 기울어지거나 겹치거나 이상한 모양의 물체를 처리할 때 OBB 감지는 표준 방법으로는 놓치기 쉬운 정밀도를 한층 더 높여줍니다.
AI에 대해 궁금하신가요? GitHub 리포지토리를 살펴보고, 커뮤니티에 참여하고, 라이선스 옵션을 확인하여 컴퓨터 비전 프로젝트를 시작하세요. 솔루션 페이지에서 소매업의 AI와 물류 업계의 컴퓨터 비전과 같은 혁신에 대해 자세히 알아보세요.