객체 추적, 인스턴스 분할, 이미지 분류와 같은 컴퓨터 비전 작업이 어떻게 작동하는지, 그리고 Ultralytics YOLO11 이를 어떻게 지원하는지 알아보세요.
카메라와 인공 지능(AI)의 발전 덕분에 컴퓨터와 기계는 이제 사람과 비슷한 방식으로 세상을 볼 수 있게 되었습니다. 예를 들어, 사람을 인식하고 사물을 추적하며 동영상에서 일어나는 일의 맥락을 이해할 수 있습니다.
특히 컴퓨터 비전은 기계가 주변 세계의 시각 정보를 이해하고 해석할 수 있도록 하는 AI의 한 분야입니다. 컴퓨터 비전에는 이미지나 동영상에서 특정 종류의 인사이트를 추출하도록 설계된 다양한 작업이 포함됩니다. 예를 들어 객체 감지는 사진에서 다양한 항목을 식별하고 위치를 찾는 데 도움이 되며, 추적, 분할 및 포즈 추정과 같은 다른 작업은 기계가 움직임, 모양 및 위치를 더 정확하게 이해하는 데 도움이 됩니다.
특정 애플리케이션에 사용되는 컴퓨터 비전 작업은 필요한 인사이트의 유형에 따라 다릅니다. 다음과 같은 컴퓨터 비전 모델 Ultralytics YOLO11 와 같은 컴퓨터 비전 모델은 다양한 컴퓨터 비전 작업을 지원하므로 실제 비전 AI 시스템을 구축하는 데 신뢰할 수 있는 선택입니다.
이 가이드에서는 YOLO11 같은 모델에서 지원하는 컴퓨터 비전 작업에 대해 자세히 살펴보겠습니다. 각 작업의 작동 방식과 다양한 산업 분야에서 어떻게 사용되고 있는지 살펴보겠습니다. 시작해 보겠습니다!
컴퓨터 비전 작업은 다양한 방식으로 인간의 시각 능력을 재현하는 것을 목표로 합니다. 이러한 작업은 기계가 물체를 감지하고, 움직임을 추적하고, 포즈를 추정하고, 이미지와 동영상에서 개별 요소의 윤곽을 잡는 데 도움이 될 수 있습니다. 일반적으로 컴퓨터 비전 작업은 시각적 데이터를 더 작은 부분으로 나누어 무슨 일이 일어나고 있는지 더 명확하게 해석할 수 있도록 하는 모델을 통해 활성화됩니다.
Ultralytics YOLO 모델과 같은 비전 AI 모델은 하나의 프레임워크에서 감지, 추적, 세분화와 같은 여러 작업을 지원합니다. 이러한 다용도성 덕분에 YOLO11 모델은 다양한 사용 사례에 쉽게 적용할 수 있습니다.
이에 대한 좋은 예는 스포츠 분석입니다. YOLO11 객체 감지 기능을 사용해 경기장에 있는 각 선수를 감지한 다음 객체 추적을 통해 경기 내내 선수를 따라갈 수 있습니다. 또한 YOLO11 포즈 추정 기능은 선수의 움직임과 기술을 분석하는 데 도움이 되며, 인스턴스 분할은 각 선수를 배경과 분리하여 분석에 정밀도를 더할 수 있습니다.
이러한 YOLO11 컴퓨터 비전 작업을 함께 사용하면 게임 중에 일어나는 상황을 완벽하게 파악할 수 있어 팀에게 선수의 경기력, 전술 및 전반적인 전략에 대한 심층적인 통찰력을 제공합니다.
이제 컴퓨터 비전 작업이 무엇인지 살펴봤으니 실제 사례를 통해 YOLO11 지원하는 각 작업을 더 자세히 이해해 보겠습니다.
대부분의 사람들은 사진을 보면 개, 산, 교통 표지판 등이 일반적으로 어떻게 생겼는지 학습했기 때문에 쉽게 구분할 수 있습니다. 이미지 분류는 "자동차", "바나나", "골절이 있는 엑스레이" 등 주요 대상에 따라 이미지를 분류하고 레이블을 지정하는 방법을 가르쳐 기계가 동일한 작업을 수행할 수 있도록 도와줍니다. 이 라벨은 컴퓨터 비전 시스템이 시각적 콘텐츠를 이해하여 그에 따라 대응하거나 결정을 내릴 수 있도록 도와줍니다.
이 컴퓨터 비전 작업의 흥미로운 응용 분야 중 하나는 야생동물 모니터링입니다. 이미지 분류는 야생에서 촬영한 사진에서 다양한 동물 종을 식별하는 데 사용할 수 있습니다. 연구자들은 이미지에 자동으로 라벨을 붙임으로써 개체군을 추적하고, 이동 패턴을 모니터링하고, 멸종 위기에 처한 종을 더 쉽게 식별하여 보존 노력을 지원할 수 있습니다.
이미지 분류는 이미지에 포함된 내용을 전반적으로 파악하는 데 도움이 되지만, 전체 이미지에 하나의 라벨만 할당합니다. 여러 개체의 정확한 위치나 신원 등 세부적인 정보가 필요한 상황에서는 개체 감지가 필수적입니다.
객체 감지는 이미지 내에서 개별 객체를 식별하고 위치를 파악하는 프로세스로, 종종 객체 주위에 경계 상자를 그려 넣는 방식으로 이루어집니다. 특히 실시간 물체 감지에서 뛰어난 성능을 발휘하는 Ultralytics YOLO11 다양한 애플리케이션에 이상적입니다.
예를 들어 소매점에서 상품 진열대에 사용되는 컴퓨터 비전 솔루션을 생각해 보세요. 물체 감지는 과일, 채소 및 기타 품목의 개수를 세어 정확한 재고를 파악하는 데 도움이 될 수 있습니다. 농업 분야에서는 같은 기술로 농작물의 성숙도를 모니터링하여 농부가 수확하기 가장 좋은 시기를 결정하고 익은 농산물과 덜 익은 농산물을 구분할 수 있도록 도울 수 있습니다.
객체 감지는 경계 상자를 사용하여 이미지에서 객체를 식별하고 위치를 찾지만 정확한 모양을 캡처하지는 못합니다. 이때 인스턴스 분할 이 필요합니다. 인스턴스 분할은 객체 주위에 상자를 그리는 대신 정확한 윤곽선을 추적합니다.
단순히 "이 영역에 사과가 있습니다"라고 표시하는 것이 아니라 사과의 정확한 모양을 세심하게 윤곽을 그리고 채워 넣는다고 생각하면 됩니다. 이러한 세부적인 프로세스는 특히 물체가 서로 가까이 있을 때 AI 시스템이 물체의 경계를 명확하게 이해하는 데 도움이 됩니다.
인스턴스 세분화는 인프라 검사부터 지질 조사에 이르기까지 다양한 애플리케이션에 적용할 수 있습니다. 예를 들어, 지질 조사 데이터를 YOLO11 사용해 분석하여 크고 작은 표면 균열이나 이상 징후를 세분화할 수 있습니다. 엔지니어는 이러한 이상 징후 주위에 정확한 경계를 그려서 프로젝트 시작 전에 문제를 정확히 파악하고 해결할 수 있습니다.
지금까지 살펴본 컴퓨터 비전 작업은 단일 이미지에 포함된 내용에 초점을 맞췄습니다. 그러나 비디오의 경우 한 프레임을 넘어서는 인사이트가 필요합니다. 이를 위해 객체 추적이라는 작업을 사용할 수 있습니다.
YOLO11 객체 추적 기능은 사람이나 자동차와 같은 특정 객체가 일련의 비디오 프레임에서 움직일 때 이를 따라갈 수 있습니다. 카메라 각도가 바뀌거나 다른 물체가 나타나더라도 시스템은 계속해서 동일한 대상을 따라갑니다.
이는 교통 상황에서의 차량 추적과 같이 시간 경과에 따른 모니터링이 필요한 애플리케이션에 매우 중요합니다. 실제로 YOLO11 차량을 정확하게 추적하여 각 차량을 따라가며 실시간으로 속도를 추정할 수 있습니다. 따라서 객체 추적은 교통 모니터링과 같은 시스템에서 핵심 구성 요소입니다.
현실 세계의 물체는 기울어지거나 옆으로 기울어지거나 이상한 각도로 배치되는 등 항상 완벽하게 정렬되는 것은 아닙니다. 예를 들어 위성 이미지에서 배와 건물은 종종 회전된 것처럼 보입니다.
기존의 객체 감지 방법은 객체의 방향에 맞춰 조정되지 않는 고정된 직사각형 상자를 사용하기 때문에 회전하는 모양을 정확하게 캡처하기 어렵습니다. OBB(오리엔티드 바운딩 박스) 감지는 물체 주위에 꼭 맞도록 회전하는 상자를 사용하여 이 문제를 해결하고 각도에 따라 정렬하여 보다 정밀하게 감지합니다.
항만 모니터링과 관련하여 YOLO11OBB 감지 지원은 방향에 관계없이 선박을 정확하게 식별하고 추적하여 항구에 입출항하는 모든 선박을 적절하게 모니터링할 수 있도록 도와줍니다. 이러한 정밀한 감지는 선박의 위치와 움직임에 대한 실시간 정보를 제공하며, 이는 바쁜 항구를 관리하고 충돌을 예방하는 데 매우 중요합니다.
포즈 추정은 관절, 팔다리 또는 기타 마커와 같은 주요 지점을 추적하여 물체가 어떻게 움직이는지 파악하는 컴퓨터 비전 기법입니다. 이 방법은 전체 물체나 신체를 하나의 완전한 단위로 취급하는 대신 주요 부분으로 세분화합니다. 이를 통해 움직임, 제스처, 상호작용을 자세히 분석할 수 있습니다.
이 기술의 일반적인 응용 분야 중 하나는 사람의 자세 추정입니다. 다양한 신체 부위의 위치를 실시간으로 추적하여 사람이 어떻게 움직이는지 명확하게 파악할 수 있습니다. 이 정보는 제스처 인식, 활동 모니터링, 스포츠 경기력 분석 등 다양한 용도로 활용될 수 있습니다.
마찬가지로, 물리 재활에서 치료사는 인체 자세 추정과 YOLO11 사용하여 운동 중 환자의 움직임을 모니터링할 수 있습니다. 이를 통해 시간 경과에 따른 진행 상황을 추적하면서 각 동작이 올바르게 수행되는지 확인할 수 있습니다.
이제 YOLO11 지원하는 모든 컴퓨터 비전 작업에 대해 자세히 살펴봤으니, YOLO11 이를 어떻게 지원하는지 살펴보겠습니다.
YOLO11 하나의 모델이 아니라 각각 특정 컴퓨터 비전 작업을 위해 설계된 특수 모델 변형 제품군입니다. 따라서 YOLO11 다양한 애플리케이션에 적용할 수 있는 다용도 툴입니다. 또한 사용자 지정 데이터 세트에서 이러한 모델을 미세 조정하여 프로젝트의 고유한 문제를 해결할 수 있습니다.
다음은 특정 시각 작업에 맞게 사전 학습된 YOLO11 모델 변형입니다:
각 변형은 다양한 크기로 제공되므로 사용자는 특정 요구 사항에 맞게 속도와 정확성 사이의 적절한 균형을 선택할 수 있습니다.
컴퓨터 비전 작업은 기계가 세상을 이해하고 상호 작용하는 방식을 바꾸고 있습니다. 이러한 기술은 이미지와 비디오를 핵심 요소로 분류하여 물체, 움직임, 상호 작용을 자세히 분석하기 쉽게 해줍니다.
교통 안전 및 스포츠 경기력 향상부터 산업 프로세스 간소화까지, YOLO11 같은 모델은 혁신을 주도하는 실시간 인사이트를 제공할 수 있습니다. 비전 AI가 계속 발전함에 따라 우리가 매일 시각 데이터를 해석하고 사용하는 방식에서 점점 더 중요한 역할을 하게 될 것입니다.
커뮤니티에 가입하고 깃허브 리포지토리를 방문하여 AI가 실제로 작동하는 모습을 살펴보세요. 솔루션 페이지에서 라이선스 옵션을 살펴보고 농업 분야의 AI와 제조 분야의 컴퓨터 비전에 대해 자세히 알아보세요.