YOLO Vision 2025를 놓치지 마세요!
2025년 9월 25일
10:00 — 18:00 BST
하이브리드 이벤트
Yolo Vision 2024

컴퓨터 비전 애플리케이션 작동 방식 살펴보기

Abirami Vina

5분 분량

2024년 8월 9일

컴퓨터 비전 애플리케이션에 대해 자세히 알아보세요. 또한 객체 감지 및 분할과 같은 다양한 컴퓨터 비전 작업에 대해서도 살펴보겠습니다.

컴퓨터 비전 모델의 역사를 살펴보면서 컴퓨터 비전이 어떻게 발전해 왔고 오늘날 우리가 사용하는 고급 비전 모델로 이어지게 되었는지 확인했습니다. Ultralytics YOLOv8과 같은 최신 모델은 다양한 컴퓨터 비전 작업을 지원하며 다양한 흥미로운 애플리케이션에 사용되고 있습니다. 

이 글에서는 컴퓨터 비전과 비전 모델의 기본 사항을 살펴보겠습니다. 작동 방식과 다양한 산업 분야에서의 다양한 응용 분야를 다룰 것입니다. 컴퓨터 비전 혁신은 우리 주변 어디에나 있으며, 조용히 우리의 세계를 만들어가고 있습니다. 하나씩 알아봅시다! 

컴퓨터 비전이란 무엇입니까?

인공 지능(AI)은 인간 지능의 일부를 복제하는 것을 목표로 하는 많은 기술을 포괄하는 포괄적인 용어입니다. AI의 한 분야는 컴퓨터 비전입니다. 컴퓨터 비전은 기계에게 주변 환경을 보고, 관찰하고, 이해할 수 있는 눈을 제공하는 데 중점을 둡니다. 

인간의 시각과 마찬가지로 컴퓨터 비전 솔루션은 물체를 구별하고, 거리를 계산하고, 움직임을 감지하는 것을 목표로 합니다. 그러나 보고 이해하는 데 도움이 되는 평생의 경험을 가진 인간과는 달리 컴퓨터는 방대한 양의 데이터, 고화질 카메라 및 복잡한 알고리즘에 의존합니다. 

그림 1. 인간의 시각과 컴퓨터 비전 비교.

컴퓨터 비전 시스템은 이미지 및 비디오와 같은 시각적 데이터를 놀라운 속도와 정확도로 처리하고 분석할 수 있습니다. 방대한 양의 시각 정보를 빠르고 정확하게 분석하는 능력은 컴퓨터 비전을 제조에서 의료에 이르기까지 다양한 산업 분야에서 강력한 도구로 만듭니다.

비전 모델은 다양한 컴퓨터 비전 작업을 지원합니다.

컴퓨터 비전 모델은 모든 컴퓨터 비전 애플리케이션의 핵심입니다. 기본적으로 기계가 시각 정보를 해석하고 이해할 수 있도록 설계된 딥 러닝 기술로 구동되는 계산 알고리즘입니다. 비전 모델은 이미지 분류에서 객체 감지에 이르기까지 중요한 컴퓨터 비전 작업을 가능하게 합니다. 이러한 작업과 사용 사례를 자세히 살펴보겠습니다. 

이미지 분류

이미지 분류는 이미지를 미리 정의된 클래스 또는 범주로 분류하고 레이블을 지정하는 것을 포함합니다. YOLOv8과 같은 비전 모델은 레이블이 지정된 이미지의 대규모 데이터 세트에서 훈련할 수 있습니다. 훈련 중에 모델은 각 클래스와 관련된 패턴과 특징을 인식하는 방법을 학습합니다. 훈련이 완료되면 특징을 분석하고 학습된 패턴과 비교하여 새로운 미지의 이미지의 범주를 예측할 수 있습니다. 

그림 2. 이미지 분류의 예. (출처: towardsdatascience.com)

이미지 분류에는 여러 유형이 있습니다. 예를 들어 의료 이미지를 다룰 때 이진 분류를 사용하여 사진을 건강 또는 질병과 같은 두 그룹으로 나눌 수 있습니다. 또 다른 유형은 다중 클래스 분류입니다. 돼지, 염소, 소와 같이 농장의 다양한 동물을 분류하는 데 도움이 될 수 있습니다. 또는 동물을 포유류와 조류로 분류한 다음 사자, 호랑이, 독수리, 참새와 같은 종으로 더 분류하는 것과 같이 동물 그룹과 하위 그룹으로 분류하려는 경우 계층적 분류가 가장 적합합니다.

객체 감지

객체 감지는 컴퓨터 비전을 사용하여 이미지 및 비디오 프레임에서 객체를 식별하고 위치를 파악하는 프로세스입니다. 객체 주위에 경계 상자를 그리는 객체 지역화와 각 객체의 범주를 식별하는 객체 분류의 두 가지 작업으로 구성됩니다. 경계 상자 주석을 기반으로 비전 모델은 각 객체 범주에 특정한 패턴과 특징을 인식하고 새로운 미지의 이미지에서 이러한 객체의 존재와 위치를 예측하는 방법을 학습할 수 있습니다. 

Fig 3. 축구장에서 선수들을 감지하는 데 사용되는 YOLOv8 객체 감지.

객체 감지는 스포츠에서 해양 생물학에 이르기까지 다양한 산업 분야에서 많은 활용 사례를 가지고 있습니다. 예를 들어 소매업에서 Amazon의 Just Walk Out 기술은 고객이 집어 든 품목을 식별하여 계산대를 자동화하기 위해 객체 감지를 사용합니다. 컴퓨터 비전과 센서 데이터의 조합을 통해 고객은 줄을 서서 기다리지 않고도 물건을 집어 나갈 수 있습니다. 

작동 방식에 대한 자세한 내용은 다음과 같습니다.

  • 천장에 장착된 카메라는 매장 안을 돌아다니는 고객을 포착하고, 이 비디오 영상은 비전 모델에 의해 실시간으로 처리됩니다.
  • 객체 감지는 고객이 집어 들고 바구니에 넣는 정확한 제품을 감지하여 가상 카트를 그에 따라 업데이트하는 데 사용됩니다.
  • 선반의 무게 센서는 품목 제거 또는 교체를 감지하여 정확도를 향상시킵니다.
  • 고객이 매장을 나갈 때 객체 감지 및 얼굴 인식 기술을 사용하여 고객이 떠났는지 확인하고 신용 카드와 같은 결제 정보를 사용하여 자동으로 요금을 청구할 수 있습니다.

시맨틱 및 인스턴스 분할

시맨틱 분할 및 인스턴스 분할은 이미지를 의미 있는 세그먼트로 분할하는 데 도움이 되는 컴퓨터 비전 작업입니다. 시맨틱 분할은 픽셀을 의미론적 의미에 따라 분류하고 범주 내의 모든 객체를 동일한 레이블을 가진 단일 엔터티로 취급합니다. "하늘" 또는 "바다"와 같이 셀 수 없는 객체 또는 "잎" 또는 "잔디"와 같은 클러스터에 레이블을 지정하는 데 적합합니다.

반면에 인스턴스 분할은 감지된 각 객체에 고유한 레이블을 할당하여 동일한 클래스의 여러 인스턴스를 구별할 수 있습니다. 인스턴스 분할을 사용하여 객체의 수와 독립성이 중요한 셀 수 있는 객체를 분할할 수 있습니다. 이를 통해 보다 정확한 식별 및 차별화가 가능합니다.

Fig 4. 시맨틱 및 인스턴스 분할의 예.

자율 주행 자동차와 관련된 예를 통해 시맨틱 분할과 인스턴스 분할 간의 차이점을 더 명확하게 이해할 수 있습니다. 시맨틱 분할은 장면의 내용을 이해하는 데 필요한 작업에 적합하며 자율 주행 차량에서 횡단보도 및 교통 표지판과 같은 도로의 특징을 분류하는 데 사용할 수 있습니다. 한편, 인스턴스 분할은 자율 주행 차량에서 개별 보행자, 차량 및 장애물을 식별하는 데 사용할 수 있습니다. 

자세 추정

자세 추정은 이미지 또는 비디오에서 객체 자세의 주요 지점을 감지하고 추적하는 데 중점을 둔 컴퓨터 비전 작업입니다. 어깨와 무릎과 같은 영역을 포함하는 주요 지점을 사용하여 인간 자세 추정에 가장 일반적으로 사용됩니다. 인간의 자세를 추정하면 다양한 응용 분야에 중요한 행동과 움직임을 이해하고 인식하는 데 도움이 됩니다.

Fig 5. YOLOv8을 사용한 자세 추정의 예시입니다.

자세 추정은 스포츠에서 선수들의 움직임을 분석하는 데 사용될 수 있습니다. NBA에서는 자세 추정을 통해 경기 중 선수들의 움직임과 위치를 연구합니다. 어깨, 팔꿈치, 무릎, 발목과 같은 주요 지점을 추적함으로써 자세 추정은 선수 움직임에 대한 자세한 통찰력을 제공합니다. 이러한 통찰력은 코치가 더 나은 전략을 개발하고, 훈련 프로그램을 최적화하며, 경기 중 실시간으로 조정을 하는 데 도움이 됩니다. 또한 이 데이터는 선수 피로도와 부상 위험을 모니터링하여 전반적인 선수 건강과 경기력을 향상시키는 데 기여할 수 있습니다.

경사 바운딩 박스 객체 감지

경사 바운딩 박스 객체 감지(OBB)는 회전된 사각형을 사용하여 이미지에서 객체를 정확하게 식별하고 찾습니다. 이미지 축에 맞춰 정렬되는 표준 바운딩 박스와 달리 OBB는 객체의 방향에 맞게 회전합니다. 따라서 OBB는 완벽하게 수평 또는 수직이 아닌 객체에 특히 유용합니다. 혼잡한 환경에서 회전된 객체를 정확하게 찾아내고 분리하여 겹침을 방지하는 데 효과적입니다.

Fig 6. YOLOV8을 사용하여 촬영한 보트 항공 이미지에서 경사 바운딩 박스 감지의 예시입니다.

해상 감시에서 선박을 식별하고 추적하는 것은 보안 및 자원 관리에 매우 중요합니다. OBB 감지는 선박이 밀집되어 있거나 다양한 각도로 배치되어 있어도 선박의 정확한 위치 파악에 사용될 수 있습니다. OBB 감지는 항로를 모니터링하고, 해상 교통을 관리하며, 항만 운영을 최적화하는 데 도움이 됩니다. 또한 허리케인이나 기름 유출과 같은 사고 후 선박 및 인프라의 손상을 신속하게 식별하고 평가하여 재난 대응을 지원할 수 있습니다.

객체 추적

지금까지 이미지와 관련된 컴퓨터 비전 작업에 대해 논의했습니다. 객체 추적은 비디오 프레임 전체에서 객체를 추적할 수 있는 컴퓨터 비전 작업입니다. 객체 추적은 감지 알고리즘을 사용하여 첫 번째 프레임에서 객체를 식별한 다음 비디오를 통해 이동할 때 객체의 위치를 지속적으로 추적합니다. 객체 추적은 추적 정확도를 유지하기 위해 객체 감지, 특징 추출, 동작 예측과 같은 기술을 포함합니다.

Fig 7. YOLOv8을 사용하여 물고기를 추적합니다.

YOLOv8과 같은 비전 모델은 해양 생물학에서 물고기를 추적하는 데 사용될 수 있습니다. 연구자들은 수중 카메라를 사용하여 자연 서식지에서 물고기의 움직임과 행동을 모니터링할 수 있습니다. 이 프로세스는 첫 번째 프레임에서 개별 물고기를 감지한 다음 비디오 전체에서 해당 위치를 추적하는 것으로 시작됩니다. 물고기 추적은 과학자들이 이동 패턴, 사회적 행동 및 환경과의 상호 작용을 이해하는 데 도움이 됩니다. 또한 물고기 분포 및 풍부도에 대한 통찰력을 제공하여 지속 가능한 어업 관행을 지원합니다.

컴퓨터 비전에 대한 최종 검토

컴퓨터 비전은 우리가 기술을 사용하고 세상과 상호 작용하는 방식을 적극적으로 변화시키고 있습니다. 딥러닝 모델과 복잡한 알고리즘을 사용하여 이미지와 비디오를 이해함으로써 컴퓨터 비전은 산업 전반에서 많은 프로세스를 간소화하는 데 도움이 됩니다. 객체 감지 및 객체 추적과 같은 컴퓨터 비전 작업은 이전에는 상상할 수 없었던 솔루션을 만들 수 있게 해줍니다. 컴퓨터 비전 기술이 계속 발전함에 따라 미래에는 훨씬 더 혁신적인 응용 분야가 많이 있을 것입니다! 

함께 배우고 성장합시다! AI에 대한 기여를 보려면 GitHub 저장소를 탐색하세요. AI로 자율 주행차농업과 같은 산업을 어떻게 재정의하고 있는지 확인하세요. 🚀

함께 미래의 AI를 만들어 갑시다!

미래의 머신러닝 여정을 시작하세요

무료로 시작하기
클립보드에 링크가 복사되었습니다.