설명된 컴퓨터 비전 애플리케이션

컴퓨터 비전 모델의 역사를 살펴보면서 컴퓨터 비전이 어떻게 발전해 왔으며 오늘날의 고급 비전 모델에 이르는 경로를 살펴봤습니다. 다음과 같은 최신 모델 Ultralytics YOLOv8 과 같은 최신 모델은 여러 컴퓨터 비전 작업을 지원하며 다양하고 흥미로운 애플리케이션에 사용되고 있습니다.

이 글에서는 컴퓨터 비전과 비전 모델의 기본 사항을 살펴보겠습니다. 작동 방식과 다양한 산업 분야에서의 다양한 응용 분야를 다룰 것입니다. 컴퓨터 비전 혁신은 우리 주변 어디에나 있으며, 조용히 우리의 세계를 만들어가고 있습니다. 하나씩 알아봅시다!

컴퓨터 비전이란 무엇입니까?

인공 지능(AI)은 인간 지능의 일부를 복제하는 것을 목표로 하는 많은 기술을 포괄하는 포괄적인 용어입니다. AI의 한 분야는 컴퓨터 비전입니다. 컴퓨터 비전은 기계에게 주변 환경을 보고, 관찰하고, 이해할 수 있는 눈을 제공하는 데 중점을 둡니다.

컴퓨터 비전 솔루션은 인간의 시각과 마찬가지로 사물을 구별하고, 거리를 계산하고, 움직임을 detect 것을 목표로 합니다. 하지만 평생의 경험을 통해 보고 이해하는 인간과 달리 컴퓨터는 방대한 양의 데이터, 고화질 카메라, 복잡한 알고리즘에 의존합니다.

‍

컴퓨터 비전 시스템은 이미지 및 비디오와 같은 시각적 데이터를 놀라운 속도와 정확도로 처리하고 분석할 수 있습니다. 방대한 양의 시각 정보를 빠르고 정확하게 분석하는 능력은 컴퓨터 비전을 제조에서 의료에 이르기까지 다양한 산업 분야에서 강력한 도구로 만듭니다.

비전 모델은 다양한 컴퓨터 비전 작업을 지원합니다.

컴퓨터 비전 모델은 모든 컴퓨터 비전 애플리케이션의 핵심입니다. 기본적으로 기계가 시각 정보를 해석하고 이해할 수 있도록 설계된 딥 러닝 기술로 구동되는 계산 알고리즘입니다. 비전 모델은 이미지 분류에서 객체 감지에 이르기까지 중요한 컴퓨터 비전 작업을 가능하게 합니다. 이러한 작업과 사용 사례를 자세히 살펴보겠습니다.

이미지 분류

이미지 분류에는 이미지를 미리 정의된 클래스 또는 카테고리로 분류하고 레이블을 지정하는 작업이 포함됩니다. 다음과 같은 비전 모델은 YOLOv8 과 같은 비전 모델은 라벨이 지정된 이미지의 대규모 데이터 세트에서 학습할 수 있습니다. 훈련 과정에서 모델은 각 클래스와 관련된 패턴과 특징을 인식하는 방법을 학습합니다. 학습이 완료되면 새로운 이미지의 특징을 분석하고 학습된 패턴과 비교하여 보이지 않는 새로운 이미지의 카테고리를 예측할 수 있습니다.

‍

이미지 분류에는 다양한 유형이 있습니다. 예를 들어, 의료 이미지를 다룰 때는 이진 분류를 사용하여 사진을 건강 또는 질병과 같은 두 그룹으로 나눌 수 있습니다. 또 다른 유형은 다중 클래스 분류입니다. 돼지, 염소, 소 등 농장의 여러 동물을 분류하는 것처럼 이미지를 여러 그룹으로 classify 데 도움이 될 수 있습니다. 또는 동물을 포유류와 조류로 분류한 다음 사자, 호랑이, 독수리, 참새와 같은 종으로 분류하는 것처럼 동물을 그룹과 하위 그룹으로 classify 싶다면 계층적 분류가 가장 좋은 옵션이 될 수 있습니다.

객체 감지

객체 감지는 컴퓨터 비전을 사용하여 이미지 및 비디오 프레임에서 객체를 식별하고 위치를 파악하는 프로세스입니다. 객체 주위에 경계 상자를 그리는 객체 지역화와 각 객체의 범주를 식별하는 객체 분류의 두 가지 작업으로 구성됩니다. 경계 상자 주석을 기반으로 비전 모델은 각 객체 범주에 특정한 패턴과 특징을 인식하고 새로운 미지의 이미지에서 이러한 객체의 존재와 위치를 예측하는 방법을 학습할 수 있습니다.

‍

객체 감지는 스포츠에서 해양 생물학에 이르기까지 다양한 산업 분야에서 많은 활용 사례를 가지고 있습니다. 예를 들어 소매업에서 Amazon의 Just Walk Out 기술은 고객이 집어 든 품목을 식별하여 계산대를 자동화하기 위해 객체 감지를 사용합니다. 컴퓨터 비전과 센서 데이터의 조합을 통해 고객은 줄을 서서 기다리지 않고도 물건을 집어 나갈 수 있습니다.

작동 방식에 대한 자세한 내용은 다음과 같습니다.

천장에 장착된 카메라는 매장 안을 돌아다니는 고객을 포착하고, 이 비디오 영상은 비전 모델에 의해 실시간으로 처리됩니다.
‍
객체 감지는 고객이 장바구니에 담는 정확한 제품을 detect 그에 따라 가상 카트를 업데이트하는 데 사용됩니다.
↪f_200D↩
선반의 무게 센서는 품목 제거 또는 교체를 감지하여 정확도를 향상시킵니다.
‍
고객이 매장을 나갈 때 객체 감지 및 얼굴 인식 기술을 사용하여 고객이 떠났는지 확인하고 신용 카드와 같은 결제 정보를 사용하여 자동으로 요금을 청구할 수 있습니다.

시맨틱 및 인스턴스 분할

시맨틱 분할 및 인스턴스 분할은 이미지를 의미 있는 세그먼트로 분할하는 데 도움이 되는 컴퓨터 비전 작업입니다. 시맨틱 분할은 픽셀을 의미론적 의미에 따라 분류하고 범주 내의 모든 객체를 동일한 레이블을 가진 단일 엔터티로 취급합니다. "하늘" 또는 "바다"와 같이 셀 수 없는 객체 또는 "잎" 또는 "잔디"와 같은 클러스터에 레이블을 지정하는 데 적합합니다.

반면에 인스턴스 세분화는 감지된 각 개체에 고유한 레이블을 할당하여 동일한 클래스의 여러 인스턴스를 구분할 수 있습니다. 인스턴스 세분화를 사용하면 개체의 수와 독립성이 중요한 카운트 가능한 개체를 segment 수 있습니다. 이를 통해 보다 정확하게 식별하고 구분할 수 있습니다.

‍

자율주행차와 관련된 예를 통해 시맨틱 분할과 인스턴스 분할의 차이를 더 명확하게 이해할 수 있습니다. 시맨틱 세분화는 장면의 내용을 이해해야 하는 작업에 적합하며, 자율주행 차량에서 횡단보도나 교통 표지판과 같은 도로의 특징을 classify 데 사용할 수 있습니다. 한편 인스턴스 세분화는 자율주행 차량에서 개별 보행자, 차량, 장애물을 식별하는 데 사용할 수 있습니다.

자세 추정

자세 추정은 이미지 또는 비디오에서 객체 자세의 주요 지점을 감지하고 추적하는 데 중점을 둔 컴퓨터 비전 작업입니다. 어깨와 무릎과 같은 영역을 포함하는 주요 지점을 사용하여 인간 자세 추정에 가장 일반적으로 사용됩니다. 인간의 자세를 추정하면 다양한 응용 분야에 중요한 행동과 움직임을 이해하고 인식하는 데 도움이 됩니다.

‍

자세 추정은 스포츠에서 선수들의 움직임을 분석하는 데 사용될 수 있습니다. NBA에서는 자세 추정을 통해 경기 중 선수들의 움직임과 위치를 연구합니다. 어깨, 팔꿈치, 무릎, 발목과 같은 주요 지점을 추적함으로써 자세 추정은 선수 움직임에 대한 자세한 통찰력을 제공합니다. 이러한 통찰력은 코치가 더 나은 전략을 개발하고, 훈련 프로그램을 최적화하며, 경기 중 실시간으로 조정을 하는 데 도움이 됩니다. 또한 이 데이터는 선수 피로도와 부상 위험을 모니터링하여 전반적인 선수 건강과 경기력을 향상시키는 데 기여할 수 있습니다.

경사 바운딩 박스 객체 감지

경사 바운딩 박스 객체 감지(OBB)는 회전된 사각형을 사용하여 이미지에서 객체를 정확하게 식별하고 찾습니다. 이미지 축에 맞춰 정렬되는 표준 바운딩 박스와 달리 OBB는 객체의 방향에 맞게 회전합니다. 따라서 OBB는 완벽하게 수평 또는 수직이 아닌 객체에 특히 유용합니다. 혼잡한 환경에서 회전된 객체를 정확하게 찾아내고 분리하여 겹침을 방지하는 데 효과적입니다.

그림 6. YOLOV8 사용한 선박의 항공 이미지에서 방향성 바운딩 박스 감지 예시.

‍

해상 감시에서 선박을 식별하고 추적하는 것은 보안 및 자원 관리에 매우 중요합니다. OBB 감지는 선박이 밀집되어 있거나 다양한 각도로 배치되어 있어도 선박의 정확한 위치 파악에 사용될 수 있습니다. OBB 감지는 항로를 모니터링하고, 해상 교통을 관리하며, 항만 운영을 최적화하는 데 도움이 됩니다. 또한 허리케인이나 기름 유출과 같은 사고 후 선박 및 인프라의 손상을 신속하게 식별하고 평가하여 재난 대응을 지원할 수 있습니다.

객체 추적

지금까지 이미지를 처리하는 컴퓨터 비전 작업에 대해 설명했습니다. 객체 추적은 비디오 프레임 전체에서 객체를 track 수 있는 컴퓨터 비전 작업입니다. 감지 알고리즘을 사용하여 첫 번째 프레임에서 객체를 식별하는 것으로 시작하여 비디오에서 이동하는 객체의 위치를 지속적으로 따라갑니다. 객체 추적에는 객체 감지, 특징 추출, 모션 예측과 같은 기술이 포함되어 정확한 추적을 유지합니다.

‍

해양 생물학에서 물고기를track 데 YOLOv8 같은 비전 모델을 사용할 수 있습니다. 연구자들은 수중 카메라를 사용하여 자연 서식지에서 물고기의 움직임과 행동을 모니터링할 수 있습니다. 이 과정은 첫 번째 프레임에서 개별 물고기를 감지하는 것으로 시작하여 비디오 전체에서 물고기의 위치를 따라갑니다. 물고기를 추적하면 과학자들은 물고기의 이동 패턴, 사회적 행동, 환경과의 상호작용을 이해하는 데 도움이 됩니다. 또한 물고기의 분포와 풍부함에 대한 인사이트를 제공함으로써 지속 가능한 어업 관행을 지원합니다.

컴퓨터 비전에 대한 최종 검토

컴퓨터 비전은 우리가 기술을 사용하고 세상과 상호 작용하는 방식을 적극적으로 변화시키고 있습니다. 딥러닝 모델과 복잡한 알고리즘을 사용하여 이미지와 비디오를 이해함으로써 컴퓨터 비전은 산업 전반에서 많은 프로세스를 간소화하는 데 도움이 됩니다. 객체 감지 및 객체 추적과 같은 컴퓨터 비전 작업은 이전에는 상상할 수 없었던 솔루션을 만들 수 있게 해줍니다. 컴퓨터 비전 기술이 계속 발전함에 따라 미래에는 훨씬 더 혁신적인 응용 분야가 많이 있을 것입니다!

함께 배우고 성장합시다! AI에 대한 기여를 보려면 GitHub 저장소를 탐색하세요. AI로 자율 주행차 및 농업과 같은 산업을 어떻게 재정의하고 있는지 확인하세요. 🚀

컴퓨터 비전 애플리케이션 작동 방식 살펴보기

컴퓨터 비전이란 무엇입니까?

비전 모델은 다양한 컴퓨터 비전 작업을 지원합니다.

이미지 분류

객체 감지

시맨틱 및 인스턴스 분할

자세 추정

경사 바운딩 박스 객체 감지

객체 추적

컴퓨터 비전에 대한 최종 검토

이 카테고리에서 더 읽어보기

Ultralytics YOLO 활용한 AI 위협 탐지 기술 분석

Ultralytics 활용한 교통 사고 관리 자동화

Ultralytics 프로덕션 환경에 배포하기 더 쉬운 이유를 살펴봅니다!

함께 미래의 AI를 만들어 갑시다!