Yolo 비전 선전
선전
지금 참여하기

컴퓨터 비전 분야에서 지도 학습과 비지도 학습 비교 분석

컴퓨터 비전 분야에서 지도 학습과 비지도 학습의 차이점을 알아보고, 보유한 데이터와 프로젝트 목표에 맞는 적절한 접근 방식을 선택하는 방법을 배워보세요.

컴퓨터 비전 프로젝트를 Ultral Ultralytics로 확장하세요

시작하기

인공지능(AI)은 기계가 인간의 지능과 유사한 방식으로 학습하고 추론하도록 가르치는 핵심 개념을 바탕으로 합니다. 사람들이 직접적인 지도를 받거나 패턴과 경험을 관찰하는 등 다양한 방법을 통해 배우는 것과 마찬가지로, AI 및 기계 학습 시스템도 이러한 접근 방식을 따르도록 설계되었습니다.

특히 머신러닝 알고리즘의 경우, 시스템은 모든 작업에 대해 명시적으로 프로그래밍되는 대신 데이터를 통해 학습하도록 훈련됩니다. 머신러닝 모델은 고정된 규칙에 의존하는 대신 데이터 내의 패턴을 식별하고, 이러한 패턴을 활용하여 예측이나 결정을 내립니다.

예를 들어, 컴퓨터 비전은 AI와 머신러닝의 한 분야로, 시스템이 이미지나 동영상과 같은 시각적 정보를 해석하고 이해할 수 있도록 하는 데 중점을 둡니다. 사물 인식부터 방대한 데이터 세트 전반에 걸친 숨겨진 패턴 식별에 이르기까지, 이러한 시스템은 학습을 위해 어떻게 훈련되었는지에 크게 의존합니다.

사용 가능한 데이터의 유형과 해결하려는 문제에 따라, 이러한 시스템을 훈련하는 데 다양한 AI 학습 기법이 활용됩니다. 

일부 컴퓨터 비전 모델은 라벨이 지정된 데이터를 통해 학습하는데, 이때 각 입력에는 정답이 짝을 이루며, 즉 모든 이미지나 데이터 포인트에는 해당 데이터가 무엇을 나타내는지 모델에 알려주는 미리 정의된 라벨이 함께 제공됩니다. 이를 통해 모델은 입력과 예상 출력 간의 관계를 학습할 수 있으며, 결과적으로 이전에 본 적 없는 새로운 데이터에 대해 정확한 예측을 내리는 능력이 향상됩니다.

다른 비전 모델들은 미리 정의된 정답이 제공되지 않는 비표주 데이터로부터 학습하며, 대신 데이터 자체 내의 패턴과 관계를 파악하는 데 중점을 둡니다. 이러한 접근 방식은 각각 지도 학습과 비지도 학습으로 알려져 있으며, 수많은 최첨단 컴퓨터 비전 시스템의 기반을 이룹니다.

이 글에서는 지도 학습과 비지도 학습을 살펴보고, 이들이 컴퓨터 비전 분야에서 어떻게 활용되는지, 그리고 여러분의 비전 AI 프로젝트에 가장 적합한 접근 방식을 선택하는 방법을 알아보겠습니다. 그럼 시작해 볼까요!

AI 학습 방식이 컴퓨터 비전에 어떤 힘을 실어주는가

인공지능을 마치 우산과 같은 것으로 생각할 수 있습니다. 이는 기계가 일반적으로 인간의 지능이 필요한 작업을 수행할 수 있게 해주는 다양한 기술을 포괄하는 개념입니다. 이러한 광범위한 영역 안에서, 머신러닝은 시스템이 고정된 규칙에만 의존하는 대신 데이터를 통해 학습할 수 있게 해주는 핵심 분야입니다.

기계 학습 분야에서 다양한 학습 기법은 모델이 시간이 지남에 따라 어떻게 학습하고 개선되는지를 결정합니다. 지도 학습(정답이 표시된 라벨링된 데이터로부터 학습), 비지도 학습(라벨이 없는 데이터에서 패턴을 식별), 강화 학습(피드백이나 보상을 활용한 시행착오를 통해 학습), 반지도 학습(소량의 라벨링된 데이터와 대량의 라벨이 없는 데이터를 결합)과 같은 접근 방식은 시스템이 입력 데이터를 처리하고 출력 데이터를 생성하는 방식을 정의합니다.

그림 1. AI 학습 방법 개요 (출처)

특히, 컴퓨터 비전 시스템은 시각적 데이터를 해석하고 이해하기 위해 이러한 학습 기법을 활용하여 구축됩니다. 지도 학습은 모델이 명확하게 라벨이 지정된 예시를 통해 학습하고 정확하며 신뢰할 수 있는 결과를 도출할 수 있게 해주기 때문에 가장 널리 사용되는 방법입니다. 

예를 들어, 모델은 “고양이”와 “개”로 라벨링된 이미지를 통해 훈련되어 모양, 귀, 얼굴 구조와 같은 특징을 학습함으로써, 분류 알고리즘을 사용하여 classify 이미지를 정확하게 classify 수 있게 됩니다. 한편, 비지도 학습과 반지도 학습도 컴퓨터 비전 분야에서 활용되는데, 주로 데이터 내의 패턴을 탐색하거나 라벨링된 데이터가 부족한 상황에서 성능을 향상시키기 위해 사용됩니다.

컴퓨터 비전에서 지도 학습 모델의 활용에 관한 고찰

지도 학습 알고리즘은 교실 수업과 비교할 수 있습니다. 교실에서는 교사가 정답과 함께 예시를 제시하여 학생들이 무엇이 옳고 무엇이 틀린지를 배울 수 있게 합니다. 기계 학습에서도 모델은 각 입력에 알려진 출력이 대응되는 ‘라벨링된 데이터’를 사용하여 이와 유사한 방식으로 학습합니다.

예를 들어, 야구 경기 분석을 자동화하는 컴퓨터 비전 시스템을 구축하고 있다고 가정해 봅시다. 공, 배트, 선수와 같은 객체에 라벨이 지정된 이미지나 영상 프레임을 사용하여 Ultralytics 같은 모델을 훈련시킬 수 있습니다. 

각 물체에는 위치와 범주가 표시되어 모델이 무엇을 찾아야 하는지 학습할 수 있게 됩니다. 시간이 지남에 따라 모델은 새로운 영상에서 이러한 물체를 detect 위치를 파악할 수 있게 detect , 프레임 간 공 추적 및 선수 감지 같은 활용 사례를 지원합니다.

그림 2. 지도 학습을 통해 구현된 물체 탐지 예시 (출처)

물체 탐지를 넘어, 지도 학습은 정확도와 일관성이 중요한 이미지 분류, 인스턴스 분할, 자세 추정 등 다양한 컴퓨터 비전 작업에 널리 활용됩니다. 이러한 각 작업에서 모델은 라벨이 지정된 데이터를 통해 학습하여 특정 패턴을 식별하고, 새로운 입력에 대해 신뢰할 수 있는 예측을 수행합니다.

이러한 모델은 일반적으로 딥러닝을 통해 구축되는데, 딥러닝은 신경망을 활용해 데이터에서 직접 패턴을 학습하는 기계 학습의 한 유형입니다. 신경망은 인간의 뇌 작동 방식에서 영감을 받아 정보를 처리하도록 설계되어 있어, 모델이 방대한 데이터 세트로부터 복잡한 시각적 특징을 학습할 수 있게 해줍니다.

초기의 컴퓨터 비전 접근 방식은 주로 수동으로 설계된 특징을 서포트 벡터 머신(SVM, 범주 간 최적의 경계를 찾아 classify 모델)이나 의사결정 트리(데이터를 여러 가지로 분할하여 결정을 내리는 모델)와 같은 알고리즘과 결합하는 방식에 의존하곤 했다. 

반면, 오늘날의 컴퓨터 비전 모델은 딥러닝을 활용해 데이터로부터 이러한 특징을 자동으로 학습하므로, 대규모의 매우 세밀한 시각적 작업을 처리하는 데 더 효과적이다.

비전 AI에서 비지도 학습 모델의 필요성 이해하기

감독 학습이 컴퓨터 비전 분야에서 가장 널리 사용되는 접근 방식이지만, 라벨링된 데이터를 구할 수 없거나 데이터를 생성하는 데 비용이 너무 많이 들고 시간이 오래 걸리는 특정 비전 응용 분야도 있습니다. 

이러한 경우, 비지도 학습 알고리즘이 유용한 대안이 될 수 있습니다. 예를 들어, 야생동물 감시 카메라에서 촬영된 라벨이 지정되지 않은 사진이 대량으로 있다고 가정해 봅시다. 

각 이미지에 무엇이 담겨 있는지 알려주는 라벨은 없지만, 데이터를 정리하거나 이해하고 싶을 때가 있습니다. 비지도 학습 모델은 정확한 라벨을 알지 못하더라도 이러한 이미지를 분석하여 유사한 이미지들을 한데 묶고, 겉모습이 비슷한 동물들을 클러스터로 분류할 수 있습니다.

컴퓨터 비전에서 비지도 학습의 작동 원리

그렇다면 비지도 학습은 어떻게 작동할까요? 이 모델은 정답을 통해 학습하는 대신, 데이터 내의 패턴과 구조를 스스로 파악하여 학습합니다. 라벨이 지정된 예시에 의존하지 않고 데이터 전반에 걸쳐 유사점과 차이점을 찾아냅니다.

흔히 볼 수 있는 활용 사례로는 이상 탐지가 있는데, 이 경우 모델은 정상 데이터의 패턴을 학습한 뒤 이를 벗어난 요소를 식별합니다. 이상치 및 아웃라이어 탐지는 산업 분야에서 가장 영향력 있는 응용 분야 중 하나입니다. 예를 들어, 제조 라인에서 불량품을 발견하거나, 비정상적인 의료 영상 결과를 방사선과 전문의가 검토하도록 표시하거나, 감시 카메라 영상에서 의심스러운 활동을 탐지하는 것이 있습니다. 결함이나 이상 현상은 흔히 드물고 다양하기 때문에 가능한 모든 사례에 라벨을 붙이는 것은 비현실적이며, 따라서 비지도 학습 방식이 자연스럽게 적합합니다.

이를 지원하기 위해 클러스터링이나 차원 축소와 같은 기법이 자주 사용되며, 일반적으로 원본 이미지 자체보다는 이미지에서 추출된 특징을 대상으로 합니다. k-평균 클러스터링과 같은 클러스터링 기법은 공통된 패턴을 바탕으로 유사한 이미지들을 한데 묶는 반면, 주성분 분석(PCA)과 같은 차원 축소 기법은 가장 중요한 특징에 집중함으로써 데이터를 단순화합니다. 

이를 통해 모델은 방대하고 복잡한 데이터 세트 내에서 의미 있는 패턴과 구조를 더 쉽게 식별할 수 있습니다. 비지도 학습의 주요 장점은 라벨이 지정되지 않은 데이터에서도 효과적으로 작동하며, 한눈에 파악하기 어려운 패턴을 발견할 수 있다는 점입니다. 그러나 지도 학습에 비해 성능을 평가하기가 더 어렵고, 최종 결과에 대한 통제력도 상대적으로 낮습니다.

컴퓨터 비전 분야의 자율 학습 및 반감독 학습

지도 학습과 비지도 학습을 탐구하다 보면, 이 둘 사이에 중간 지대가 있는지 궁금해질 수 있습니다. 흥미롭게도, 자기 지도 학습과 반지도 학습은 지도 학습과 비지도 학습 사이의 간극을 메워줍니다.

이러한 접근 방식은 모델이 라벨이 지정되지 않은 데이터로부터 더 효과적으로 학습할 수 있게 해줍니다. 라벨이 지정된 예시만 의존하는 대신, 모델은 데이터로부터 자체적인 학습 과제를 생성하거나, 소규모의 라벨링된 데이터셋을 대규모의 라벨링되지 않은 데이터셋과 결합합니다.

자가 지도 학습에서 모델은 데이터 자체를 바탕으로 생성된 과제를 해결하며 학습합니다. 예를 들어, 일부가 누락된 이미지를 입력받으면 그 빈 공간을 무엇으로 채워야 할지 예측하는 법을 배우거나, 동일한 물체의 다양한 각도를 인식하는 법을 배울 수 있습니다. 이를 통해 모델은 수동으로 라벨을 지정할 필요 없이 유용한 특징을 학습할 수 있습니다.

반면, 반감독 학습에서는 소량의 라벨링된 데이터와 대량의 라벨링되지 않은 데이터를 함께 사용하여 성능을 향상시킵니다. 경우에 따라 모델이 라벨링되지 않은 데이터에 대한 라벨을 생성하고, 이를 활용하여 학습을 계속할 수도 있습니다.

이러한 접근 방식의 주요 장점은 구축하는 데 비용과 시간이 많이 드는 대규모 라벨링 데이터 세트에 대한 의존도를 낮춘다는 점입니다. 하지만 완전 지도 학습 방식에 비해 설계 및 평가 과정이 더 복잡할 수 있습니다.

지도 학습과 비지도 학습의 주요 차이점

지도 학습과 비지도 학습의 차이는 모델이 학습하는 방식과 달성하고자 하는 목표에 있습니다. 지도 학습은 라벨이 지정된 데이터와 명확한 지침을 바탕으로 특정 작업을 학습하는 반면, 비지도 학습은 미리 정해진 정답 없이 작동하며 데이터 내의 패턴과 구조를 발견하는 데 중점을 둡니다.

예를 들어, 교통 모니터링 시스템에서 지도 학습 모델은 라벨이 지정된 이미지를 통해 훈련되어 detect , 보행자 또는 신호등을 detect 수 있습니다. 반면, 비지도 학습 모델은 무엇을 찾아야 하는지 명시적으로 지시받지 않은 상태에서도 대량의 영상 자료를 분석하여 유사한 교통 패턴을 분류하거나, 예기치 않은 정체나 비정상적인 이동과 같은 이례적인 사건을 식별할 수 있습니다.

컴퓨터 비전에서 지도 학습을 언제 사용해야 하는가

지도 학습은 목표가 명확하게 정의되어 있고, 모델이 입력 데이터를 정확한 결과로 매핑해야 하는 컴퓨터 비전 작업에 매우 적합한 방법입니다. 특히 신뢰할 수 있는 라벨링된 데이터셋이 있고, 일관되고 예측 가능한 결과가 필요한 경우에 효과적입니다.

그림 3. 지도 학습을 기반으로 하는 컴퓨터 비전 과제 (출처)

이는 모델이 알려진 범주를 구분하거나 특정 결과를 예측해야 하는 문제에 흔히 사용됩니다. 패턴을 탐색하기보다는 라벨이 지정된 데이터로부터 정확한 관계를 학습하는 데 중점을 두기 때문에, 모델을 원하는 결과로 유도하기가 더 쉬워집니다.

또 다른 주요 장점은 제어성입니다. 지도 학습을 사용하면 명확한 지표를 통해 성능을 측정하고, 모델을 미세 조정하며, 배포 과정에서 안정적인 동작을 보장하기가 더 쉽습니다. 따라서 시간이 지나도 일관성과 신뢰성이 요구되는 시스템에 이상적입니다.

하지만 여기에는 대가가 따릅니다. 이 모델은 라벨이 지정된 데이터의 품질과 규모에 크게 의존하며, 이러한 데이터를 수집하고 라벨을 붙이는 작업은 상당한 시간이 소요될 수 있습니다.

지도 학습 기반 컴퓨터 비전의 실제 사례

Ultralytics YOLO 같은 비전 AI 모델은 지도 학습을 활용하여, 특히 실시간 애플리케이션에서 물체 탐지 등의 작업을 높은 정확도로 수행합니다. 다음은 지도 학습이 큰 효과를 발휘하는 대표적인 실제 비전 활용 사례입니다:

  • 의료 및 의료 영상: 의사들은 X선이나 MRI와 같이 라벨이 지정된 영상 데이터로 학습된 컴퓨터 비전 시스템을 활용할 수 있습니다. 이 시스템에서는 분류기를 사용하여 종양이나 골절과 같은 질환을 식별함으로써, 더 빠르고 정확한 진단을 돕습니다.
  • 산업용 품질 검사: 제조 환경에서, 라벨링된 데이터로 학습된 비전 시스템은 형상, 표면 결함, 질감, 크기 등 품질과 관련된 다양한 특징을 분석하여 제품을 검사할 수 있습니다. 이 시스템은 정상 제품과 불량 제품의 사례를 모두 학습함으로써 결함을 일관되게 식별하고 생산 기준을 유지할 수 있습니다.
  • 자율주행: 자율주행 시스템은 라벨이 지정된 주행 데이터로 학습된 모델을 기반으로 차선, 차량, 보행자 및 교통 표지판을 인식하여 차량이 실시간으로 안전하게 주행할 수 있도록 돕습니다.
  • 소매 및 결제 시스템: 매장은 라벨이 부착된 제품 이미지로 학습된 모델을 활용해 진열대나 계산대에서 상품을 식별함으로써, 자동 결제 및 보다 효율적인 재고 관리를 가능하게 합니다. 또한 이러한 시스템은 추가 데이터와 결합될 경우 고객 세분화 같은 작업을 지원하여, 기업이 쇼핑 패턴을 더 잘 파악할 수 있도록 돕습니다.
  • 농업 및 작물 모니터링: 농가는 라벨이 지정된 이미지로 학습된 모델을 활용해 classify detect classify 수 있습니다. 예를 들어, 건강한 감자와 손상된 감자를 식별하고 계수함으로써 품질 관리를 개선하고 손실을 줄일 수 있습니다.
그림 4. YOLO 활용한 정상 및 불량 감자 detect 계수

비지도 학습은 컴퓨터 비전 분야에서 어떤 종류의 문제를 해결할 수 있는가

비지도 학습은 라벨이 지정된 데이터가 충분하지 않거나 데이터에 명확한 정답이 없는 경우에 유용합니다. 이러한 상황에서는 정확한 예측을 하는 것이 아니라, 데이터 내의 패턴과 구조를 파악하는 것이 목표입니다.

이는 라벨이 지정되지 않은 데이터셋을 처음 탐색할 때 자주 사용됩니다. 모델에게 무엇을 찾아야 하는지 지시하는 대신, 모델이 스스로 유사점을 파악하고 관련 이미지를 그룹화하거나 특이한 패턴을 찾아내도록 하는 방식입니다.

대규모 이미지 컬렉션에서 비지도 학습 방식은 유사한 이미지들을 한데 묶거나 추가적인 검토가 필요한 이상치를 식별하는 데 도움이 될 수 있습니다. 따라서 이는 데이터 과학 프로젝트의 유용한 출발점이 됩니다.

GAN, 변분 자동 인코더(VAE), 확산 모델 등을 포함한 생성 모델은 이미지의 기본 분포를 학습하여 완전히 새로운 이미지를 생성합니다. 이러한 모델은 이미지 합성, 인페인팅, 초고해상도 복원, 스타일 변환과 같은 응용 분야의 핵심 기술로 활용되며, 오늘날 생성형 AI 시스템의 근간을 이루고 있습니다.

비지도 분할: 일부 방법은 레이블이 지정된 마스크에 의존하지 않고 픽셀이나 영역을 일관성 있는 세그먼트로 묶는데, 이는 주석 달기에 드는 비용이 너무 많이 들거나, 미리 정의된 범주와 일치시키는 것보다 구조를 발견하는 것이 목표일 때 유용합니다.

비지도 학습은 라벨링 작업이 시간이 많이 걸리거나 현실적으로 어려운 대규모 데이터셋을 다룰 때도 효과적입니다. 이러한 경우, 비지도 학습을 통해 라벨이 지정된 훈련 데이터에 의존하지 않고도 데이터로부터 유용한 통찰력을 얻을 수 있습니다. 

또한 생성형 AI(이미지, 텍스트, 오디오와 같은 새로운 데이터를 생성하는 모델)나 표현 학습(원시 데이터에서 유용한 특징이나 패턴을 학습하는 모델)과 같이, 모델이 방대한 양의 데이터로부터 일반적인 특징을 학습하는 분야에서도 흔히 사용됩니다. 전반적으로, 탐구, 패턴 발견, 또는 라벨이 없는 데이터 처리가 필요한 문제라면, 비지도 학습은 유연하고 실용적인 접근 방식입니다.

컴퓨터 비전 분야에서 비지도 학습의 실제 사례

다음은 컴퓨터 비전 분야에서 비지도 학습이 적용되는 몇 가지 사용 사례입니다:

  • 제조 분야의 이상 탐지: 모델은 정상적인 제품의 모습을 학습할 수 있으며, 모든 가능한 결함에 대한 라벨링된 예시가 없더라도 결함이나 이상 징후를 식별할 수 있습니다.
  • 이미지 정리 및 검색: 사진 라이브러리나 전자상거래 카탈로그와 같은 방대한 이미지 컬렉션을 시각적 유사성에 따라 자동으로 그룹화할 수 있어, 데이터 과학자들이 대규모 데이터셋을 정리하고 탐색하며 검색하는 작업을 보다 수월하게 수행할 수 있습니다.
  • 감시 및 보안: 시스템은 라벨이 지정된 사건에 대해 명시적으로 학습하지 않아도, 영상 자료를 분석하여 예기치 않은 움직임이나 군중의 변화와 같은 비정상적인 패턴이나 행동을 식별할 수 있습니다.
  • 전처리 및 데이터 탐색: 비지도 학습 기법은 지도 학습 모델을 훈련하기 전에 원시 이미지 데이터를 탐색하고 구조화하는 데 자주 사용되며, 이를 통해 데이터 품질을 향상시키고 수작업 부담을 줄이는 데 도움이 됩니다. 

지도 학습과 비지도 학습의 실질적인 한계

두 학습 방식 모두 장점이 있지만, 고려해야 할 몇 가지 한계점도 있습니다. 컴퓨터 비전 모델을 구축할 때 염두에 두어야 할 몇 가지 실질적인 요소는 다음과 같습니다:

  • 지도 학습 모델에서의 과적합: 지도 학습에서 모델은 일반적인 패턴을 학습하기보다는 훈련 데이터에 지나치게 의존하여 학습할 수 있습니다. 이는 데이터셋이 작거나 다양성이 부족할 때 흔히 발생합니다. 예를 들어, 특정 유형의 제품 detect 훈련된 모델은 제품이 약간 다르거나 조명 조건이 다른 새로운 데이터로 테스트할 때 제대로 작동하지 않을 수 있습니다.
  • 클러스터링 알고리즘의 한계: 비지도 학습에서 모델은 유사한 데이터 포인트를 한데 묶을 수 있습니다. 하지만 데이터에 노이즈가 있거나, 일관성이 없거나, 명확한 구조가 없을 경우 이러한 분류가 제대로 이루어지지 않을 수 있습니다. 예를 들어, 이미지 그룹화 작업에서 색상은 비슷하지만 대상물이 다른 이미지들이 잘못 묶일 수 있습니다.
  • 적절한 전처리 작업의 중요성: 모델 훈련에 앞서 데이터를 정리하고 준비해야 합니다. 이는 일반적으로 이미지 처리 및 데이터 변환을 지원하는 Python 사용하여 수행됩니다. 특히 이미지의 크기, 화질, 조명 조건이 다양할 수 있는 컴퓨터 비전 분야에서는 이 과정이 매우 중요합니다. 적절한 전처리 작업이 이루어지지 않으면 모델이 의미 있는 패턴 대신 노이즈를 학습하게 되어 성능 저하를 초래할 수 있습니다.

주요 내용

컴퓨터 비전 분야에서는 지도 학습과 비지도 학습 모두 중요한 역할을 합니다. 어떤 접근 방식을 선택해야 할지는 보유한 데이터의 유형(라벨이 지정되었는지 여부), 해결하려는 문제, 그리고 배포 요구 사항에 따라 달라집니다. 

높은 정확도와 명확하게 정의된 결과를 목표로 한다면, 지도 학습이 더 나은 선택인 경우가 많습니다. 데이터를 탐색하거나 레이블이 없는 데이터를 다루는 경우에는 비지도 학습이 더 적합할 수 있습니다.

AI에 대해 더 자세히 알고 싶으십니까? 커뮤니티GitHub 저장소를 확인하십시오. 솔루션 페이지에서 로보틱스 분야의 AI농업 분야의 컴퓨터 비전에 대해 알아보십시오. 라이선스 옵션을 살펴보고 오늘 컴퓨터 비전으로 개발을 시작하십시오! 

함께 AI의 미래를 만들어 갑시다!

미래의 머신러닝 여정을 시작하세요