비전 AI

컴퓨터 비전에 사용되는 AI 학습 기술 유형

지도 학습부터 전이 학습까지, 컴퓨터 비전 애플리케이션에 사용되는 다양한 머신 러닝 및 딥러닝 기술 유형을 탐색해 보세요.

ABAbirami Vina

4 min readNovember 6, 2024

머신 러닝은 컴퓨터가 각 작업에 대해 세부적인 프로그래밍 없이도 데이터를 통해 학습하여 스스로 의사결정을 내릴 수 있도록 돕는 인공지능(AI)의 한 유형입니다. 머신 러닝은 데이터에서 패턴을 식별할 수 있는 알고리즘 모델을 생성하는 과정을 포함합니다. 데이터 내의 패턴을 식별하고 이를 학습함으로써 알고리즘은 시간이 지남에 따라 점진적으로 성능을 개선할 수 있습니다.

머신 러닝이 중요한 역할을 하는 분야 중 하나는 컴퓨터 비전으로, 이는 시각적 데이터에 초점을 맞추는 AI의 한 영역입니다. 컴퓨터 비전은 머신 러닝을 활용하여 컴퓨터가 이미지와 비디오 내의 패턴을 감지하고 인식하도록 돕습니다. 머신 러닝의 발전으로 인해 컴퓨터 비전의 글로벌 시장 가치는 2032년까지 약 1,757억 2천만 달러에 이를 것으로 추정됩니다.

이 글에서는 지도 학습, 비지도 학습, 강화 학습, 전이 학습을 포함하여 컴퓨터 비전에 사용되는 다양한 머신러닝 유형을 살펴보고, 각각이 어떻게 다양한 응용 분야에서 역할을 하는지 알아보겠습니다. 시작해 보겠습니다!

Link to this section컴퓨터 비전 내 머신러닝 개요#

Computer vision relies on machine learning, especially techniques like deep learning and neural networks, to interpret and analyze visual information. These methods make it possible for computers to perform computer vision tasks such as detecting objects in images, classifying images by category, and recognizing faces. Machine learning is also essential for real-time computer vision applications like quality control in manufacturing and medical imaging in healthcare. In these cases, neural networks help computers interpret complex visual data, such as analyzing brain scans to detect tumors.

실제로 Ultralytics YOLO11과 같은 많은 고급 컴퓨터 비전 모델은 신경망을 기반으로 구축되었습니다.

Ultralytics YOLO11을 사용한 뇌 스캔 세그멘테이션

그림 1. Ultralytics YOLO11을 사용한 뇌 스캔 세분화.

지도 학습, 비지도 학습, 전이 학습, 강화 학습과 같이 컴퓨터 비전의 가능성을 넓히고 있는 머신러닝에는 여러 가지 학습 방법이 있습니다. 다음 섹션에서는 각 유형을 살펴보고 컴퓨터 비전에 어떻게 기여하는지 알아보겠습니다.

Link to this section지도 학습 탐구#

Supervised learning is the most commonly used type of machine learning. In supervised learning, models are trained using labeled data. Each input is tagged with the correct output, which helps the model learn. Similar to a student learning from a teacher, this labeled data acts as a guide or supervisor.

학습 중에 모델은 입력 데이터(처리해야 할 정보)와 출력 데이터(정답)를 모두 제공받습니다. 이러한 설정은 모델이 입력과 출력 간의 연결을 학습하는 데 도움이 됩니다. 지도 학습의 주된 목표는 모델이 각 입력을 올바른 출력에 정확하게 연결하는 규칙이나 패턴을 발견하는 것입니다. 이러한 매핑을 통해 모델은 새로운 데이터를 만났을 때 정확한 예측을 할 수 있습니다. 예를 들어, 컴퓨터 비전에서의 얼굴 인식은 학습된 패턴을 기반으로 얼굴을 식별하기 위해 지도 학습에 의존합니다.

이에 대한 일반적인 사용 사례는 얼굴 인식으로 스마트폰 잠금을 해제하는 것입니다. 모델은 사용자의 얼굴이 레이블 지정된 이미지로 학습되므로, 휴대폰 잠금을 해제할 때 실시간 이미지를 학습된 정보와 비교합니다. 일치하는 항목이 감지되면 휴대폰 잠금이 해제됩니다.

스마트폰 잠금 해제에 사용되는 얼굴 인식

그림 2. 얼굴 인식은 스마트폰 잠금을 해제하는 데 사용할 수 있습니다.

Link to this sectionAI에서 비지도 학습은 어떻게 작동할까요?#

비지도 학습은 레이블이 없는 데이터를 사용하는 머신러닝 유형으로, 학습 중에 모델에 어떠한 지침이나 정답도 제공되지 않습니다. 대신, 스스로 패턴과 통찰력을 발견하는 법을 배웁니다.

비지도 학습은 다음 세 가지 주요 방법을 사용하여 패턴을 식별합니다:

클러스터링: 유사한 데이터 포인트를 그룹화합니다. 이는 고객 세분화와 같은 작업에 유용하며, 유사한 고객을 행동이나 속성에 따라 그룹화할 수 있습니다.
연관 규칙(Association): 항목 간의 관계를 식별하는 데 사용되며, 데이터 내의 연결 고리를 밝혀내는 데 도움이 됩니다(예: 장바구니 분석에서 자주 함께 구매되는 제품 찾기).
차원 축소: 중복된 특성을 제거하여 데이터 세트를 단순화하며, 이는 시각화 및 처리에 도움이 됩니다.

비지도 학습의 핵심 응용 분야는 이미지 압축으로, k-평균 클러스터링과 같은 기법이 시각적 품질에 영향을 주지 않으면서 이미지 크기를 줄입니다. 픽셀은 클러스터로 그룹화되고 각 클러스터는 평균 색상으로 표현되어 더 적은 색상과 더 작은 파일 크기를 가진 이미지가 생성됩니다.

비지도 이미지 압축의 예

그림 3. 비지도 이미지 압축의 예시.

그러나 비지도 학습은 몇 가지 한계에 직면해 있습니다. 미리 정의된 답변이 없기 때문에 정확도나 성능 평가에 어려움을 겪을 수 있습니다. 또한 결과를 해석하고 그룹에 레이블을 지정하기 위해 수동 작업이 필요한 경우가 많으며, 결측값이나 노이즈와 같은 문제에 민감하여 결과의 품질에 영향을 줄 수 있습니다.

Link to this section강화 학습 설명#

지도 학습 및 비지도 학습과 달리 강화 학습은 학습 데이터에 의존하지 않습니다. 대신 신경망 에이전트를 사용하여 환경과 상호 작용함으로써 특정 목표를 달성합니다.

이 과정은 세 가지 주요 구성 요소를 포함합니다:

에이전트: 학습자 또는 의사 결정자.
환경: 에이전트가 상호 작용하는 모든 것으로, 실제 환경일 수도 있고 가상 환경일 수도 있습니다.
보상 신호: 각 행동 후에 제공되는 수치 값으로, 에이전트가 목표를 향해 나아가도록 유도합니다.

에이전트가 행동을 취하면 환경에 영향을 미치고, 환경은 피드백으로 반응합니다. 이 피드백은 에이전트가 자신의 선택을 평가하고 행동을 조정하는 데 도움이 됩니다. 보상 신호는 어떤 행동이 목표 달성에 더 가까워지는지 에이전트가 이해하도록 돕습니다.

강화 학습은 자율 주행 및 로봇 공학과 같은 사례에 중요합니다. 자율 주행 분야에서 차량 제어, 객체 감지 및 회피와 같은 작업은 피드백을 기반으로 학습합니다. 모델은 신경망 에이전트를 사용하여 보행자나 다른 객체를 감지하고 충돌 방지를 위해 적절한 조치를 취하도록 학습됩니다. 마찬가지로 로봇 공학에서도 강화 학습은 객체 조작 및 동작 제어와 같은 작업을 가능하게 합니다.

A great example of reinforcement learning in action is a project by OpenAI, where researchers trained AI agents to play the popular multiplayer video game, Dota 2. Using neural networks, these agents processed huge amounts of information from the game environment to make quick, strategic decisions. Through continuous feedback, the agents learned and improved over time, eventually reaching a skill level high enough to beat some of the game’s top players.

Dota 매트릭스에 대한 인간과 AI의 해석 비교

그림 4. Dota Matrix에 대한 인간과 AI의 해석.

Link to this section전이 학습의 기초 이해#

Transfer learning is different from other types of learning. Instead of training a model from scratch, it uses a pre-trained model on a large dataset and fine-tunes it for a new, but related, task. The knowledge gained during the initial training is used to improve the performance of the new task. Transfer learning reduces the time required to train for a new task, depending on its complexity. It works by retaining the initial layers of the model that capture the general features and replacing the final layers with that of the new specific task.

예술적 스타일 전이는 컴퓨터 비전에서 전이 학습의 흥미로운 응용 분야입니다. 이 기법을 사용하면 모델이 이미지를 변환하여 다양한 예술 작품의 스타일과 일치시킬 수 있습니다. 이를 달성하기 위해, 먼저 신경망을 예술적 스타일과 결합된 대규모 이미지 데이터 세트로 학습시킵니다. 이 과정을 통해 모델은 일반적인 이미지 특징과 스타일 패턴을 식별하는 법을 배웁니다.

모델이 학습되면 미세 조정을 통해 특정 그림의 스타일을 새 이미지에 적용할 수 있습니다. 네트워크는 학습된 스타일 특징을 보존하면서 새 이미지에 적응하여, 원본 콘텐츠와 선택한 예술적 스타일을 결합한 독특한 결과를 생성합니다. 예를 들어, 산맥 사진을 찍고 에드바르 뭉크의 절규 스타일을 적용하면 장면은 그대로 유지되면서 그림의 대담하고 표현력이 풍부한 스타일을 입힌 이미지를 얻을 수 있습니다.

전이 학습을 사용한 예술적 스타일 전이 예시

그림 5. 전이 학습을 사용한 예술적 스타일 전이의 예시.

Link to this section머신러닝 유형 간의 차이점 살펴보기#

이제 주요 머신러닝 유형을 다루었으니, 각 유형을 자세히 살펴보고 다양한 응용 분야에 가장 적합한 것을 이해해 보겠습니다.

지도 학습: 레이블이 지정된 데이터로 작업할 때 매우 정확하지만 많은 양의 데이터가 필요하며 노이즈에 민감할 수 있습니다.
비지도 학습: 숨겨진 패턴을 찾기 위해 레이블이 없는 데이터를 탐색하는 데 유용하지만, 결과가 덜 정확하고 해석하기 어려울 수 있습니다.
강화 학습: 복잡한 환경에서 단계별 결정을 내리도록 에이전트를 학습시키지만, 종종 상당한 컴퓨팅 성능이 필요합니다.
전이 학습: 이 접근 방식은 사전 학습된 모델을 사용하여 학습 속도를 높이고 새로운 작업에 대한 성능을 향상시키며, 특히 데이터가 제한적일 때 유용합니다.

모든 머신 러닝 유형 비교

그림 6. 모든 머신러닝 유형 비교. 이미지 제공: 저자.

올바른 머신러닝 유형을 선택하는 것은 여러 요소에 달려 있습니다. 풍부한 레이블 데이터와 명확한 작업이 있다면 지도 학습이 효과적입니다. 비지도 학습은 데이터 탐색이나 레이블 예제가 부족할 때 유용합니다. 강화 학습은 단계별 의사 결정이 필요한 복잡한 작업에 이상적이며, 전이 학습은 데이터가 제한적이거나 리소스가 제약적일 때 좋습니다. 이러한 요소를 고려하여 컴퓨터 비전 프로젝트에 가장 적합한 접근 방식을 선택할 수 있습니다.

Link to this section마무리하며#

머신러닝 기법은 특히 컴퓨터 비전과 같은 영역에서 다양한 과제를 해결할 수 있습니다. 지도 학습, 비지도 학습, 강화 학습, 전이 학습의 여러 유형을 이해함으로써 필요에 가장 적합한 접근 방식을 선택할 수 있습니다.

지도 학습은 높은 정확도와 레이블 데이터가 필요한 작업에 적합하며, 비지도 학습은 레이블이 없는 데이터에서 패턴을 찾는 데 이상적입니다. 강화 학습은 복잡하고 결정 기반인 설정에서 잘 작동하며, 전이 학습은 제한된 데이터로 사전 학습된 모델을 활용하고 싶을 때 도움이 됩니다.

각 방법은 얼굴 인식부터 로봇 공학, 예술적 스타일 전이에 이르기까지 고유한 강점과 응용 분야를 가지고 있습니다. 올바른 유형을 선택하면 헬스케어, 자동차, 엔터테인먼트와 같은 산업 전반에서 새로운 가능성을 열 수 있습니다.

더 많은 정보를 보려면 GitHub 저장소를 방문하고 커뮤니티에 참여하세요. 당사 솔루션 페이지에서 자율주행 자동차 및 농업 분야의 AI 활용 사례를 확인해 보세요. 🚀

Explore solutions

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

컴퓨터 비전에 사용되는 AI 학습 기술 유형

Link to this section컴퓨터 비전 내 머신러닝 개요#

Link to this section지도 학습 탐구#

Link to this sectionAI에서 비지도 학습은 어떻게 작동할까요?#

Link to this section강화 학습 설명#

Link to this section전이 학습의 기초 이해#

Link to this section머신러닝 유형 간의 차이점 살펴보기#

Link to this section마무리하며#

Explore solutions

로봇 공학에서의 AI

물류 분야의 AI

소매업에서의 AI

의료 분야의 AI

제조 분야의 AI

자동차 분야의 AI

농업 분야의 AI

로봇 공학에서의 AI

물류 분야의 AI

소매업에서의 AI

의료 분야의 AI

제조 분야의 AI

자동차 분야의 AI

농업 분야의 AI

로봇 공학에서의 AI

물류 분야의 AI

소매업에서의 AI

의료 분야의 AI

제조 분야의 AI

자동차 분야의 AI

농업 분야의 AI

미래의 AI를 함께 구축합시다!