Unsupervised Learning

비지도 학습을 통해 라벨링되지 않은 데이터의 숨겨진 패턴을 발견하는 방법을 살펴보세요. 클러스터링, 이상 탐지, 그리고 이것이 현대 AI 솔루션을 어떻게 구동하는지 배우세요.

비지도 학습은 알고리즘이 인간의 개입 없이 태그가 지정되지 않은 데이터에서 패턴을 학습하는 머신 러닝의 한 유형입니다. 모델을 학습시키기 위해 레이블이 지정된 입력-출력 쌍에 의존하는 지도 학습과 달리, 비지도 학습은 과거 레이블이 없는 데이터를 다룹니다. 시스템은 본질적으로 입력 데이터 내에서 숨겨진 구조, 패턴 또는 관계를 발견함으로써 스스로 학습을 시도합니다. 오늘날 생성되는 이미지, 비디오, 텍스트 및 센서 로그와 같은 데이터의 대다수가 구조화되어 있지 않고 레이블이 지정되어 있지 않기 때문에 이 접근 방식은 특히 가치가 있습니다.

Link to this section비지도 학습의 작동 원리#

비지도 학습 시나리오에서 알고리즘은 데이터에서 흥미로운 구조를 발견하기 위해 스스로의 방식대로 학습합니다. 목표는 종종 데이터의 기본 분포를 모델링하거나 데이터 자체에 대해 더 많이 학습하는 것입니다. 학습 중에 "정답"이 제공되지 않기 때문에 전통적인 의미에서 정확도로 모델을 평가할 수 없습니다. 대신, 성능은 모델이 차원을 얼마나 잘 축소하거나 유사한 데이터 포인트를 얼마나 잘 클러스터링하는지에 따라 측정되는 경우가 많습니다.

이 방법론은 인간이 종종 새로운 개념을 학습하는 방식과 유사합니다. 예를 들어, 아이는 처음에 "개"와 "고양이"라는 이름을 반드시 알지 못하더라도 모양과 행동을 관찰하여 개와 고양이를 구분할 수 있습니다. 이와 마찬가지로 비지도 학습 알고리즘은 내재된 유사성을 기반으로 정보를 그룹화합니다. 이러한 능력은 시스템이 지속적인 인간의 감독 없이도 새로운 환경에 적응할 수 있게 해주기 때문에 인공 일반 지능(AGI) 개발에 필수적입니다.

Link to this section비지도 학습의 주요 기술#

비지도 학습은 서로 다른 유형의 데이터 분석 문제에 적합한 몇 가지 고유한 기술을 포함합니다.

클러스터링: 이는 가장 일반적인 응용 분야로, 알고리즘이 서로 유사한 데이터 포인트를 그룹화합니다. 널리 사용되는 방법은 기능 유사성을 기반으로 데이터를 k개의 별도 그룹으로 분할하는 K-Means 클러스터링입니다. 이는 유사한 구매 행동을 가진 고객 그룹을 식별하기 위한 시장 세분화에 널리 사용됩니다.
차원 축소: 고차원 데이터는 복잡하고 처리하는 데 많은 계산 비용이 들 수 있습니다. 주성분 분석(PCA)과 같은 기술은 데이터 세트의 핵심 정보를 보존하면서 변수의 수를 줄입니다. 이는 데이터 시각화를 단순화하고 다른 머신 러닝 모델의 학습 속도를 향상시킵니다.
이상 탐지: "정상" 데이터가 어떤 모습인지 학습함으로써 비지도 학습 모델은 정상 범위를 크게 벗어나는 이상치를 식별할 수 있습니다. 이는 비정상적인 거래 패턴이 보안 경고를 유발하는 금융 분야의 부정 탐지에 매우 중요합니다.
연관 규칙 학습: 이 기술은 대규모 데이터베이스에서 변수 간의 흥미로운 관계를 발견합니다. 이는 시장 바구니 분석에 널리 사용되며, 소매업체가 빵을 구매하는 고객이 버터를 구매할 가능성도 높다는 것을 이해하도록 돕습니다.

Link to this section비지도 학습 vs. 지도 학습#

비지도 학습과 지도 학습을 구분하는 것은 중요합니다. 주요 차이점은 사용되는 데이터에 있습니다. 지도 학습은 레이블이 지정된 데이터 세트를 필요로 하며, 이는 각 학습 예제가 정답 출력과 쌍을 이룬다는 것을 의미합니다(예: "고양이"라고 레이블이 지정된 고양이 이미지). 모델은 오류를 최소화하기 위해 입력을 출력에 매핑하는 방법을 학습합니다.

반면 비지도 학습은 레이블이 없는 데이터를 사용합니다. 모델의 출력이 올바른지 알려주는 피드백 루프는 없습니다. 소량의 레이블이 지정된 데이터와 대량의 레이블이 없는 데이터를 결합하여 학습 정확도를 높이는 준지도 학습이라는 중간 단계가 존재하며, 이는 데이터 레이블링 비용이 많이 들거나 시간이 많이 소요될 때 자주 사용됩니다.

Link to this section실제 애플리케이션 사례#

비지도 학습은 우리가 일상에서 접하는 많은 기술의 원동력입니다. 다음은 두 가지 구체적인 예시입니다.

소매업에서의 고객 세분화: 전자상거래 플랫폼은 미리 정의된 카테고리 없이 수백만 명의 사용자 상호 작용을 분석합니다. 클러스터링 알고리즘을 사용하여 "주말 할인 사냥꾼" 또는 "기술 애호가"와 같은 뚜렷한 사용자 페르소나를 식별합니다. 이를 통해 매우 개인화된 마케팅 캠페인과 추천 시스템을 제공하여 고객 경험을 크게 향상시킵니다.
유전체 서열 분석: 생물정보학에서 연구자들은 유전 데이터를 분석하기 위해 비지도 학습을 사용합니다. 알고리즘은 DNA 서열을 클러스터링하여 여러 집단 간의 유사한 유전적 마커나 돌연변이를 찾습니다. 이는 모든 특정 유전자 기능을 미리 알 필요 없이 진화적 관계를 이해하고 질병에 대한 유전적 소인을 식별하는 데 도움이 됩니다.

Link to this section코드 예시: Scikit-Learn을 이용한 클러스터링#

Ultralytics YOLO26은 주로 지도 객체 탐지 프레임워크이지만, 앵커 박스 분포 분석이나 데이터 세트 기능 클러스터링과 같은 전처리 단계에서는 비지도 학습 기술이 자주 사용됩니다. 아래는 기본적인 비지도 학습 기술인 K-Means 클러스터링을 수행하기 위해 sklearn을 사용하는 간단한 예시입니다.

import numpy as np
from sklearn.cluster import KMeans

# Generate synthetic data: 10 points with 2 features each
X = np.array([[1, 2], [1, 4], [1, 0], [10, 2], [10, 4], [10, 0]])

# Initialize KMeans with 2 clusters (k=2)
kmeans = KMeans(n_clusters=2, random_state=0, n_init="auto")

# Fit the model to the data (no labels provided!)
kmeans.fit(X)

# Predict which cluster each point belongs to
print(f"Labels: {kmeans.labels_}")
# Output will group the first 3 points together (0) and the last 3 together (1)

Link to this section딥러닝에서의 비지도 학습의 역할#

현대 딥러닝(DL)은 점점 더 비지도 학습 원리를 통합하고 있습니다. 자기 지도 학습(SSL)과 같은 기술을 통해 모델은 데이터에서 스스로 지도 신호를 생성할 수 있습니다. 예를 들어, 자연어 처리(NLP)에서 GPT-4와 같은 모델은 문장에서 다음 단어를 예측하기 위해 방대한 양의 텍스트로 사전 학습되며, 명시적인 레이블 없이도 언어 구조를 효과적으로 학습합니다.

마찬가지로 컴퓨터 비전(CV) 분야에서는 오토인코더가 효율적인 데이터 인코딩을 학습하는 데 사용됩니다. 이 신경망은 이미지를 저차원 표현으로 압축한 다음 재구성합니다. 이 과정은 네트워크에 시각적 데이터의 가장 두드러진 특징을 가르치며, 이는 이미지 노이즈 제거 및 생성 모델링과 같은 작업에 유용합니다.

학습을 위한 데이터 세트를 관리하려는 분들을 위해 Ultralytics Platform은 데이터 분포를 시각화할 수 있는 도구를 제공하며, 이는 지도 학습 프로세스가 시작되기 전에 클러스터나 이상치를 식별하는 데 도움이 될 수 있습니다. 비지도 탐색을 통해 데이터 구조를 이해하는 것은 종종 강력한 AI 솔루션을 구축하기 위한 첫 번째 단계입니다.

Explore solutions

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

Unsupervised Learning

Link to this section비지도 학습의 작동 원리#

Link to this section비지도 학습의 주요 기술#

Link to this section비지도 학습 vs. 지도 학습#

Link to this section실제 애플리케이션 사례#

Link to this section코드 예시: Scikit-Learn을 이용한 클러스터링#

Link to this section딥러닝에서의 비지도 학습의 역할#

Explore solutions

로봇 공학에서의 AI

물류 분야의 AI

소매업에서의 AI

의료 분야의 AI

제조 분야의 AI

자동차 분야의 AI

농업 분야의 AI

로봇 공학에서의 AI

물류 분야의 AI

소매업에서의 AI

의료 분야의 AI

제조 분야의 AI

자동차 분야의 AI

농업 분야의 AI

로봇 공학에서의 AI

물류 분야의 AI

소매업에서의 AI

의료 분야의 AI

제조 분야의 AI

자동차 분야의 AI

농업 분야의 AI

미래의 AI를 함께 구축합시다!