Yolo 비전 선전
선전
지금 참여하기
용어집

비지도 학습

비지도 학습이 클러스터링, 차원 축소, 이상 감지를 사용하여 데이터에서 숨겨진 패턴을 찾아내는 방법을 알아보세요.

비지도 학습은 머신러닝의 역동적인 한 분야로 머신 러닝(ML)의 동적 분야로, 알고리즘이 레이블이 없는 데이터 세트를 분석하고 레이블이 지정되지 않은 데이터 세트를 클러스터링합니다. '정답 키' 또는 레이블이 지정된 입력-출력 쌍이 필요한 지도 방식과 달리, 비지도 학습 알고리즘은 데이터 내에서 숨겨진 패턴, 기본 구조 및 상관관계를 를 스스로 발견할 수 있습니다. 이러한 기능 덕분에 다음과 같은 광범위한 분야에서 필수적인 도구가 되었습니다. 인공 지능(AI), 특히 데이터의 특성을 완전히 이해하지 못하는 탐색적 데이터 분석에 필수적인 도구입니다.

핵심 기술 및 알고리즘

비지도 학습은 원시 데이터에서 인사이트를 추출하도록 설계된 여러 가지 방법론을 포괄합니다. 이러한 기법 은 종종 특정 목표에 따라 분류됩니다:

  • 클러스터링: 이것은 가장 가장 널리 사용되는 애플리케이션으로, 유사한 특성을 공유하는 데이터 요소를 그룹화하는 알고리즘입니다. 일반적인 알고리즘 에는 데이터를 K개의 별개의 클러스터로 분할하는 K-Means와 DBSCAN데이터 밀도를 기반으로 클러스터를 식별하는 알고리즘이 있습니다.
  • 차원 감소: 데이터 집합에 변수의 수가 지나치게 많으면(차원이 높으면) 시각화하거나 처리하기가 어려워집니다. 다음과 같은 기술을 사용할 수 있습니다. 주성분 분석(PCA)t-분산 확률적 이웃 임베딩(t-SNE) 는 필수 정보를 보존하면서 입력 수를 줄이는 데 사용되며, 종종 데이터 전처리 단계에서 데이터 전처리.
  • 연관 규칙 마이닝: 이 기술은 대규모 데이터베이스에서 변수 간의 흥미로운 관계를 흥미로운 관계를 발견합니다. 대표적인 예는 마켓 바스켓 분석으로, 소매업체에서 자주 함께 구매하는 자주 함께 구매하는 품목을 식별하는 데 사용합니다.

실제 애플리케이션

레이블이 없는 대량의 데이터를 처리할 수 있는 기능을 통해 비지도 학습은 다양한 산업 분야에서 혁신을 주도할 수 있습니다. 혁신을 주도할 수 있습니다:

  1. 이상 징후 탐지: "정상" 데이터가 어떻게 보이는지 학습함으로써 비지도 모델은 즉시 편차를 표시할 수 있습니다. In 제조 분야의 AI는 다음과 같은 용도로 사용됩니다. 기계 결함이 발생하기 전에 이를 식별하는 예측 유지보수에 사용됩니다. 마찬가지로 금융 기관에서는 다음과 같은 용도로 사용합니다. 표준 지출 패턴과 다른 사기 거래를 detect .
  2. 고객 세분화: 기업은 클러스터링 알고리즘을 활용하여 정의된 카테고리 없이도 구매 행동이나 인구 통계를 기반으로 고객을 그룹화합니다. 이를 통해 초개인화된 마케팅 전략의 핵심 요소인 초개인화된 마케팅 전략이 가능합니다.

다른 학습 패러다임과의 비교

ML 환경에서 비지도 학습이 어디에 적합한지 이해하려면 다른 접근 방식과 구별해야 합니다:

  • 지도 학습: 의존 레이블이 지정된 데이터 세트에 의존하여 다음과 같은 결과를 예측하는 알고리즘을 학습합니다. 다음과 같은 모델을 사용한 객체 감지 YOLO11. 이 모델은 명시적인 예시를 통해 학습합니다.
  • 준지도 학습: 소량의 라벨링된 데이터와 대량의 라벨링되지 않은 데이터를 결합하여 사용하는 하이브리드 접근 방식입니다. 이는 데이터 라벨링에 비용이 많이 들거나 데이터 라벨링에 비용이 많이 들거나 시간이 많이 소요되는 경우.
  • 강화 학습: 에이전트가 환경에서 작업을 수행하고 보상이나 페널티를 받음으로써 의사 결정을 학습하는 데 중점을 둡니다. 보상 또는 페널티를 받음으로써 의사 결정을 학습하는 데 중점을 둡니다.

구현 예시

다음과 같은 프레임워크는 Ultralytics 는 지도 비전 작업으로 유명합니다, 데이터 그룹화의 기본 개념은 보편적입니다. 아래는 널리 사용되는 scikit-learn 라이브러리를 사용하여 레이블 없이 데이터 요소의 특징에 따라 데이터 요소를 그룹화하여 레이블 없이 데이터 요소를 그룹화합니다.

import numpy as np
from sklearn.cluster import KMeans

# Create a simple dataset with two distinct groups of data points
# Group 1 is near (1, 2), Group 2 is near (10, 4)
X = np.array([[1, 2], [1, 4], [1, 0], [10, 2], [10, 4], [10, 0]])

# Initialize K-Means to find 2 clusters
kmeans = KMeans(n_clusters=2, random_state=0, n_init="auto")

# Fit the model to the data (No labels are provided here)
kmeans.fit(X)

# The model automatically assigns a label (0 or 1) to each point based on proximity
print(f"Predicted Clusters: {kmeans.labels_}")
# Output might look like: [1 1 1 0 0 0] showing the separation

비지도 학습의 미래

비지도 학습은 딥 러닝의 발전을 위해 매우 중요합니다. 딥러닝(DL)의 발전에 매우 중요합니다. 다음과 같은 최신 기술은 자기 지도 학습-과 같은 최신 기술은 시스템이 데이터에서 자체적으로 레이블을 생성하는 방식으로 다음과 같은 분야에 혁신을 일으키고 있습니다. 자연어 처리(NLP)컴퓨터 비전(CV)과 같은 분야에 혁신을 일으키고 있습니다. 전 세계 데이터의 양이 기하급수적으로 증가함에 따라 글로벌 데이터의 양이 기하급수적으로 증가함에 따라, 레이블이 없는 정보로부터 학습하는 능력은 확장 가능한 데이터 과학 워크플로우를 위해 점점 더 중요해지고 있습니다.

기술적 세부 사항에 대해 자세히 알아보려면 다음과 같은 리소스를 참조하세요. 비지도 학습에 대한 IBM 가이드와 Scikit-learn 클러스터링 설명서를 통해 훌륭한 추가 자료를 제공합니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기