Yolo 비전 선전
선전
지금 참여하기
용어집

지도 학습

지도 학습이 레이블이 지정된 데이터로 AI를 강화하여 객체 감지 및 감성 분석과 같은 정확한 예측과 애플리케이션을 가능하게 하는 방법을 알아보세요.

지도 학습은 다음과 같은 분야에서 지배적인 패러다임입니다. 머신 러닝(ML) 분야에서는 알고리즘을 올바른 출력으로 레이블이 지정된 입력 데이터에 대해 알고리즘을 학습시킵니다. 시스템이 자율적으로 데이터를 탐색하는 다른 방법과 달리 데이터를 자율적으로 탐색하는 다른 방법과 달리, 이 접근 방식은 "슈퍼바이저"(레이블이 지정된 데이터)에 의존하여 레이블이 지정된 데이터)에 의존하여학습 과정을 안내합니다. 기본 목표는 주요 목표는 모델이 입력 변수에서 출력 변수로의 매핑 함수를 충분히 학습하여 결과를 예측할 수 있을 만큼 정확하게 학습하는 것입니다. 이 방법론은 많은 상업적 인공 지능(AI) 스팸 필터부터 고급 컴퓨터 비전(CV) 시스템에 이르는 컴퓨터 비전(CV) 시스템.

프로세스 작동 방식

워크플로는 입력(기능)과 원하는 출력(레이블) 쌍을 포함하는 데이터 집합으로 시작됩니다. 이 컬렉션 은 일반적으로 별개의 하위 집합으로 나뉩니다: 모델 학습을 위한 학습 데이터, 매개변수 조정을 위한 유효성 검사 데이터 매개변수 조정을 위한 검증 데이터, 최종 평가를 위한 테스트 데이터 평가용 테스트 데이터로 나뉩니다.

모델 학습 단계에서 알고리즘은 입력 데이터를 처리하고 입력 데이터를 처리하고 예측을 수행합니다. 손실 함수로 알려진 수학 공식은 손실 함수는 이 예측과 실제 레이블의 차이를 계산합니다. 이 오류를 최소화하기 위해 최적화 알고리즘(예 경사 하강과 같은 최적화 알고리즘이 반복적으로 내부 모델 가중치를 반복적으로 조정합니다. 이 주기는 모델이 만족스러운 성능을 달성할 때까지 여러 패스에 걸쳐 즉, 모델이 학습 세트에 과적합하지 않고 만족스러운 성능을 달성할 때까지 만족스러운 성능을 달성할 때까지 여러 번에 걸쳐 계속됩니다. 이러한 메커니즘에 대해 더 자세히 이러한 메커니즘에 대해 더 자세히 알아보려면 지도 학습에 대한 Scikit-learn 가이드를 참조하세요.

지도 학습의 핵심 카테고리

대부분의 지도 학습 문제는 출력 변수의 유형에 따라 크게 두 가지 범주로 나뉩니다:

  • 이미지 분류: 출력 변수는 출력 변수는 카테고리 또는 클래스입니다. 이메일이 '스팸'인지 '스팸이 아닌지' 또는 사진에 '고양이'가 포함되어 있는지와 같이 개별 레이블을 예측하는 것이 목표입니다. "스팸" 또는 "스팸 아님", 또는 사진에 "고양이" 또는 "개"가 포함되어 있는지 여부를 판단하는 것입니다. 최신 아키텍처는 Ultralytics YOLO11 과 같은 최신 아키텍처는 이러한 시각적 데이터의 패턴을 빠르게 식별하여 이러한 분류 작업에 탁월합니다.
  • 회귀: 출력 변수는 연속적인 실제 값입니다. 예를 들어 면적을 기준으로 부동산 가격을 예측하거나 주식 시장 동향 예측 등이 있습니다. 다음에서 이러한 방법의 통계적 기초에 대해 자세히 알아볼 수 있습니다. IBM의 회귀 분석 개요에서 자세히 알아보세요.

분류 모델 구현

고급 API를 통해 지도 모델 학습에 대한 접근성이 점점 더 높아지고 있습니다. 다음 Python 예제 는 숫자 분류의 표준 벤치마크인 MNIST 데이터 세트에서 YOLO11 모델을 훈련하는 방법을 보여줍니다.

from ultralytics import YOLO

# Load a pretrained classification model
model = YOLO("yolo11n-cls.pt")

# Train the model on the MNIST dataset
# Ultralytics handles the download of the 'mnist160' dataset automatically
results = model.train(data="mnist160", epochs=5, imgsz=64)

# Run inference on a sample image to verify the supervised learning
print(model("https://ultralytics.com/images/bus.jpg"))

실제 애플리케이션

지도 학습은 다양한 산업 분야의 핵심 기술을 뒷받침합니다. 대표적인 두 가지 예는 다음과 같습니다:

  1. 자율 주행 차량: 자율 주행 자동차는 감독을 통해 훈련된 지도 학습을 통해 훈련된 물체 감지 시스템에 학습을 통해 훈련된 물체 감지 시스템에 크게 의존합니다. 보행자, 신호등 및 기타 차량의 수천 장의 이미지가 포함된 주석이 달린 데이터 세트를 통해 차량의 AI는 차량의 AI가 실시간으로 위험을 인식하고 위치를 파악할 수 있습니다. 다음과 같은 기업 NVIDIA 딥 러닝을 활용하여 이러한 방대한 양의 센서 입력을 처리하기 위해 딥 러닝을 활용합니다.
  2. 의료 이미지 분석: 의료 분야에서는 전문 영상의학 전문의가 라벨을 붙인 스캔에 대해 모델을 학습시켜 진단을 지원합니다. 예를 들어 모델은 엑스레이나 MRI에서 병리의 초기 징후를 식별하는 방법을 학습할 수 있습니다. 연구자들은 종종 다음과 같은 리소스를 활용합니다. 뇌종양 감지 데이터 세트와 같은 리소스를 활용하여 시스템을 구축합니다.

관련 개념 구분하기

지도 학습을 다른 머신 러닝 패러다임과 차별화하는 것이 중요합니다:

  • 비지도 학습: 지도 학습과 달리 이 방법은 레이블이 없는 데이터를 처리합니다. 목표는 다음과 같은 숨겨진 구조를 발견하는 것입니다. 비슷한 구매 습관을 가진 고객을 그룹화하여 클러스터 분석.
  • 강화 학습: 정답의 정적 데이터 세트에서 학습하는 대신 에이전트는 환경과 상호 작용하여 학습합니다. It 보상 또는 페널티의 형태로 피드백을 받는데, 이러한 개념은 서튼과 바토의 강화 학습 소개에 자세히 설명되어 있습니다.
  • 준지도 학습: 이 접근 방식은 소량의 라벨링된 데이터와 더 큰 규모의 라벨링되지 않은 데이터 풀과 함께 소량의 데이터를 활용하여 학습 효율성을 향상시키며, 데이터 라벨링에 비용이 많이 들거나 시간이 많이 소요될 때 주로 사용됩니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기