자기 지도 학습이 레이블이 지정되지 않은 데이터를 활용하여 효율적인 학습을 가능하게 하고, 컴퓨터 비전, NLP 등에서 AI를 혁신하는 방법을 알아보세요.
자기 지도 학습(SSL)은 다음과 같은 분야에서 혁신적인 접근 방식입니다. 인공 지능(AI) 시스템에서 사람의 명시적인 주석 없이도 레이블이 없는 데이터로부터 학습할 수 있게 해주는 혁신적인 접근 방식입니다. 기존의 지도 학습은 수동으로 레이블이 지정된 방대한 데이터 세트에 크게 의존하는 기존의 지도 학습과 달리, SSL은 데이터 자체에서 직접 자체 감독 신호( 을 데이터 자체에서 직접 도출합니다. "구실 작업"을 생성하고 해결함으로써(예: 문장에서 누락된 단어를 채우거나 문장이나 이미지의 회전을 예측하는 등의 "구실 작업"을 생성하고 해결함으로써 모델은 입력의 기본 구조, 문맥, 그리고 입력의 특징을 이해하는 방법을 학습합니다. 이 기능은 강력하고 정교한 기초 모델 강력한 파운데이션 모델을 최소한의 추가 교육만으로 다양한 다운스트림 작업에 적용할 수 있습니다.
SSL의 핵심 메커니즘은 사용 가능한 데이터의 일부를 제거하여 신경망(NN) 에 재구성하는 것입니다. 이 프로세스를 통해 모델은 고품질 표현을 학습하거나 임베딩을 학습하도록 합니다. 연구와 산업에서 사용되는 구실 작업에는 크게 두 가지 범주가 있습니다:
자가 지도 학습은 큐레이션되지 않은 방대한 데이터 세트의 가치를 실현하여 업계에 혁신을 가져왔습니다. 다음은 그 영향력을 보여주는 두 가지 구체적인 사례를 소개합니다:
SSL을 완전히 이해하려면 유사한 학습 패러다임과 구분하는 것이 도움이 됩니다:
실제로 대부분의 개발자는 다음을 활용하여 SSL을 활용합니다. 모델 가중치 모델 가중치를 이미 사전 학습된 모델 가중치를 활용합니다. 예를 들어 Ultralytics YOLO11 아키텍처의 장점 광범위한 훈련을 통해 연마된 심층 특징 추출 기능의 이점을 활용합니다. YOLO 감독되는 동안, 시각적 특징을 이해하는 모델을 새로운 작업에 적용하는 전이 학습(시각적 특징을 이해하는 모델을 가져와 새로운 작업에 적용하는 것)은 SSL 연구의 주요 SSL 연구의 다운스트림 이점입니다.
다음 Python 예제는 사전 학습된 모델을 로드하고 특정 데이터 세트에서 미세 조정하는 방법을 보여줍니다. 이 워크플로는 초기 사전 학습 단계에서 학습한 특징 표현에 의존합니다.
from ultralytics import YOLO
# Load a pre-trained YOLO11 model (weights act as the learned representation)
model = YOLO("yolo11n.pt")
# Fine-tune the model on a specific task, leveraging its existing visual knowledge
# This transfer learning process is highly efficient due to robust pre-training
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)
# Perform inference to verify the model detects objects correctly
model.predict("https://ultralytics.com/images/bus.jpg", save=True)
연구자들이 암기보다는 관찰을 통해 인간처럼 학습하는 모델을 추구함에 따라 SSL 은 여전히 혁신의 선두에 서 있습니다. 주요 연구소는 다음과 같습니다. Google 딥마인드 와 Meta AI는 레이블이 지정된 데이터에 대한 의존도를 낮추는 획기적인 기술을 계속해서 발표하고 있습니다. Ultralytics 이러한 발전을 이러한 발전된 기술을 R&D에 통합하고 있습니다. YOLO26다양한 분야에 걸쳐 효과적으로 일반화할 수 있는 더 빠르고, 더 작고, 더 정확한 모델을 제공하는 것을 목표로 하고 있습니다. 컴퓨터 비전(CV) 작업을 효과적으로 일반화하는 것을 목표로 합니다. 다음과 같은 도구 PyTorch 및 곧 출시될 Ultralytics Platform과 같은 도구는 실제 프로덕션 환경에서 이러한 고급 기능을 그 어느 때보다 쉽게 배포할 수 있게 해줍니다.

