자가 지도 학습이 어떻게 레이블이 없는 데이터를 활용하여 효율적인 학습을 하고, 컴퓨터 비전, 자연어 처리 등의 분야에서 AI를 혁신하는지 알아보세요.
자가 지도 학습(SSL)은 라벨이 지정되지 않은 방대한 양의 데이터에서 모델이 학습할 수 있도록 하는 머신 러닝(ML) 접근 방식입니다. 꼼꼼하게 레이블이 지정된 데이터에 크게 의존하는 지도 학습과 달리, SSL은 입력 데이터 자체에서 직접 자체 감독 신호를 독창적으로 생성합니다. 따라서 라벨링되지 않은 데이터가 많지만 수동 라벨링(데이터 주석)에 드는 비용과 노력이 엄청날 수 있는 컴퓨터 비전(CV) 및 자연어 처리(NLP) 같은 분야에서 매우 유용합니다.
SSL의 핵심 메커니즘은 "구실 작업"을 설계하는 것과 관련이 있습니다. 이 작업은 모델이 의도적으로 숨겨지거나 변경된 데이터의 특정 속성을 예측해야 하는 보조적인 자체 생성 작업입니다. 이 구실 과제를 해결함으로써 모델은 사람이 제공한 레이블 없이도 데이터의 의미 있는 기본 구조와 표현(임베딩)을 학습하도록 강제됩니다. 이 초기 훈련 단계를 일반적으로 사전 훈련이라고 합니다.
예를 들어 컴퓨터 비전에서는 구실 작업이 포함될 수 있습니다:
NLP에서 잘 알려진 구실 작업은 BERT와 같은 모델에서 사용하는 것으로 유명한 마스크드 언어 모델링입니다. 여기서 모델은 문장 내에서 무작위로 마스킹(숨김)된 단어를 예측하는 방법을 학습합니다.
라벨이 지정되지 않은 대규모 데이터 세트에 대한 사전 학습을 거친 후 모델은 풍부한 특징 표현을 캡처합니다. 이렇게 사전 학습된 모델은 미세 조정이라는 프로세스를 통해 객체 감지, 이미지 분류 또는 감정 분석과같은 특정 다운스트림 작업에 맞게 조정할 수 있습니다. 미세 조정에는 일반적으로 모델을 처음부터 훈련하는 것에 비해 훨씬 적은 양의 레이블이 지정된 데이터가 필요하므로 SSL은 효과적인 전이 학습을 가능하게 하는 핵심 요소입니다.
SSL을 관련 ML 패러다임과 차별화하는 것이 중요합니다:
SSL은 인공지능(AI) 기능이 크게 발전했습니다:
SSL은 값비싼 레이블이 지정된 데이터 세트에 대한 의존도를 크게 줄여 강력한 AI 모델 개발을 대중화합니다. 다음과 같은 도구 PyTorch 및 TensorFlow와 같은 도구와 Ultralytics HUB와 같은 플랫폼은 최첨단 AI 솔루션 구축 및 배포를 위해 SSL 기술을 활용할 수 있는 환경을 제공합니다.