용어집

원샷 학습

실제 애플리케이션을 위해 최소한의 데이터로 모델을 일반화할 수 있는 혁신적인 AI 기술인 원샷 학습의 강력한 기능을 알아보세요.

원샷 학습(OSL)은 머신러닝(ML)의 분류 작업으로, 단 하나의 예제에서 새로운 객체 클래스를 인식하도록 모델을 훈련하는 것입니다. 방대한 양의 학습 데이터가 필요한 기존의 딥러닝 모델과 달리, OSL은 단일 인스턴스로부터 새로운 개념을 학습하는 인간의 능력을 모방하는 것을 목표로 합니다. 따라서 데이터 수집이 비싸거나 어렵거나 불가능한 시나리오에서 특히 유용합니다. 핵심 아이디어는 물체를 직접 분류하는 방법을 학습하는 것이 아니라 두 이미지가 같은 클래스에 속하는지 판단할 수 있는 유사성 함수를 학습하는 것입니다.

원샷 학습의 작동 방식

특정 클래스를 식별하기 위해 모델을 훈련하는 대신, OSL 모델은 일반적으로 두 입력 이미지가 같은지 다른지 판단하는 다른 작업에 대해 훈련됩니다. 이를 위해 사용되는 일반적인 아키텍처는 동일한 가중치를 공유하는 두 개의 동일한 신경망으로 구성된 샴 네트워크(Siamese Network)입니다. 각 네트워크는 두 입력 이미지 중 하나를 처리하여 이미지의 간결한 수치 표현인 임베딩을생성합니다.

그런 다음 모델은 이 두 임베딩을 비교하여 유사성 점수를 계산합니다. 모델 훈련 중에 네트워크는 같은 클래스의 이미지에 대해서는 유사한 임베딩을 생성하고 다른 클래스의 이미지에 대해서는 서로 다른 임베딩을 생성하는 방법을 학습합니다. 학습이 완료되면 모델은 새로운 이미지를 알려진 각 클래스의 단일 '샷' 또는 예시와 비교하여 분류할 수 있습니다. 새 이미지는 유사도 점수가 가장 높은 클래스에 할당됩니다. 이 접근 방식은 강력한 표현을 구축하기 위해 우수한 특징 추출에 크게 의존합니다.

다른 학습 패러다임과의 관계

OSL은 데이터가 적은 시나리오를 위해 설계된 광범위한 학습 방법 제품군의 일부입니다:

  • 소수점 학습(FSL): 모델이 하나의 예가 아닌 클래스당 적은 수의 예(예: 2~5개)를 통해 학습하는 OSL의 일반화입니다. FSL은 OSL보다 더 많은 정보를 제공하므로 종종 더 나은 성능으로 이어집니다.
  • 제로 샷 학습(ZSL): 일반적으로 시각적 특징과 높은 수준의 의미론적 설명 사이의 매핑을 학습하여 모델이 학습 중에 본 적이 없는 클래스를 인식해야 하는 보다 까다로운 패러다임입니다.
  • 메타 학습: 흔히 '학습을 위한 학습'이라고 불리는 이 접근 방식은 다양한 학습 과제에 대해 모델을 훈련시켜 새로운 과제를 보다 효율적으로 해결할 수 있도록 합니다. UC 버클리의 BAIR과 같은 기관의 연구에서 설명하는 것처럼 많은 OSL 및 FSL 기술은 메타 학습 원리를 기반으로 합니다.
  • 이전 학습: 이는 대규모 데이터 세트(예: ImageNet)에서 사전 학습된 모델을 사용한 다음 더 작은 특정 데이터 세트에서 미세 조정하는 것을 포함합니다. 관련성이 있지만, OSL은 광범위한 미세 조정 없이 단일 예제에서 학습하는 데 중점을 둡니다.

실제 애플리케이션

원샷 학습은 데이터가 부족한 상황에서 매우 효과적입니다.

  1. 얼굴 인식: 보안 시스템은 한 장의 사진만 보여줘도 OSL을 사용하여 사람을 식별할 수 있습니다. 시스템은 고유한 얼굴 서명(임베딩)을 생성하는 방법을 학습한 다음 다양한 각도와 조명 조건에서 해당 사람을 인식할 수 있습니다. 이는 스마트폰 잠금 해제부터 건물 출입 보안에 이르기까지 다양한 애플리케이션에 사용됩니다. 초기에 영향력 있는 논문인 Facebook AI의 DeepFace는 이 작업을 위한 딥 네트워크의 힘을 보여주었습니다.
  2. 약물 발견: 약리학에서 효과적인 약물이 될 수 있는 새로운 분자를 식별하는 것은 비용이 많이 드는 과정입니다. OSL을 사용하면 원하는 특성을 가진 알려진 단일 사례를 기반으로 새로운 분자의 특성을 예측하는 모델을 구축할 수 있습니다. 이는 신약 개발을 위한 그래프 기반 딥 러닝 연구에서 논의된 바와 같이 스크리닝 프로세스를 가속화합니다.

과제 및 향후 방향

OSL의 주요 과제는 일반화입니다. 모델은 특정 기능에 과도하게 맞추지 않고 단일 예제에서 클래스의 핵심 본질을 학습해야 합니다. 따라서 단일 예제의 품질이 매우 중요합니다. ' 코드가 있는 논문'에 소개된 작업과 같이 현재 진행 중인 연구는 보다 강력한 기능 표현과 고급 메타 학습 전략을 개발하는 데 초점을 맞추고 있습니다. 울트라틱스 허브와 같은 범용 비전 플랫폼에 OSL 기능을 통합하면 데이터가 제한된 환경에서 그 활용도가 크게 확대될 수 있습니다. 모델이 더욱 강력해짐에 따라 이러한 까다로운 조건에서 적절한 성능 메트릭으로 모델을 평가하는 것도 핵심 연구 분야입니다.

울트라 애널리틱스 커뮤니티 가입

AI의 미래와 함께하세요. 글로벌 혁신가들과 연결, 협업, 성장하기

지금 가입하기
링크가 클립보드에 복사됨