YOLO Vision 2025를 놓치지 마세요!
2025년 9월 25일
10:00 — 18:00 BST
하이브리드 이벤트
Yolo Vision 2024
용어집

One-Shot Learning

One-Shot Learning의 강력한 기능을 경험해 보세요. 최소한의 데이터로부터 일반화하여 실제 응용 분야에 적용할 수 있는 혁신적인 AI 기술입니다.

원샷 학습(OSL)은 단 하나의 예시만으로 새로운 객체 클래스를 인식하도록 모델을 훈련시키는 머신러닝(ML) 내의 분류 작업입니다. 막대한 양의 훈련 데이터를 필요로 하는 기존의 딥러닝 모델과는 달리, OSL은 단일 인스턴스에서 새로운 개념을 학습하는 인간의 능력을 모방하는 것을 목표로 합니다. 이는 데이터 수집 비용이 비싸거나 어렵거나 불가능한 시나리오에서 특히 유용합니다. 핵심 아이디어는 객체를 직접 분류하는 방법을 배우는 것이 아니라 두 이미지가 동일한 클래스에 속하는지 여부를 판단할 수 있는 유사성 함수를 배우는 것입니다.

One-Shot Learning 작동 방식

특정 클래스를 식별하도록 모델을 학습시키는 대신 OSL 모델은 일반적으로 두 입력 이미지가 동일한지 다른지 판단하는 다른 작업에 대해 학습됩니다. 이를 위해 일반적으로 사용되는 아키텍처는 동일한 가중치를 공유하는 두 개의 동일한 신경망으로 구성된 Siamese Network입니다. 각 네트워크는 두 입력 이미지 중 하나를 처리하여 이미지의 간결한 숫자 표현인 임베딩을 생성합니다.

그런 다음 모델은 이러한 두 임베딩을 비교하여 유사성 점수를 계산합니다. 모델 훈련 중에 네트워크는 동일한 클래스의 이미지에 대해 유사한 임베딩을 생성하고 다른 클래스의 이미지에 대해 유사하지 않은 임베딩을 생성하도록 학습합니다. 훈련이 완료되면 모델은 각 알려진 클래스의 단일 "샷" 또는 예제와 비교하여 새 이미지를 분류할 수 있습니다. 새 이미지는 가장 높은 유사성 점수를 가진 클래스에 할당됩니다. 이 접근 방식은 강력한 표현을 구축하기 위해 우수한 특징 추출에 크게 의존합니다.

다른 학습 패러다임과의 관계

OSL은 낮은 데이터 시나리오를 위해 설계된 광범위한 학습 방법군의 일부입니다.

  • Few-Shot Learning (FSL): OSL의 일반화 버전으로, 모델이 클래스당 단 하나의 예제가 아닌 적은 수의 예제(예: 2~5개)로부터 학습합니다. FSL은 OSL보다 더 많은 정보를 제공하므로 종종 더 나은 성능을 냅니다.
  • Zero-Shot Learning (ZSL): 모델이 훈련 중에 본 적이 없는 클래스를 인식해야 하는 더 어려운 패러다임으로, 일반적으로 시각적 특징과 고급 의미 설명 간의 매핑을 학습하여 수행합니다.
  • 메타 학습: 종종 "학습하는 방법 학습"이라고 불리는 이 접근 방식은 새로운 작업을 보다 효율적으로 해결할 수 있도록 광범위한 학습 작업에 대해 모델을 훈련합니다. 많은 OSL 및 FSL 기술은 UC Berkeley의 BAIR과 같은 기관의 연구에서 설명한 바와 같이 메타 학습 원칙을 기반으로 합니다.
  • 전이 학습: 여기에는 대규모 데이터 세트(ImageNet 등)에서 사전 훈련된 모델을 사용한 다음 더 작고 특정 데이터 세트에서 미세 조정하는 것이 포함됩니다. 관련은 있지만 OSL은 광범위한 미세 조정 없이 단일 예제에서 학습하는 데 중점을 둡니다.

실제 애플리케이션

원샷 학습은 데이터가 부족한 상황에서 매우 효과적입니다.

  1. 얼굴 인식: 보안 시스템은 OSL을 사용하여 사진 한 장만 보여준 후에도 사람을 식별할 수 있습니다. 시스템은 고유한 얼굴 서명(임베딩)을 생성하는 방법을 학습하고 다양한 각도와 다양한 조명 조건에서 해당 사람을 인식할 수 있습니다. 이는 스마트폰 잠금 해제에서 보안 건물 액세스에 이르기까지 다양한 애플리케이션에 사용됩니다. 초기 영향력 있는 논문인 Facebook AI의 DeepFace는 이 작업에 대한 딥 네트워크의 강력한 기능을 입증했습니다.
  2. 약물 발견: 약리학에서 효과적인 약물이 될 수 있는 새로운 분자를 식별하는 것은 비용이 많이 드는 과정입니다. OSL은 원하는 특성을 가진 알려진 단일 예제를 기반으로 새로운 분자의 속성을 예측하는 모델을 구축하는 데 사용할 수 있습니다. 이는 약물 개발을 위한 그래프 기반 딥러닝에 대한 연구에서 논의된 바와 같이 스크리닝 프로세스를 가속화합니다.

과제 및 향후 방향

OSL의 주요 과제는 일반화입니다. 모델은 특정 기능에 과적합되지 않고 단일 예제에서 클래스의 핵심 본질을 학습해야 합니다. 따라서 단일 예제의 품질이 매우 중요합니다. Papers with Code에서 강조된 작업과 같은 지속적인 연구는 보다 강력한 기능 표현과 고급 메타 학습 전략 개발에 중점을 둡니다. Ultralytics HUB와 같은 범용 비전 플랫폼에 OSL 기능을 통합하면 데이터가 제한된 환경에서 사용이 크게 확대될 수 있습니다. 모델이 더욱 강력해짐에 따라 이러한 어려운 조건에서 적절한 성능 메트릭으로 모델을 평가하는 것도 주요 연구 분야입니다.

Ultralytics 커뮤니티에 참여하세요

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기
클립보드에 링크가 복사되었습니다.