실제 애플리케이션을 위해 최소한의 데이터로 모델을 일반화할 수 있는 혁신적인 AI 기술인 원샷 학습의 강력한 기능을 알아보세요.
원샷 학습(OSL)은 머신러닝(ML)의 분류 작업으로, 단 하나의 예제에서 새로운 객체 클래스를 인식하도록 모델을 훈련하는 것입니다. 방대한 양의 학습 데이터가 필요한 기존의 딥러닝 모델과 달리, OSL은 단일 인스턴스로부터 새로운 개념을 학습하는 인간의 능력을 모방하는 것을 목표로 합니다. 따라서 데이터 수집이 비싸거나 어렵거나 불가능한 시나리오에서 특히 유용합니다. 핵심 아이디어는 물체를 직접 분류하는 방법을 학습하는 것이 아니라 두 이미지가 같은 클래스에 속하는지 판단할 수 있는 유사성 함수를 학습하는 것입니다.
특정 클래스를 식별하기 위해 모델을 훈련하는 대신, OSL 모델은 일반적으로 두 입력 이미지가 같은지 다른지 판단하는 다른 작업에 대해 훈련됩니다. 이를 위해 사용되는 일반적인 아키텍처는 동일한 가중치를 공유하는 두 개의 동일한 신경망으로 구성된 샴 네트워크(Siamese Network)입니다. 각 네트워크는 두 입력 이미지 중 하나를 처리하여 이미지의 간결한 수치 표현인 임베딩을생성합니다.
그런 다음 모델은 이 두 임베딩을 비교하여 유사성 점수를 계산합니다. 모델 훈련 중에 네트워크는 같은 클래스의 이미지에 대해서는 유사한 임베딩을 생성하고 다른 클래스의 이미지에 대해서는 서로 다른 임베딩을 생성하는 방법을 학습합니다. 학습이 완료되면 모델은 새로운 이미지를 알려진 각 클래스의 단일 '샷' 또는 예시와 비교하여 분류할 수 있습니다. 새 이미지는 유사도 점수가 가장 높은 클래스에 할당됩니다. 이 접근 방식은 강력한 표현을 구축하기 위해 우수한 특징 추출에 크게 의존합니다.
OSL은 데이터가 적은 시나리오를 위해 설계된 광범위한 학습 방법 제품군의 일부입니다:
원샷 학습은 데이터가 부족한 상황에서 매우 효과적입니다.
OSL의 주요 과제는 일반화입니다. 모델은 특정 기능에 과도하게 맞추지 않고 단일 예제에서 클래스의 핵심 본질을 학습해야 합니다. 따라서 단일 예제의 품질이 매우 중요합니다. ' 코드가 있는 논문'에 소개된 작업과 같이 현재 진행 중인 연구는 보다 강력한 기능 표현과 고급 메타 학습 전략을 개발하는 데 초점을 맞추고 있습니다. 울트라틱스 허브와 같은 범용 비전 플랫폼에 OSL 기능을 통합하면 데이터가 제한된 환경에서 그 활용도가 크게 확대될 수 있습니다. 모델이 더욱 강력해짐에 따라 이러한 까다로운 조건에서 적절한 성능 메트릭으로 모델을 평가하는 것도 핵심 연구 분야입니다.