용어집

제로 샷 학습

제로 샷 학습: 모델이 보이지 않는 데이터를 분류하여 객체 감지, NLP 등을 혁신하는 최첨단 AI 접근 방식에 대해 알아보세요.

제로 샷 학습(ZSL)은 머신 러닝(ML) 에서 모델이 학습 데이터 단계에서 본 적이 없는 카테고리의 객체를 인식하고 분류할 수 있는 매력적인 기능입니다. 가능한 모든 클래스에 대해 명시적인 예제가 필요한 기존의 지도 학습과 달리, ZSL을 사용하면 모델이 이전에 보지 못한 새로운 클래스에 대한 지식을 일반화할 수 있습니다. 이는 속성이나 텍스트 임베딩과 같은 높은 수준의 의미적 설명을 통해 관찰된 클래스와 관찰되지 않은 클래스를 연결함으로써 달성할 수 있습니다. 이를 통해 특히 라벨링된 데이터를 모두 수집하는 것이 비현실적인 실제 시나리오에서 AI 모델의 유연성과 확장성을 높일 수 있습니다.

어떻게 작동하나요?

ZSL의 핵심 아이디어는 이미지의 시각적 특징과 텍스트의 의미적 정보를 모두 표현할 수 있는 공유 임베딩 공간을 만드는 것입니다. 학습 과정에서 모델은 보이는 클래스의 이미지를 해당 시맨틱 벡터(속성 또는 단어 임베딩)에 매핑하는 방법을 학습합니다. 예를 들어, 모델은 "말"의 시각적 특징을 학습하여 "다리가 4개", "포유류", "탈 수 있다"와 같은 의미론적 설명에 연결합니다.

'얼룩말'과 같이 보이지 않는 클래스의 이미지가 제시되면 모델은 시각적 특징을 추출합니다. 동시에 '얼룩말'에 대한 의미론적 설명(예: "말과 비슷하다", "줄무늬가 있다"와 같은)을 사용하여 임베딩 공간에서 얼룩말의 위치를 찾습니다. 추출된 시각적 특징과 가장 가까운 의미적 설명을 찾음으로써 모델은 얼룩말에 대한 학습 이미지가 하나도 없어도 이미지를 '얼룩말'로 정확하게 분류할 수 있습니다. 이 프로세스는 시각과 언어를 연결하는 데 탁월한 OpenAI의 CLIP과 같이 사전 학습된 강력한 멀티모달 모델을 사용하는 경우가 많습니다.

제로 샷 학습 대. 다른 패러다임

ZSL을 관련 학습 기법과 구별하는 것이 중요합니다:

  • 소수점 학습(FSL): FSL에서는 새로운 클래스마다 매우 적은 수의 레이블이 지정된 예제(예: 1~5개)로 모델을 훈련합니다. 이는 대상 클래스의 예시가 전혀 없는 상태에서 작동하는 ZSL과는 다릅니다.
  • 원샷 학습(OSL): 모델이 새로운 클래스의 예시를 정확히 한 개만 받는 FSL의 하위 유형입니다. 일반 FSL보다 데이터 제약이 더 심하지만 ZSL과 달리 최소 하나의 샘플이 필요합니다.
  • 이전 학습: ZSL은 전이 학습의 한 형태이지만 고유한 특징이 있습니다. 표준 전이 학습은 일반적으로 레이블이 지정된 새로운(더 작은) 데이터 세트에 대해 사전 학습된 모델을 미세 조정하는 반면, ZSL은 해당 클래스의 레이블이 지정된 예제 없이 보조 의미 정보만을 사용하여 지식을 새로운 클래스로 전이합니다.

실제 애플리케이션

ZSL은 컴퓨터 비전 시스템을 더욱 역동적이고 적응력 있게 만드는 수많은 실용적인 애플리케이션을 보유하고 있습니다.

  1. 개방형 어휘 개체 감지: YOLO-World와 같은 모델은 ZSL을 활용하여 텍스트로 설명된 모든 객체를 감지합니다. 사용자가 '파란 셔츠를 입은 사람' 또는 '새는 파이프'와 같은 텍스트 프롬프트를 제공하면 모델은 이러한 특정 범주에 대해 명시적으로 학습하지 않고도 이미지 또는 비디오 스트림에서 이러한 물체의 위치를 찾을 수 있습니다. 이는 진정한 범용 비전 시스템을 만들기 위한 중요한 단계입니다.
  2. 자율적 종 식별: 야생동물 보호용 AI에서 ZSL은 희귀종이나 새로 발견된 종을 식별할 수 있습니다. 일반적인 동물에 대해 학습된 모델은 원래 학습 세트에 기린 이미지가 없더라도 Wikipedia와 같은 지식 베이스의 설명적 속성(예: "목이 길다", "점박이다", "초식동물이다")을 사용하여 기린을 식별할 수 있습니다.

도전 과제와 향후 방향

이러한 잠재력에도 불구하고 ZSL은 허브 문제 (의미 공간의 일부 점이 너무 많은 점과 가장 가까운 이웃이 되는 경우)와 도메인 이동 (보이는 클래스와 보이지 않는 클래스 간에 특징과 속성 간의 관계가 달라지는 경우)과 같은 문제에 직면해 있습니다. 이러한 문제를 해결하기 위해 연구자들은 추론 중에 모델이 보이는 클래스와 보이지 않는 클래스를 모두 인식해야 하는 일반화된 제로 샷 학습(GZSL)과 같은 보다 강력한 기술을 개발하고 있습니다. 울트라틱스 허브와 같은 기반 모델과 플랫폼의 발전은 ZSL의 통합과 배포를 더욱 간소화하여 AI 시스템이 광범위한 데이터 라벨링에 덜 의존하고 인간과 유사한 추론에 더 부합하도록 만들 것입니다.

울트라 애널리틱스 커뮤니티 가입

AI의 미래와 함께하세요. 글로벌 혁신가들과 연결, 협업, 성장하기

지금 가입하기
링크가 클립보드에 복사됨