Yolo 비전 선전
선전
지금 참여하기
용어집

퓨샷 학습

퓨샷 학습이 최소한의 데이터로 AI가 적응할 수 있도록 지원하여 의료 진단 및 야생 동물 보호와 같은 분야를 어떻게 변화시키는지 알아보십시오.

퓨어샷 학습(FSL)은 머신러닝(ML)의 전문 하위 분야로 머신 러닝(ML)의 전문 하위 분야로, 극소수의 데이터만으로 새로운 개념을 분류하고 인공 지능 모델을 훈련하는 데 중점을 둔 전문 분야입니다. 레이블이 지정된 예제만을 사용하여 새로운 개념을 분류하거나 이해하는 데 중점을 둡니다. 전통적인 딥 러닝(DL)에서는 높은 정확도를 달성하기 위해 클래스당 수천 개의 수천 개의 이미지가 필요합니다. 하지만 FSL은 제한된 경험에서 빠르게 일반화하는 인간의 능력을 모방합니다. 제한된 경험으로부터 빠르게 일반화할 수 있는 인간의 능력을 모방합니다. 이 기능은 대용량의 데이터를 수집하는 대량의 학습 데이터를 수집하는 데 많은 비용과 시간이 소요되는 훈련 데이터를 수집하는 데 비용이 많이 들고 시간이 오래 걸리거나 사실상 불가능한 애플리케이션에 매우 중요합니다.

소수 정예 학습의 핵심 메커니즘

FSL의 주요 목표는 사전 지식을 활용하여 방대한 데이터 세트에 대한 의존도를 줄이는 것입니다. 새로운 패턴을 처음부터 새로운 패턴을 처음부터 학습하는 대신, 이 모델은 기본 데이터 세트에서 학습한 정보를 활용하여 새로운 작업에 사용할 수 있는 몇 가지 예제를 몇 가지 예시를 해석합니다. 이는 종종 서로 다른 접근 방식을 통해 달성됩니다:

  • 메타 학습: 흔히 "학습을 위한 학습"으로 설명되는 메타학습은 메타 학습은 새로운 작업에 빠르게 적응하도록 모델을 훈련시킵니다. 새로운 작업에 빠르게 적응하도록 모델을 훈련시킵니다. 모델에 구애받지 않는 메타 학습(MAML)과 같은 알고리즘은 모델 내부 파라미터를 최적화하여 모델의 내부 파라미터를 최적화하여 새로운 작업에 대해 몇 가지 점진적인 단계를 거치면 좋은 성과를 낼 수 있도록 합니다.
  • 메트릭 기반 학습: 이 접근 방식은 입력 데이터를 유사한 항목은 서로 가깝게, 서로 다른 항목은 멀리 떨어져 있는 서로 가깝고 서로 다른 항목은 멀리 떨어져 있는 특징 공간에 매핑합니다. 다음과 같은 기법이 사용됩니다. 프로토타입 네트워크는 각 클래스에 대한 평균 표현(프로토타입)을 계산합니다. 을 계산하고 이러한 프로토타입과의 거리에 따라 새로운 쿼리 샘플을 classify 정교한 가장 가까운 이웃(k-NN) 분류기와 유사하게 작동합니다.
  • 데이터 증강: 샘플이 부족할 때 연구자들은 종종 인위적으로 데이터 세트를 확장합니다. 고급 데이터 증강 기술은 사용 가능한 몇 안 되는 이미지의 합성 변형을 생성하여 모델이 제한된 예시에 과도하게 모델이 제한된 예시에 과도하게 적합해지는 것을 방지할 수 있습니다.

YOLO11 소수 정예 학습 구현하기

실제 컴퓨터 비전(CV) 시나리오에서 FSL 은 전이 학습을 통해 구현되는 경우가 많습니다. 다음과 같은 강력한 모델을 사용하면 YOLO11와 같이 이미 대규모 데이터에서 풍부한 기능 표현을 이미 학습한 COCO, 개발자는 작은 사용자 지정 데이터 세트에서 모델을 미세 조정할 수 있습니다. 사전 학습된 가중치는 강력한 기능 추출기 역할을 합니다. 추출기 역할을 하여 모델이 매우 적은 샘플로 새로운 클래스에 수렴할 수 있도록 합니다.

다음 Python 코드는 이 개념을 적용하는 방법을 보여줍니다. ultralytics 패키지. 으로 사전 학습된 모델을 로드하고 작은 데이터 세트에 대해 짧은 기간 동안 학습하면 기본적으로 몇 번의 샷으로 적응을 수행합니다.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model to leverage learned feature representations
model = YOLO("yolo11n.pt")

# Fine-tune the model on a small dataset (e.g., 'coco8.yaml' has only 4 images per batch)
# The model adapts its existing knowledge to the new few-shot task
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# The model can now detect objects from the small dataset with high efficiency

몇 샷과 관련 개념 구분하기

FSL이 AI 환경에서 어디에 적합한지 이해하려면 유사한 학습 패러다임과 구분하는 것이 도움이 됩니다:

  • 제로 샷 학습(ZSL): FSL은 최소한의 예제 세트("지원 세트")가 필요하지만, ZSL은 특정 대상 클래스를 추론하는 동안 시각적 예제가 전혀 필요하지 않습니다. 가 전혀 필요하지 않습니다. 대신, ZSL은 의미론적 설명이나 속성(예: 텍스트 임베딩)에 의존하여 보이지 않는 카테고리를 인식합니다.
  • 원샷 학습: 이것은 모델이 정확히 하나의 레이블이 지정된 예제에서 새로운 클래스를 학습해야 하는 FSL의 극단적인 경우입니다. 이는 얼굴 인식 시스템의 표준 얼굴 인식 시스템의 벤치마크입니다. 사용자의 얼굴을 한 번만 보고 휴대폰 잠금이 해제됩니다.
  • 이전 학습: FSL은 전이 학습의 특정 응용 프로그램입니다. 표준 전이 학습은 여전히 수백 개의 이미지를 사용하여 미세 조정을 위해 수백 개의 이미지를 사용하는 반면, FSL은 명시적으로 시나리오를 타겟팅합니다. (예: 클래스당 5~10개의 이미지)을 명시적으로 대상으로 합니다.

실제 애플리케이션

소수점 학습은 본래 데이터가 부족하거나 뚜렷한 이상 징후가 드문 산업에서 잠재력을 발휘하고 있습니다.

의료 진단

의료 영상 분석에서 희귀 병변에 대한 희귀 병리에 대한 수천 개의 라벨링된 스캔을 얻는 것은 종종 불가능합니다. FSL은 다음을 지원합니다. 희귀 종양 유형 식별을 위한 AI 모델 또는 유전적 상태를 식별할 수 있습니다. 다음과 같은 기관 스탠포드 의과대학과 같은 기관에서는 이러한 기술을 적극적으로 연구하여 AI의 대중화를 위해 노력하고 있습니다. 진단 도구를 대중화하기 위해 이러한 기술을 적극적으로 연구하고 있습니다.

제조 품질 관리

제조 분야의 최신 AI는 품질을 보장하기 위해 결함을 감지하는 데 의존합니다. 하지만 특정 결함은 100만 대 중 한 번만 발생할 수 있습니다. 대량의 '결함' 데이터 세트를 수집하기 위해 대량의 '결함' 데이터 세트를 수집하는 데 몇 달이 걸리는 대신, 엔지니어는 FSL을 사용하여 몇 가지 예시만으로 물체 감지 시스템을 훈련시킵니다. 새로운 결함의 몇 가지 예만으로 객체 감지 시스템을 훈련시켜 업데이트된 품질 보증 프로토콜을 즉시 배포할 수 있습니다.

로봇 공학 및 적응

동적인 환경에서 작동하는 로봇은 종종 이전에 보지 못한 물체와 마주칩니다. FSL을 사용하면 로봇 시스템이 새로운 물체를 파악하거나 조작하는 방법을 배울 수 있습니다. 도구를 몇 번만 보여줘도 로봇 시스템이 새로운 도구를 파악하거나 조작하는 방법을 배울 수 있습니다. 이 기능은 다음과 같은 유연한 자동화에 필수적입니다. 창고 및 물류 분야의 유연한 자동화에 필수적입니다.

과제 및 향후 전망

FSL은 그 잠재력에도 불구하고 신뢰성과 관련된 문제에 직면해 있습니다. 모델은 제공되는 몇 가지 특정 예제에 민감할 수 있습니다. 지원 세트가 대표적이지 않으면 성능이 크게 떨어집니다. 현재 연구는 다음 사항에 중점을 두고 있습니다. 임베딩의 견고성 개선 및 개발 더 나은 불확실성 추정 방법을 개발하는 데 중점을 두고 있습니다. 다음과 같은 프레임워크 PyTorchTensorFlow 과 같은 프레임워크는 계속 발전하고 있으며, 연구자들에게 데이터 효율적인 학습의 한계를 넓힐 수 있는 경계를 넓힐 수 있는 도구를 제공합니다. 다음과 같은 모델이 YOLO26 와 같은 모델이 출시되면 최소한의 데이터 입력으로 학습할 수 있는 기능이 더욱 향상될 것으로 기대됩니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기