제로 샷 학습: 모델이 보이지 않는 데이터를 classify 객체 감지, NLP 등을 혁신하는 최첨단 AI 접근 방식에 대해 알아보세요.
제로 샷 러닝(ZSL)은 머신 러닝의 강력한 패러다임으로 머신러닝(ML)의 강력한 패러다임으로, 인공 인공지능 모델이 학습 데이터 단계에서 한 번도 접해보지 않은 물체를 인식, classify 또는 detect 수 있게 해주는 학습 데이터 단계. 기존의 지도 학습에서는 모델을 학습시키기 위해 식별해야 하는 모든 특정 카테고리에 대해 수천 개의 레이블이 지정된 이미지를 학습해야 합니다. ZSL은 다음과 같은 방법으로 이러한 제약을 제거합니다. 보조 정보(일반적으로 텍스트 설명, 속성, 또는 시맨틱 임베딩을 활용하여보이는 것과 보이지 않는 것 사이의 간극을 메웁니다 . 클래스 간의 격차를 해소합니다. 이 기능을 사용하면 인공 지능(AI) 시스템 훨씬 더 유연하고 확장 가능하며 동적인 환경을 처리할 수 있습니다. 가능한 모든 객체에 대한 데이터를 수집하는 것이 비현실적인 동적 환경을 처리할 수 있습니다.
ZSL의 핵심 메커니즘은 공유된 의미 공간을 사용하여 익숙한 개념에서 낯선 개념으로 지식을 이전하는 것입니다. 시맨틱 공간을 사용하는 것입니다. 픽셀 패턴만 암기하여 '고양이'를 인식하는 법을 배우는 대신, 이 모델은 은 시각적 특징과 의미론적 속성(예: "털", "털복숭이", "수염" "수염", "네 다리" 등)의 관계를 학습합니다. 자연어 처리(NLP).
이 프로세스는 종종 다음 사항에 의존합니다. 이미지와 텍스트를 정렬하는 멀티 모달 모델 표현을 정렬하는 멀티모달 모델에 의존합니다. 예를 들어, 다음과 같은 기초 연구는 OpenAI의 CLIP은 모델이 시각적 개념을 학습하는 방법을 보여줍니다. 시각적 개념을 학습하는 방법을 보여줍니다. ZSL 모델은 희귀 조류와 같이 눈에 보이지 않는 물체를 발견하면, 시각적 특징을 추출하여 시각적 특징을 추출하고 이를 의미 벡터 사전과 비교합니다. 시각적 특징이 새 클래스의 의미적 설명과 일치하면 시맨틱 설명과 일치하면 모델은 이를 정확하게 classify 효과적으로 "제로 샷" 예측을 효과적으로 수행할 수 있습니다.
ZSL을 완전히 이해하려면 다음에서 사용되는 유사한 학습 전략과 구별하는 것이 도움이 됩니다. 컴퓨터 비전(CV):
제로 샷 학습은 시스템이 초기 교육을 넘어 일반화할 수 있도록 지원함으로써 다양한 산업 분야에서 혁신을 주도하고 있습니다. 일반화할 수 있도록 지원합니다.
Ultralytics YOLO 모델은 제로 샷의 예시입니다. 학습을 실제로 보여줍니다. 사용자는 모델을 재학습하지 않고도 런타임에 사용자 지정 클래스를 동적으로 정의할 수 있습니다. 이 는 YOLO11 감지 백본과 클립 기반 텍스트 인코더.
다음 Python 예제는 YOLO 사용하여 표준에 포함되지 않은 객체를 detect 방법을 보여줍니다.
COCO 데이터 세트에 속하지 않은 객체(예: 특정 옷의 색상)를 탐지하는 방법을 보여줍니다. ultralytics 패키지입니다.
from ultralytics import YOLOWorld
# Load a pre-trained YOLO-World model
model = YOLOWorld("yolov8s-world.pt")
# Define custom classes for Zero-Shot detection using text prompts
# The model will now look for these specific descriptions
model.set_classes(["blue backpack", "red apple", "person wearing sunglasses"])
# Run inference on an image to detect the new zero-shot classes
results = model.predict("path/to/image.jpg")
# Show the results
results[0].show()
ZSL은 엄청난 잠재력을 제공하지만, 학습 중에 학습한 의미론적 속성이 학습 중에 학습한 의미론적 속성이 보이지 않는 클래스의 시각적 모양에 완벽하게 매핑되지 않는 문제와 같은 문제에 직면해 있습니다. 또한, ZSL 모델은 보이지 않는 클래스에 비해 보이는 클래스에 대한 예측 정확도가 훨씬 더 높은 편향이 발생할 수 있습니다. 보이지 않는 클래스(일반화된 제로 샷 학습)에 비해 예측 정확도가 훨씬 더 높습니다.
스탠포드 대학교의 AI 연구실 및 IEEE 컴퓨터 학회와 같은 기관의 연구는 이러한 한계를 계속해서 해결하고 있습니다. 기초 모델이 기반 모델이 더욱 견고해짐에 따라, ZSL은 컴퓨터 비전 도구의 표준 기능이 될 것으로 예상됩니다. 컴퓨터 비전 도구의 표준 기능이 될 것으로 예상됩니다. 데이터 라벨링 노력과 고급 AI 기능에 대한 액세스를 고급 AI 기능에 대한 액세스를 민주화할 것으로 기대됩니다.

