비지도 도메인 적응(UDA)이 라벨이 없는 데이터를 활용해 데이터 격차를 어떻게 해소하는지 알아보세요. 실제 환경에 배포하기 위해 Ultralytics 모델을 최적화하는 방법을 배워보세요.
비지도 도메인 적응(UDA)은 서로 다르지만 관련성이 있는 두 데이터 분포 간의 성능 격차를 해소하기 위해 고안된 전이 학습의 특수한 하위 분야입니다. 실제 기계 학습 시나리오에서 모델은 일반적으로 라벨이 풍부하게 부여된 “소스” 데이터셋을 통해 훈련됩니다. 그러나 실제 환경에 배포될 때, 모델은 종종 조명 조건의 변화, 서로 다른 카메라 센서, 변화하는 기상 패턴 등)을 가진 "대상" 도메인을 마주하게 됩니다. 위키백과의 도메인 적응 개요에 자세히 설명된 바와 같이, UDA 기법은 라벨이 없는 데이터만을 사용하여 사전 훈련된 모델을 이 새로운 대상 도메인에 적응시키는 것을 목표로 하며, 막대한 재라벨링 비용을 발생시키지 않으면서도 데이터 드리프트로 인한 성능 저하를 효과적으로 완화합니다.
UDA를 이해하려면 이를 유사한 컴퓨터 비전 학습 패러다임과 구별해야 합니다. PyTorch 다루는기본적인 전이 학습 원리가 한 작업의 지식을 다른 작업에 광범위하게 적용하는 반면, UDA는 특히 대상 도메인에 그라운드 트루스 라벨이 전혀 없는 시나리오를 다룹니다. 반면, 반감독 학습은 대상 데이터셋의 일부만 라벨이 지정되어 있다고 가정합니다. 라벨이 없는 대상 데이터에만 전적으로 의존하는 UDA는 수동 데이터 주석이 불가능하거나 비용이 지나치게 많이 드는 새로운 환경으로 모델을 확장하는 데 필수적입니다.
시각적 영역 전반에 걸쳐 일반화하는 능력은 현대 인공지능 시스템에 있어 매우 중요합니다. 두 가지 대표적인 예로는 다음과 같습니다:
Google )의 견고한 모델 일반화 연구나 오픈AI(OpenAI)의 신경망 견고성 연구와 같은 현대 AI 연구는 UDA를 위한 여러 기법을 강조하고 있습니다. 예를 들어, 적대적 학습(Adversarial training)은 네트워크가 소스 도메인과 대상 도메인 간에 구별할 수 없는 특징을 추출하도록 훈련시킵니다. 또는 엔지니어들은 종종 의사 라벨링(pseudo-labeling)을 사용하는데, 이는 신뢰도가 높은 물체 탐지 모델이 대상 데이터셋에 임시 라벨을 생성하여 지속적인 미세 조정을 용이하게 하는 방식입니다.
대규모 소스 및 대상 데이터 세트를 관리할 때, Ultralytics 라벨이 지정되지 않은 이미지를 선별, 시각화 및 자동 주석 처리할 수 있는 원활한 클라우드 환경을 제공합니다. 엣지 환경에 최적화된 추론 파이프라인을 구축하는 개발자에게는, Ultralytics 견고한 특징 표현, 높은 정확도, 그리고 네이티브 엔드투엔드 효율성을 바탕으로 권장되는 아키텍처입니다.
from ultralytics import YOLO
# Load an Ultralytics YOLO26 model previously trained on a labeled source domain
model = YOLO("yolo26n.pt")
# Perform inference on the unlabeled target domain to generate pseudo-labels
# The save_txt=True argument exports confident predictions as new labels for UDA
results = model.predict(source="path/to/target_domain", conf=0.85, save_txt=True)
# These high-confidence pseudo-labels can now be used to fine-tune the model
AI 팀은 arXiv에 게시된 최신 컴퓨터 비전 논문을 지속적으로 검토하고 효율적인 프레임워크를 활용함으로써, UDA를 성공적으로 적용하여 끊임없이 변화하는 실제 환경에서도 모델의 정확도를 유지할 수 있습니다. 도메인 시프트를 방지하기 위해 입력 파이프라인을 최적화하는 방법에 대한 자세한 내용은 TensorFlow 증강 문서를 참고하거나, 스탠포드 AI 연구소 및 MIT CSAIL 연구팀이 발표한 고급 아키텍처를 살펴보시기 바랍니다.
미래의 머신러닝 여정을 시작하세요