유효성 검사 데이터로 머신 러닝 모델을 최적화하여 과적합을 방지하고, 하이퍼파라미터를 조정하고, 강력한 실제 성능을 보장하세요.
유효성 검사 데이터는 머신러닝 개발 수명 주기에서 중요한 중간 단계로, 모델 학습 과정에서 보이지 않는 데이터에 대한 모델 학습 과정에서 보이지 않는 데이터의 프록시 역할을 합니다. 검증 데이터는 데이터 세트의 고유한 하위 집합으로, 모델의 적합도를 조정하는 동안 모델 구성을 조정하는 동안 모델의 적합성을 편견 없이 평가하는 데 사용되는 데이터 세트의 하위 집합입니다. 주기적으로 모델을 검증 데이터에 대해 테스트함으로써 검증 데이터에 대해 주기적으로 모델을 테스트함으로써 개발자는 시스템이 얼마나 잘 학습하고 있는지 평가할 수 있습니다. 새로운 정보에 대한 일반화 평가할 수 있습니다. 이러한 피드백 루프는 문제를 조기에 파악하고 모델을 최적화하는 데 필수적입니다. 모델을 최적화하는 데 필수적입니다.
유효성 검사 데이터의 주요 기능은 다음과 같습니다. 하이퍼파라미터 튜닝을 용이하게 하는 것입니다. 모델 가중치와 같은 내부 모델 가중치와 같은 내부 파라미터와 달리 학습되는 모델 가중치와 같은 내부 파라미터와 달리, 하이퍼파라미터는 학습률 또는 배치 크기와같은 하이퍼파라미터는 수동으로 설정하거나 실험을 통해 최적화해야 합니다. 엔지니어는 검증 세트를 통해 다양한 모델 아키텍처와 구성을 비교하여 다음을 수행할 수 있습니다. 최종 테스트 세트에 손을 대지 않고도 가장 성능이 좋은 것을 선택할 수 있습니다.
또한 유효성 검사 데이터의 성능을 모니터링하면 과적합을 방지합니다. 과적합은 모델이 학습 데이터의 노이즈와 특정 세부 사항을 학습할 때 발생합니다. 훈련 데이터의 노이즈와 특정 세부 사항을 학습하여 새로운 데이터에 대한 성능을 저하시킬 때 발생합니다. 학습 오류 은 감소하지만 유효성 검사 오류가 증가하면 모델이 일반화 능력을 상실하고 있음을 나타내며 조기 중단과 같은 개입 기술이 필요하다는 신호입니다.
신뢰할 수 있는 평가를 위해 전체 데이터 세트는 일반적으로 세 부분으로 나뉩니다. 각 분할의 각 분할의 구체적인 목적을 이해하는 것은 효과적인 데이터 관리를 위해 데이터 관리.
Ultralytics 에코시스템에서는 유효성 검사가 워크플로에 원활하게 통합됩니다. 데이터 세트 YAML 구성을 정의할 때 사용자는 트레이닝 및 유효성 검사 이미지의 경로를 지정합니다. 그러면 Ultralytics 유효성 검사 모드를 호출하여 다음과 같은 다음과 같은 메트릭을 계산할 수 있습니다. 평균 평균 정밀도(mAP) 유효성 검사 세트.
다음을 사용하여 사전 학습된 YOLO11 모델의 유효성을 검사하는 방법은 다음과 같습니다. Python:
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Validate the model on the 'coco8.yaml' dataset
# The 'data' argument specifies the dataset configuration containing the validation split
metrics = model.val(data="coco8.yaml")
# Display the Mean Average Precision (mAP) at IoU 50-95
print(f"Validation mAP50-95: {metrics.box.map}")
개발자는 유효성 검사 데이터를 통해 정밀도가 가장 중요한 특정 산업에 맞게 모델을 미세 조정할 수 있습니다.
데이터가 부족한 시나리오에서는 정적 유효성 검사 분할로 인해 중요한 학습 데이터가 너무 많이 제거될 수 있습니다. 이러한 이러한 경우 실무자들은 종종 교차 유효성 검사, 특히 K-Fold 교차 유효성 검사. 이 기법은 데이터를 'K'개의 하위 집합으로 분할하고 어떤 하위 집합이 유효성 검사 데이터로 사용되는지 유효성 검사 데이터로 사용됩니다. 이렇게 하면 모든 데이터 포인트가 학습과 검증 모두에 사용되어 통계적으로 더 강력한 모델 성능 추정치를 제공합니다. scikit-learn 교차 검증 설명서를 참조하세요.
유효성 검사 데이터를 올바르게 사용하는 것은 머신 러닝 작업(MLOps)의 초석입니다. 개발자는 학습 프로세스에서 검증 예제를 엄격하게 분리함으로써 모델이 단순히 사실을 암기하는 것이 아니라 사실을 암기하는 것이 아니라 시각적 세계를 해석하는 방법을 진정으로 학습할 수 있습니다.

