데이터 증강을 통해 머신러닝 모델을 개선하세요. 정확도를 높이고, 과적합을 줄이며, 견고성을 향상시키는 기법을 알아보세요.
데이터 증강은 다음과 같은 분야에서 전략적 기법입니다. 머신러닝(ML) 의 전략적 기술입니다. 인위적으로 데이터의 크기와 다양성을 확장하는 데 사용되는 전략적 기법입니다. 훈련 데이터 세트 새로운 원시 데이터를 수집할 필요 없이 새로운 원시 데이터를 수집하지 않아도 됩니다. 개발자는 기존 데이터 샘플에 다양한 변환을 적용하여 이미지, 텍스트 또는 오디오의 수정되었지만 이미지, 텍스트 또는 오디오의 사실적인 버전을 만들 수 있습니다. 이 프로세스는 다음을 줄이는 데 필수적입니다. 과적합즉, 모델이 일반화 가능한 패턴을 학습하는 대신 훈련 예제를 암기하는 일반적인 문제를 줄이는 데 필수적입니다. 궁극적으로 효과적인 증강은 더 높은 정확도 정확도를 높이고 실제 환경에서 보이지 않는 데이터에 노출되었을 때 강력하게 작동합니다.
다음 분야에서 컴퓨터 비전(CV)증강에는 입력 이미지를 조작하여 다양한 조건을 시뮬레이션하는 작업이 포함됩니다. 이러한 변환을 통해 모델이 방향, 조명 및 스케일의 변화에 변하지 않도록 합니다.
데이터 증강은 고품질 데이터를 확보하기 어렵거나 비용이 많이 드는 산업에서 필수적인 요소입니다.
그리고 ultralytics 라이브러리를 사용하면 증강 기능 적용을 간소화할 수 있습니다.
모델 학습 파이프라인. 하이퍼파라미터를 조정하여
하이퍼파라미터를 조정하여 변환의 강도와 확률을 제어할 수 있습니다.
from ultralytics import YOLO
# Load the YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model with custom data augmentation parameters
# These arguments modify the training data on-the-fly
model.train(
data="coco8.yaml",
epochs=5,
degrees=30.0, # Apply random rotations between -30 and +30 degrees
fliplr=0.5, # 50% probability of flipping images horizontally
mosaic=1.0, # Use Mosaic augmentation (combining 4 images)
mixup=0.1, # Apply MixUp augmentation with 10% probability
)
데이터 증강을 유사한 데이터 전략과 차별화하는 것이 중요합니다:
최신 증강 라이브러리에 대해 자세히 알아보고 싶다면 문서화 문서 에서 PyTorch 및 YOLO11과 호환되는 광범위한 목록 사용 가능한 변환의 광범위한 목록을 제공합니다.

