머신 러닝에서 모델 가중치가 갖는 중요성, 예측에서의 역할, Ultralytics YOLO가 AI 작업을 위해 모델 가중치 사용을 어떻게 간소화하는지 알아보세요.
모델 가중치는 학습 과정에서 조정되는 신경망 내의 수치 매개변수입니다. 이러한 값은 기본적으로 모델이 학습한 지식을 나타냅니다. 이를 매우 복잡한 방정식의 계수로 생각하십시오. 이러한 계수를 조정함으로써 모델은 이미지와 같은 입력 데이터를 객체 주변의 바운딩 박스와 같은 원하는 출력에 매핑하는 방법을 학습합니다. 모델 가중치의 품질은 이미지 분류 또는 객체 감지와 같은 주어진 작업에서 모델의 성능을 직접적으로 결정합니다.
모델 가중치는 수동으로 설정되지 않고 데이터로부터 '학습'됩니다. 이 과정은 가중치를 작은 임의의 숫자로 초기화하는 것으로 시작됩니다. 학습하는 동안 모델은 학습 데이터에 대해 예측을 수행하고, 손실 함수는 이러한 예측이 얼마나 잘못되었는지 계산합니다. 그런 다음 이 오류 신호는 역전파라는 프로세스에서 사용되어 각 가중치에 대한 손실의 기울기를 계산합니다. Stochastic Gradient Descent(SGD)와 같은 최적화 알고리즘은 오류를 최소화하기 위해 기울기의 반대 방향으로 가중치를 조정합니다. 이 주기는 별도의 검증 데이터 세트에 대한 모델의 성능이 향상되지 않을 때까지 여러 epoch 동안 반복되며, 이는 데이터의 패턴을 학습했다는 신호입니다.
최첨단 모델을 처음부터 학습하려면 막대한 컴퓨팅 자원과 대규모 데이터 세트가 필요합니다. 이를 극복하기 위해 컴퓨터 비전 커뮤니티는 사전 훈련된 가중치를 널리 사용합니다. 여기에는 COCO와 같은 대규모 범용 데이터 세트에서 이미 훈련된 Ultralytics YOLO 모델과 같은 모델을 사용하는 것이 포함됩니다. 이러한 가중치는 전이 학습이라는 프로세스를 통해 새롭고 특정 작업에 대한 훌륭한 시작점이 됩니다. 사전 훈련된 가중치로 시작하면 미세 조정이라는 프로세스를 통해 더 적은 데이터와 더 짧은 학습 시간으로 더 높은 정확도를 얻을 수 있습니다.
모델 가중치를 머신 러닝의 다른 관련 용어와 구별하는 것이 중요합니다.
모델이 복잡해짐에 따라 모델의 가중치와 이를 생성하는 실험을 관리하는 것은 재현성과 협업에 매우 중요합니다. Weights & Biases(W&B)와 같은 도구는 MLOps를 위한 플랫폼을 특별히 제공하여 팀이 각 실험에 대한 하이퍼파라미터, 메트릭, 코드 버전 및 결과 모델 가중치를 추적할 수 있도록 합니다. "Weights & Biases" 플랫폼은 신경망 내의 파라미터로서의 "가중치" 및 "편향" 개념과는 별개입니다. 이 플랫폼은 최적의 가중치와 편향을 찾는 과정을 관리하는 데 도움이 됩니다. Ultralytics와 W&B를 통합하는 방법에 대한 자세한 내용은 설명서에서 확인할 수 있습니다. 효율적인 관리는 하이퍼파라미터 튜닝에서 모델 배포에 이르기까지 PyTorch 또는 TensorFlow와 같은 프레임워크를 사용하는 작업에 매우 중요합니다. Ultralytics HUB와 같은 플랫폼은 전체 모델 수명 주기를 관리하기 위한 통합 솔루션도 제공합니다.