용어집

모델 가중치

머신 러닝에서 모델 가중치의 중요성, 예측에서 모델 가중치의 역할, 그리고 Ultralytics YOLO가 어떻게 AI 작업에 가중치를 사용하는 것을 간소화하는지 알아보세요.

모델 가중치는 학습 과정에서 조정되는 신경망 내의 수치 매개변수입니다. 이 값은 기본적으로 모델의 학습된 지식을 나타냅니다. 매우 복잡한 방정식의 계수라고 생각하면 되는데, 이러한 계수를 조정함으로써 모델은 이미지와 같은 입력 데이터를 물체 주변의 경계 상자 같은 원하는 출력에 매핑하는 방법을 학습하게 됩니다. 모델의 가중치의 품질은 이미지 분류나 물체 감지와 같은 특정 작업에서 모델의 성능을 직접적으로 결정합니다.

가중치 결정 방법

모델 가중치는 수동으로 설정하는 것이 아니라 데이터에서 '학습'됩니다. 이 과정은 가중치를 작은 난수로 초기화하는 것으로 시작됩니다. 학습 중에 모델은 학습 데이터에 대해 예측을 하고 손실 함수는 이러한 예측이 얼마나 틀렸는지 계산합니다. 그런 다음 이 오류 신호는 역전파라는 프로세스에서 각 가중치에 대한 손실의 기울기를 계산하는 데 사용됩니다. 그런 다음 확률적 경사 하강(SGD)과 같은 최적화 알고리즘을 통해 경사 반대 방향으로 가중치를 조정하여 오차를 최소화합니다. 이 과정은 별도의 검증 데이터 세트에서 모델의 성능이 더 이상 개선되지 않을 때까지 여러 차례 반복되며, 이는 모델이 데이터의 패턴을 학습했다는 신호입니다.

사전 훈련된 웨이트의 중요성

최첨단 모델을 처음부터 훈련하려면 엄청난 연산 자원과 방대한 데이터 세트가 필요합니다. 이를 극복하기 위해 컴퓨터 비전 커뮤니티에서는 사전 학습된 가중치를 널리 사용합니다. 여기에는 COCO와 같은 대규모 범용 데이터 세트에 대해 이미 학습된 모델(예: Ultralytics YOLO 모델)을 사용하는 것이 포함됩니다. 이러한 가중치는 전이 학습이라는 프로세스를 통해 새롭고 구체적인 작업을 위한 훌륭한 출발점 역할을 합니다. 사전 학습된 가중치로 시작하면 미세 조정이라는 프로세스를 통해 더 적은 데이터와 더 짧은 학습 시간으로 더 높은 정확도를 달성할 수 있습니다.

실제 애플리케이션

  • 의료 이미지 분석: 개발자는 사전 학습된 가중치가 포함된 YOLOv8 모델을 가져와 맞춤형 뇌종양 스캔 데이터 세트에 맞게 미세 조정할 수 있습니다. 결과 모델에는 종양의 미묘한 패턴을 식별하도록 특별히 최적화된 가중치가 적용되어 영상의학과 전문의의 진단을 돕습니다. 이는 의료 분야에서 AI의 핵심 응용 분야입니다.
  • 소매 재고 관리: 소매업체는 모델을 사용하여 진열대를 모니터링하고 제품을 계산할 수 있습니다. 물체 감지 모델은 매장의 제품 이미지에 따라 미세 조정됩니다. 최종 가중치를 통해 모델은 자동화된 재고 추적을 위해 특정 품목을 정확하게 감지하고 계산할 수 있습니다.

가중치 및 관련 개념

머신 러닝에서 모델 가중치를 다른 관련 용어와 구별하는 것이 중요합니다:

  • 하이퍼파라미터: 학습되는 가중치와 달리 하이퍼파라미터는 학습이 시작되기 전에 구성됩니다. 예를 들어 학습 속도, 배치 크기, 최적화 도구 선택 등이 있습니다. 최적의 하이퍼파라미터 구성을 찾는 과정을 하이퍼파라미터 튜닝이라고 합니다.
  • 편향: 가중치와 바이어스는 모두 학습된 파라미터입니다. 하지만 가중치는 뉴런의 출력을 조절하는 반면 편향 용어는 뉴런의 출력을 이동시킵니다. 이 두 가지를 함께 사용하면 신경망에 데이터에 맞는 유연성을 부여할 수 있습니다.
  • 모델 아키텍처: 아키텍처(예: 백본 또는 탐지 헤드)는 모델의 청사진으로, 레이어와 레이어가 연결되는 방식을 정의합니다. 가중치는 해당 구조 내의 값입니다. 동일한 아키텍처도 학습 방법에 따라 수많은 가중치 세트를 가질 수 있습니다. 다양한 모델을 비교하여 아키텍처가 어떻게 다른지 살펴볼 수 있습니다.

가중치 관리 및 추적

모델이 더욱 복잡해짐에 따라 가중치와 이를 생성하는 실험을 관리하는 것은 재현성과 협업을 위해 매우 중요해졌습니다. 가중치 및 편향(W&B) 과 같은 도구는 팀이 각 실험에 대한 하이퍼파라미터, 메트릭, 코드 버전 및 결과 모델 가중치를 추적할 수 있는 MLOps 전용 플랫폼을 제공합니다. '가중치 및 편향'은 신경망 내의 매개변수인 '가중치'와 '편향'의 개념과는 구별되며, 이 플랫폼은 최적의 가중치와 편향을 찾는 프로세스를 관리하는 데 도움이 된다는 점에 유의하는 것이 중요합니다. 문서에서 Ultralytics와 W&B의 통합에 대해 자세히 알아볼 수 있습니다. 효율적인 관리는 하이퍼파라미터 튜닝부터 PyTorch 또는 TensorFlow와 같은 프레임워크를 사용한 모델 배포에 이르기까지 다양한 작업의 핵심입니다. 또한, 전체 모델 수명 주기를 관리하기 위한 통합 솔루션을 제공하는 플랫폼도 있습니다.

울트라 애널리틱스 커뮤니티 가입

AI의 미래와 함께하세요. 글로벌 혁신가들과 연결, 협업, 성장하기

지금 가입하기
링크가 클립보드에 복사됨