Yolo 비전 선전
선전
지금 참여하기
용어집

모델 가중치

머신 러닝에서 모델 가중치의 중요성, 예측에서 모델 가중치의 역할, 그리고 Ultralytics YOLO 어떻게 AI 작업에 가중치를 사용하는 것을 간소화하는지 알아보세요.

모델 가중치는 신경망 내에서 학습 가능한 기본 파라미터로 입력 데이터를 의미 있는 예측으로 변환하는 의미 있는 예측으로 변환합니다. 생물학적 뇌의 시냅스 강도와 유사하게 작동하는 이 수치들은 값은 특정 입력 기능이 네트워크의 출력에 얼마나 많은 영향을 미치는지를 결정합니다. 모델이 이미지나 텍스트와 같은 이미지나 텍스트와 같은 정보를 처리할 때 입력 데이터에 이러한 가중치가 레이어별로 곱해집니다. 이러한 가중치 신호의 최종 가중치가 적용된 신호의 조합은 다음과 같은 결과를 생성합니다. 이미지 분류, 언어 번역 또는 비디오 스트림에서 객체를 식별합니다.

모델 가중치 학습 방법

가중치는 정적인 것이 아니라 트레이닝 과정에서 다듬어진 트레이닝 과정에서 다듬어지는 동적 값입니다. 처음에 모델은 무작위 가중치로 시작합니다. 가중치로 시작하므로 예측은 본질적으로 추측에 불과합니다. 지도 학습이라고 알려진 지도 학습이라는 주기를 통해 모델은 예측을 레이블이 지정된 학습 데이터 세트와 비교합니다. A 라는 수학 공식 손실 함수는 오차(예측과 실제 진실 사이의 차이 오차, 즉 예측과 실제 진실 사이의 차이를 계산합니다.

이 오류를 최소화하기 위해 이 모델은 다음과 같은 최적화 알고리즘을 사용합니다. 확률적 그라디언트 하강(SGD) 또는 Adam 같은 최적화 알고리즘을 사용합니다. 이 알고리즘은 역전파를 통해 그라데이션을 계산합니다. 역전파를 통해 기울기를 계산하여 각각의 가중치를 늘리거나 줄여 다음 반복에서 오류를 줄이는 방법을 정확히 결정합니다. 이 주기는 여러 시대에 걸쳐 가중치가 최적의 상태로 수렴할 때까지 여러 번에 걸쳐 반복됩니다. 상태로 수렴할 때까지 이 사이클이 여러 시대에 걸쳐 반복됩니다.

핵심 개념 차별화

모델 가중치를 완전히 이해하려면 다음에서 관련 용어와 구분하는 것이 도움이 됩니다. 머신 러닝의 관련 용어와 구별하는 것이 도움이 됩니다:

  • 편견: 가중치는 변환의 가파른 정도나 스케일을 제어하는 반면, 편향은 활성화 함수를 왼쪽 또는 오른쪽으로 이동시킬 수 있습니다. 가중치와 weights and biases 함께 사용하면 네트워크가 복잡한 비선형 데이터 패턴에 맞출 수 있습니다.
  • 하이퍼파라미터: 가중치는 데이터에서 학습되는 반면, 하이퍼파라미터는 학습이 시작되기 전에 구성되는 구조적 설정입니다. 예를 들면 학습 속도 배치 크기, 네트워크의 레이어 수 등이 있습니다.
  • 모델 아키텍처: 아키텍처는 네트워크의 청사진 또는 골격 역할을 하며(예: ResNet 또는 트랜스포머), 뉴런의 연결 방식을 정의합니다. 뉴런이 연결되는 방식을 정의합니다. 가중치는 해당 구조 내에 저장된 특정 값입니다.

이전 학습의 힘

모델을 처음부터 학습하려면 방대한 데이터 세트와 상당한 상당한 컴퓨팅 리소스가 필요합니다. 이 문제를 해결하기 위해 개발자는 종종 미리 학습된 가중치를 사용합니다. 여기에는 다음과 같은 모델이 포함됩니다. YOLO11과 같은 모델을 사용하는데, 이 모델은 이미 대규모 데이터 세트에서 풍부한 기능 표현을 이미 학습한 COCO와 같은 대규모 데이터에서 이미 학습한 풍부한 특징 표현을 새로운 문제에 적용합니다.

전이 학습으로 알려진 이 기술을 사용하면 으로 알려진 이 기술을 사용하면 작은 규모의 사용자 지정 데이터 세트. 사전 학습된 가중치는 모델이 가장자리, 텍스처, 모양을 즉시 인식할 수 있도록 '헤드 스타트'를 제공하므로 학습 속도가 빨라집니다, 텍스처 및 모양을 즉시 인식할 수 있어 학습 속도가 빨라지고 성능이 향상됩니다.

다음 Python 스니펫은 사전 학습된 특정 가중치를 YOLO11 모델에 로드하여 즉각적인 오브젝트 감지 객체를 감지하는 방법을 보여줍니다.

from ultralytics import YOLO

# Load the YOLO11 model with pre-trained weights (learned on COCO)
model = YOLO("yolo11n.pt")

# Run inference on an image using the loaded weights
# The weights determine the model's ability to recognize the bus
results = model("https://ultralytics.com/images/bus.jpg")

# Display the resulting bounding boxes and classes
results[0].show()

실제 애플리케이션

최적화된 모델 가중치의 실질적인 유용성은 다음과 같은 다양한 산업 분야에서 분명하게 드러납니다. AI 솔루션이 배포되는 산업 전반에 걸쳐

  • 의료 분야의 AI: 영상의학과 전문의는 의료 영상에 가중치가 미세 조정된 모델을 사용하여 진단을 지원합니다. 예를 들어, 모델 은 MRI 스캔에서 뇌종양을 식별할 수 있습니다. 이 특정 모델의 이 특정 모델의 가중치는 건강한 조직과 이상 조직 사이의 미묘한 조직적 차이를 구별하는 방법을 학습했습니다. 미묘한 조직적 차이를 구별하는 방법을 학습하여 진단의 신뢰도를 높이는 2차 의견을 제공합니다.
  • 스마트 리테일 시스템: 소매업체는 컴퓨터 비전을 활용하여 계산대 프로세스를 자동화합니다. 제품 포장에 대해 학습된 모델 무게가 장착된 카메라 시스템은 계산대에 놓인 상품을 즉시 카운터에 놓인 상품을 즉시 인식할 수 있습니다. 이 애플리케이션은 시리얼 상자의 색상과 로고와 같은 시각적 입력을 매핑하는 추의 기능에 의존합니다. 시리얼 상자의 색상 및 로고와 같은 시각적 입력을 올바른 제품 SKU에 매핑하여 재고 관리.

모델 가중치의 미래

연구가 진행됨에 따라 가중치를 처리하는 방식도 계속 발전하고 있습니다. 다음과 같은 기술은 모델 양자화 같은 기술은 가중치(예: 32비트 부동 소수점에서 8비트 정수로)의 정밀도를 낮춰 파일 크기를 줄이고 정확도를 크게 떨어뜨리지 않으면서 에지 디바이스에서 정확도를 크게 떨어뜨리지 않고도 추론 속도를 높일 수 있습니다. 또한, YOLO26과 같은 향후 아키텍처의 목표는 다음과 같습니다. 기본적으로 더 효율적인 모델을 생성하여 학습된 가중치가 매개변수당 가능한 최고 수준의 매개변수당 최고의 성능을 제공합니다.

이러한 파일을 효율적으로 관리하는 것도 중요합니다. 다음과 같은 플랫폼은 팀에서 모델 가중치를 버전 관리, track 및 배포할 수 있도록 해주는 가중치를 원활하게 버전 관리, 추적 및 배포하여 항상 가장 성능이 좋은 모델 버전이 프로덕션 환경에 적용되도록 보장합니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기