용어집

학습률

학습률이 모델 훈련에 미치는 영향을 알아보세요. Ultralytics 단계 크기를 최적화하여 객체 탐지 등에서 SOTA 성능을 달성하는 방법을 확인하세요.

학습률은 최적화 과정에서 모델이 취하는 단계 크기를 결정하는 중요한 하이퍼파라미터 조정 구성 요소입니다. 신경망 훈련의 맥락에서, 이는 모델이 데이터 배치 하나를 처리할 때마다 추정된 오차에 반응하여 모델의 내부 가중치가 얼마나 업데이트되는지를 제어합니다. 이를 산을 내려가 계곡(오류의 최저점)으로 향하는 사람에 비유해 보자. 학습률은 그 사람의 보폭을 결정한다. 보폭이 너무 크면 계곡을 완전히 넘어서 바닥을 놓칠 수 있다. 보폭이 너무 작으면 목적지에 도달하는 데 비현실적으로 오랜 시간이 걸릴 수 있다.

최적화에서의 "골디락스" 딜레마

최적의 학습률 찾기는 종종 머신러닝 워크플로우 내에서의 균형 잡기 작업으로 묘사됩니다. 목표는 모델의 예측값과 실제 정답값 간의 차이를 측정하는 손실 함수를 최소화하는 것입니다. 이 과정은 손실 지형을 탐색하기 위해 확률적 경사 하강법(SGD)이나 Adam 같은 최적화 알고리즘에 크게 의존합니다.

학습률 너무 높음: 값이 너무 높게 설정되면 모델의 가중치 업데이트가 급격해집니다. 이로 인해 모델이 해에 수렴하지 못하고 대신 격렬하게 진동하거나 발산하는 "과도 현상"이 발생할 수 있습니다. 이러한 불안정성은 때때로 급격한 기울기 폭발 문제를 유발하여 훈련 과정을 무용지물로 만들 수 있습니다.
학습률 너무 낮음: 반대로, 극도로 작은 단계 크기는 모델이 최소값을 향해 신중하게 이동하도록 보장하지만, 훈련 과정이 지독히 느려져서 과소적합을 초래할 수 있습니다. 모델은 효과적으로 국소적 최소값에 갇히거나 간단한 패턴을 학습하는 데 수천 번의 추가 에포크가 소요되어 계산 자원을 낭비할 수 있습니다. 연구자들은 최적화에 관한PyTorch 참고하여 다양한 알고리즘이 이러한 값들과 어떻게 상호작용하는지 이해합니다.

실제 애플리케이션

학습률 조정의 영향은 컴퓨터 비전 작업이 적용되는 다양한 고위험 산업 전반에 걸쳐 명백히 드러난다.

자율주행 시스템: 자율주행 차량 개발 과정에서 엔지니어들은 방대한 데이터셋을 활용해 보행자와 교통 표지판을 식별하는 물체 탐지 모델을 훈련시킵니다. YOLO26과 같은 사전 훈련된 모델에 전이 학습을 적용할 때 개발자들은 일반적으로 초기 훈련 시보다 훨씬 낮은 학습률을 사용합니다. 이러한 "미세 조정"은 모델이 이미 보유한 일반적인 특징 추출 능력을 유지하면서 특정 주행 환경(예: 눈길 대 사막 고속도로)의 미묘한 차이를 학습하도록 보장합니다.
의료 진단 영상: MRI 스캔에서 종양을 탐지하는 것과 같은 의료 영상 분석에서는 정밀도가 가장 중요합니다. 여기서 높은 학습률은 모델이 악성 조직과 양성 조직을 구분하는 미세한 조직 차이를 간과할 위험을 초래합니다. 실무자들은 종종 "학습률 워밍업"이라는 기법을 사용합니다. 이는 학습률을 0에서 목표값까지 점진적으로 증가시켜 훈련 초기 단계를 안정화하고, 공격적인 학습이 시작되기 전에 신경망 가중치가 안정적인 구성으로 정착되도록 보장합니다. 이러한 전략에 대한 자세한 내용은 Google 러닝 크래시 코스에서 확인할 수 있습니다.

Ultralytics YOLO에서 학습률 설정하기

현대적인 프레임워크를 사용할 때, 초기 학습률을 쉽게 조정할 수 있습니다.lr0) 그리고 최종 학습률 분수 (lrf아래는 이를 사용하여 구성하는 방법의 예시입니다. Ultralytics 플랫폼 사용자 정의 훈련 실행을 위한 호환 클라이언트

from ultralytics import YOLO

# Load the YOLO26 model (latest state-of-the-art architecture)
model = YOLO("yolo26n.pt")

# Train the model with a custom initial learning rate
# lr0=0.01 sets the initial rate
# lrf=0.01 sets the final learning rate to (lr0 * lrf)
results = model.train(data="coco8.yaml", epochs=10, lr0=0.01, lrf=0.01)

고급 사용자의 경우, fast.ai에서 대중화한 LR 파인더 ( LR Finder )와 같은 기법은 손실이 발산할 때까지 속도를 지수적으로 증가시키는 짧은 시험 에포크를 실행함으로써 최적의 시작값 발견을 사실상 자동화할 수 있습니다. 이 하이퍼파라미터를 숙달하는 것이 AI 프로젝트에서 SOTA(최첨단) 성능을 달성하는 열쇠가 되는 경우가 많습니다.

학습률

산업 전반의 워크플로우를 간소화하기 위한 Ultralytics YOLO 모델 교육

혁신을 강화하는 유연한 엔터프라이즈 라이선스 솔루션

Ultralytics YOLO 몇 초 만에 AI 모델 훈련하기

최적화에서의 "골디락스" 딜레마

실제 애플리케이션

관련 용어 차별화

Ultralytics YOLO에서 학습률 설정하기

이 카테고리에서 더 읽어보기

컴퓨터 비전으로 구현된 12가지 항공 이미지 활용 사례

단안 깊이 추정이란 무엇인가? 개요

Ultralytics YOLO 활용한 AI 위협 탐지 기술 분석

Ultralytics 커뮤니티 가입