Yolo 비전 선전
선전
지금 참여하기
용어집

배치 크기

딥 러닝에서 배치 크기가 미치는 영향을 알아보고, 학습 속도, 메모리 사용량 및 모델 성능을 효율적으로 최적화하는 방법을 알아보세요.

배치 크기는 머신 러닝 영역에서 중요한 하이퍼파라미터로 머신러닝 영역에서 중요한 하이퍼파라미터로 처리되는 학습 데이터 샘플의 수를 결정하는 모델이 내부 파라미터를 업데이트하기 전에 처리하는 학습 데이터 샘플 수를 결정하는 중요한 하이퍼파라미터입니다. 전체 데이터 세트를 한 번에 분석하는 대신(종종 메모리 제한으로 인해 계산적으로 메모리 제한으로 인해 불가능한 경우가 많은 딥러닝 프레임워크는 데이터를 배치라고 하는 작은 그룹으로 나눕니다. 이 분할은 학습 과정의 안정성, 계산 속도, 학습 과정의 안정성 프로세스, 계산 속도, 필요한 메모리 양을 결정합니다. GPU 를 결정합니다. 올바른 배치 크기를 선택하면 올바른 배치 크기를 선택하는 것은 계산 효율성과 모델의 품질 사이의 균형을 맞추는 역할을 합니다. 균형을 맞추는 역할을 합니다.

교육 역학에 미치는 영향

배치 크기를 선택하면 신경망의 학습 방식이 근본적으로 변경됩니다. 신경망이 학습하는 방식을 근본적으로 변경합니다. 배치 크기를 더 낮은 값으로 설정하면 를 더 낮은 값으로 설정하면 모델은 모델 가중치를 더 자주 업데이트하여 경사 하강 프로세스에 노이즈를 도입합니다. 이 노이즈는 최적화 알고리즘이 국부적 최소값을 벗어나는 데 도움이 되는 로컬 최소값을 벗어나 더 강력한 솔루션을 찾는 데 도움이 될 수 있습니다. 과적합을 방지합니다. 반대로 배치 크기가 클수록 이 클수록 기울기를 더 정확하게 추정할 수 있어 더 부드럽고 안정적인 업데이트가 가능하지만, 하드웨어 메모리가 훨씬 더 많은 하드웨어 메모리가 필요하며 때때로 모델이 훈련 데이터에서는 잘 작동하지만 훈련 데이터에서는 잘 작동하지만 보이지 않는 데이터에서는 덜 효과적으로 작동하는 '일반화 격차'가 발생할 수 있습니다.

하드웨어 성능에 따라 이 매개변수의 상한이 결정되는 경우가 많습니다. 다음과 같은 최신 하드웨어 가속기는 에 자세히 설명된 NVIDIA 딥 러닝 성능 가이드에 설명된 것과 같은 최신 하드웨어 가속기는 병렬 컴퓨팅을 사용하여 대량의 데이터 블록을 병렬 컴퓨팅에 의존합니다. 따라서 프로세서의 아키텍처와 일치하는 배치 크기(일반적으로 32, 64, 128 또는 256과 같은 32, 64, 128 등 프로세서 아키텍처에 맞는 배치 크기를 사용하면 처리량을 극대화하고 에포크당 에포크당

실제 애플리케이션

이 매개변수를 조정하는 방법을 이해하는 것은 다양한 산업에 효과적인 AI 솔루션을 배포하는 데 산업 전반에 걸쳐

  1. 고해상도 의료 영상: In 의료 분야의 AI 모델은 종종 다음과 같은 작업을 수행합니다. 종양과 같은 이상 징후를 식별하기 위해 상세한 CT 스캔이나 MRI를 분석하는 작업을 수행합니다. 이러한 이미지는 파일 크기가 방대합니다. 많은 이미지를 동시에 처리하려고 시도하면 가장 강력한 하드웨어의 비디오 메모리(VRAM)를 초과할 수 있습니다. 하드웨어를 초과하게 됩니다. 따라서 의료진은 매우 작은 배치 크기(예: 1 또는 2)를 사용하여 충돌 없이 쉽게 충돌 없이 의료 영상 분석 원시 훈련 속도보다 고충실도 데이터를 처리할 수 있는 기능을 우선시합니다.
  2. 실시간 제조 검사: 반대로, 스마트 제조 환경에서는 스마트 제조 환경에서는 속도가 중요합니다. 컨베이어 벨트의 자동화된 육안 검사 시스템은 시간당 수천 개의 회로 기판 이미지를 캡처할 수 있습니다. 시간당 수천 개의 회로 이미지를 캡처할 수 있습니다. 추론 단계(생산 결함 감지)에서 시스템은 다음을 사용할 수 있습니다. 일괄 추론을 사용하여 들어오는 이미지를 그룹화하고 병렬로 처리할 수 있습니다. 이는 컴퓨터 비전 시스템의 처리량을 최대화하여 컴퓨터 비전 시스템의 처리량을 최대화하여 빠른 생산 라인과 보조를 맞출 수 있습니다.

Ultralytics 배치 크기 구성

사용 시 Ultralytics Python 패키지를 사용하여 배치 크기를 설정하는 것은 간단합니다. 배치 크기는 batch 인수를 사용하면 가중치를 업데이트하기 전에 모델에 표시할 이미지 수 이 가중치를 업데이트하기 전에 표시해야 하는 이미지 수를 지정할 수 있습니다. 로 설정하면 -1라이브러리는 또한 자동 배치 기능 를 사용하여 하드웨어가 지원할 수 있는 하드웨어가 지원할 수 있는 최대 배치 크기를 자동으로 결정합니다.

from ultralytics import YOLO

# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 dataset with a specific batch size
# A batch size of 32 balances speed and memory usage for most standard GPUs
results = model.train(data="coco8.yaml", epochs=50, batch=32)

관련 개념 구분하기

실무자는 "배치 크기"를 다음과 같은 유사한 용어와 구별하는 것이 중요합니다. 유사한 용어와 구별하는 것이 중요합니다.

  • 배치 크기 대 에포크: 에포크는 전체 학습 데이터 세트에 대한 전체 트레이닝 데이터 세트. 배치 크기에 따라 해당 단일 에포크 내에서 데이터를 데이터가 얼마나 많은 청크로 분할되는지를 결정합니다. 예를 들어 샘플이 1,000개이고 배치 크기가 배치 크기가 100인 경우, 하나의 에포크를 완료하는 데 10번의 반복이 필요합니다.
  • 배치 크기와 배치 정규화 비교: 이름은 같지만 배치 노멀라이제이션은 특정 레이어 레이어 입력을 정규화하여 안정성을 향상시키는 데 사용되는 기술입니다. 배치 노멀라이제이션의 효과는 배치 크기에 따라 달라질 수 있지만 배치 크기에 따라 달라질 수 있지만(정확한 통계를 계산하려면 충분히 큰 배치가 필요함), 이는 네트워크 아키텍처의 구조적 네트워크 아키텍처의 구조적 구성 요소입니다.
  • 훈련과 추론 일괄 처리: 훈련 중에는 가중치를 학습하는 것이 목표입니다. 추론 중에는 일괄 처리는 순전히 속도 최적화를 위한 것입니다. 다음과 같이 지연 시간에 민감한 애플리케이션의 경우 자율 주행 차량과 같은 지연 시간에 민감한 애플리케이션의 경우, 배치 크기 1은 즉각적인 응답을 얻기 위해 배치 크기 1을 사용하는 경우가 많습니다. 데이터 분석 작업에서는 대량의 배치를 사용하여 대규모 배치를 사용할 수 있습니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기