Узнайте о влиянии размера пакета (batch size) на глубокое обучение. Эффективно оптимизируйте скорость обучения, использование памяти и производительность модели.
Размер партии является ключевым гиперпараметром в в сфере машинного обучения, который определяет количество обучающих образцов данных, обрабатываемых перед тем, как модель обновляет свои внутренние параметры. Вместо того чтобы анализировать весь набор данных сразу, что часто бывает вычислительно невозможно из-за нехваткипамяти. системы делят данные на более мелкие группы, называемые партиями. Это разделение определяет стабильность процесса обучения стабильность процесса обучения, скорость вычислений и объем памяти, требуемый для GPU во время обучения. Выбор правильного размера партии является балансом между вычислительной эффективностью и качеством сходимости модели сходимости.
Выбор размера партии коренным образом меняет способ обучения нейронной сети. Когда размер партии установлен меньшее значение, модель обновляет свои весовые коэффициенты модели обновляются чаще, что вносит шум в процесс градиентного спуска. Этот шум может быть полезным, часто помогая алгоритму оптимизации избежать локальных минимумов и находить более устойчивые решения, что помогает предотвратить перебор. И наоборот, большие размеры партии обеспечивают более точную оценку градиента, что приводит к более плавным и стабильным обновлениям, хотя они требуют значительно больше аппаратной памяти и иногда могут приводить к "разрыву обобщения", когда модель хорошо работает на обучающих данных, но менее эффективна на невидимых данных.
Аппаратные возможности часто диктуют верхний предел этого параметра. Современные аппаратные ускорители, такие как подробно описанные в Руководство по производительности глубокого обучения отNVIDIA, опираются на параллельные вычисления для обработки больших блоков данных одновременно. Поэтому используйте размер пакета, соответствующий архитектуре процессора - обычно это значения 32, 64 или 128 - может увеличить пропускную способность и сократить общее время обучения на одну эпоху. эпоху.
Понимание того, как настроить этот параметр, необходимо для внедрения эффективных решений на основе ИИ в различных отраслях. отраслях.
При использовании Пакет Ultralytics PythonНастройка размера партии
размер партии очень прост. Сайт batch аргумент позволяет точно указать, сколько изображений модель
перед обновлением весов. Если установить значение -1Библиотека также может использовать
Функция автозапуска чтобы автоматически определить
максимальный размер пакета, который может поддерживать ваше оборудование.
from ultralytics import YOLO
# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model on the COCO8 dataset with a specific batch size
# A batch size of 32 balances speed and memory usage for most standard GPUs
results = model.train(data="coco8.yaml", epochs=50, batch=32)
Для практиков важно отличать "размер партии" от аналогичной терминологии, встречающейся в фреймворках глубокого обучения.