Глоссарий

Скорость обучения

Освойте искусство установки оптимальной скорости обучения в ИИ! Узнайте, как этот важный гиперпараметр влияет на обучение и производительность модели.

Скорость обучения - это настраиваемыйгиперпараметр используемый при обучении нейронныхсетей, который контролирует, насколько сильно изменять модель в зависимости от предполагаемой ошибки каждый раз, когдаобновляются веса модели обновляются. По сути, он определяет размер шага на каждой итерации при движении к минимумуфункции потерь. Если представить процесс обучения как спуск с туманной горы к долине (оптимальному состоянию), то скорость обучения определяет длину каждого шага. Это один из наиболее важных параметров, который необходимо настраивать, поскольку он напрямую влияет на скорость сходимости и на то, сможет ли модель успешно найти оптимальное решение.

Влияние скорости обучения на тренировки

Выбор правильной скорости обучения часто является сложной задачей. Выбранное значение существенно влияет на динамику обучения динамику:

Слишком высокая: Если скорость обучения установлена слишком высокой, модель может делать слишком большие шаги, постоянно превышая оптимальные веса. Это может привести к нестабильному обучению, когда потери колеблются или даже расходятся (увеличиваются), не позволяя модели сходиться.
Слишком низкая скорость обучения: наоборот, слишком низкая скорость обучения приведет к очень маленьким обновлениям. Хотя это гарантирует, что модель не пропустит минимум, это делаетпроцессобучения болезненно медленным. Кроме того, повышается риск застревания в локальных минимумах - субоптимальных долинах в ландшафте потерь. ландшафта, что приводит кухудшению подгонки.

В большинстве современных рабочих процессов обучения используютсяпланировщики скорости обучения, которые динамически регулируют скорость в процессе обучения. Общая стратегия включает периоды "разогрева", когда скорость скорость начинается с низкого уровня и увеличивается, затем следуют фазы "затухания", когда она постепенно уменьшается, чтобы обеспечить возможность тонкой настройки весов по мере приближения модели к сходимости.

Настройка скорости обучения в Ultralytics

В рамках Ultralytics вы можете легко настроить начальную скорость обучения (lr0) и конечная скорость обучения (lrf) в качестве аргументов при обучении модели. Такая гибкость позволяет вам экспериментировать с различными значениями для конкретного набора данных.

from ultralytics import YOLO

# Load the recommended YOLO11 model
model = YOLO("yolo11n.pt")

# Train on COCO8 with a custom initial learning rate
# 'lr0' sets the initial learning rate (default is usually 0.01)
results = model.train(data="coco8.yaml", epochs=100, lr0=0.01)

Применение в реальном мире

Выбор скорости обучения играет ключевую роль в развертывании надежных решений ИИ в различных отраслях:

Анализ медицинских изображений:В В таких ответственных областях, какAIв здравоохранении, модели обучаются для detect аномалий, таких как опухоли на снимках МРТ. В этом случае необходимо тщательно подбирать скорость обучения, чтобы чтобы модель обучалась сложным закономерностям без чрезмерной адаптации к шуму. Например, при обучении моделиYOLO11 моделидля обнаружения опухолей, исследователи часто используют более низкую скорость обучения с планировщиком, чтобы максимизироватьточность и надежности, что подтверждается различнымиисследованиями в области радиологии.
Автономные транспортные средства:Для Для обнаружения объектов в самоуправляемых автомобилях модели должны распознавать пешеходов, знаки и другие транспортные средства в различных условиях. Обучение на массивных наборах данных, таких какWaymoOpen Dataset требуется оптимизированная скорость обучения, чтобы справиться с огромной вариативностью данных. Адаптивная скорость обучения помогает модели быстрее сходиться на начальных этапах и уточнять свои прогнозы пограницам на более поздних этапах, способствуя повышению безопасностиAIв автомобильныхсистемах. системах.