Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Скорость обучения

Освойте искусство установки оптимальной скорости обучения в ИИ! Узнайте, как этот важный гиперпараметр влияет на обучение и производительность модели.

Скорость обучения - это настраиваемыйгиперпараметр используемый при обучении нейронныхсетей, который контролирует, насколько сильно изменять модель в зависимости от предполагаемой ошибки каждый раз, когдаобновляются веса модели обновляются. По сути, он определяет размер шага на каждой итерации при движении к минимумуфункции потерь. Если представить процесс обучения как спуск с туманной горы к долине (оптимальному состоянию), то скорость обучения определяет длину каждого шага. Это один из наиболее важных параметров, который необходимо настраивать, поскольку он напрямую влияет на скорость сходимости и на то, сможет ли модель успешно найти оптимальное решение.

Влияние скорости обучения на тренировки

Выбор правильной скорости обучения часто является сложной задачей. Выбранное значение существенно влияет на динамику обучения динамику:

  • Слишком высокая: Если скорость обучения установлена слишком высокой, модель может делать слишком большие шаги, постоянно превышая оптимальные веса. Это может привести к нестабильному обучению, когда потери колеблются или даже расходятся (увеличиваются), не позволяя модели сходиться.
  • Слишком низкая скорость обучения: наоборот, слишком низкая скорость обучения приведет к очень маленьким обновлениям. Хотя это гарантирует, что модель не пропустит минимум, это делаетпроцессобучения болезненно медленным. Кроме того, повышается риск застревания в локальных минимумах - субоптимальных долинах в ландшафте потерь. ландшафта, что приводит кухудшению подгонки.

В большинстве современных рабочих процессов обучения используютсяпланировщики скорости обучения, которые динамически регулируют скорость в процессе обучения. Общая стратегия включает периоды "разогрева", когда скорость скорость начинается с низкого уровня и увеличивается, затем следуют фазы "затухания", когда она постепенно уменьшается, чтобы обеспечить возможность тонкой настройки весов по мере приближения модели к сходимости.

Настройка скорости обучения в Ultralytics

В рамках Ultralytics вы можете легко настроить начальную скорость обучения (lr0) и конечная скорость обучения (lrf) в качестве аргументов при обучении модели. Такая гибкость позволяет вам экспериментировать с различными значениями для конкретного набора данных.

from ultralytics import YOLO

# Load the recommended YOLO11 model
model = YOLO("yolo11n.pt")

# Train on COCO8 with a custom initial learning rate
# 'lr0' sets the initial learning rate (default is usually 0.01)
results = model.train(data="coco8.yaml", epochs=100, lr0=0.01)

Применение в реальном мире

Выбор скорости обучения играет ключевую роль в развертывании надежных решений ИИ в различных отраслях:

  1. Анализ медицинских изображений:В В таких ответственных областях, какAIв здравоохранении, модели обучаются для detect аномалий, таких как опухоли на снимках МРТ. В этом случае необходимо тщательно подбирать скорость обучения, чтобы чтобы модель обучалась сложным закономерностям без чрезмерной адаптации к шуму. Например, при обучении моделиYOLO11 моделидля обнаружения опухолей, исследователи часто используют более низкую скорость обучения с планировщиком, чтобы максимизироватьточность и надежности, что подтверждается различнымиисследованиями в области радиологии.
  2. Автономные транспортные средства:Для Для обнаружения объектов в самоуправляемых автомобилях модели должны распознавать пешеходов, знаки и другие транспортные средства в различных условиях. Обучение на массивных наборах данных, таких какWaymoOpen Dataset требуется оптимизированная скорость обучения, чтобы справиться с огромной вариативностью данных. Адаптивная скорость обучения помогает модели быстрее сходиться на начальных этапах и уточнять свои прогнозы пограницам на более поздних этапах, способствуя повышению безопасностиAIв автомобильныхсистемах. системах.

Скорость обучения и связанные понятия

Чтобы эффективно настроить модель, полезно отличать скорость обучения от связанных с ней терминов:

  • Размер партии: В то время как скорость обучения контролирует размер шага, размер партии определяет , сколько образцов данных используется для вычисления градиента для этого шага. Между ними часто существует взаимосвязь: большие размеры партии обеспечивают более стабильные градиенты, что позволяет повысить скорость обучения. Эта взаимосвязь рассматривается вправилеLinear Scaling Rule.
  • Алгоритм оптимизации:Оптимизатор (например, SGD илиAdam) - это конкретный метод, используемый для обновления весов. Скорость обучения - это параметр , используемый оптимизатором. Например, Adam адаптирует скорость обучения для каждого параметра в отдельности, в то время как стандартный SGD применяет фиксированная скорость для всех.
  • Эпоха:Эпоха определяет один полный проход через весьнабор данных для обучения. Скорость обучения определяет, сколько модель учится на каждом шаге в течение эпохи, а количество эпох определяет продолжительность процесса обучения.

Для более глубокого понимания динамики оптимизации можно воспользоваться такими ресурсами, какзаметкиСтэнфордаCS231n дают прекрасные наглядные объяснения того, как скорость обучения влияет на ландшафты потерь.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас