Настраивайтесь на YOLO Vision 2025!
25 сентября 2025 г.
10:00 — 18:00 BST
Гибридное мероприятие
Yolo Vision 2024
Глоссарий

Эпоха

Узнайте об эпохах в машинном обучении — как они влияют на обучение модели, предотвращают переобучение и оптимизируют производительность с помощью Ultralytics YOLO.

В машинном обучении (ML) эпоха представляет собой один полный проход всего набора обучающих данных через алгоритм обучения. Это фундаментальная концепция в итеративном процессе обучения нейронных сетей (NN), где модели учатся, многократно просматривая примеры из данных. Количество эпох является ключевым параметром, который определяет, сколько раз модель будет учиться на полном наборе обучающей информации, что напрямую влияет на конечную производительность и качество модели.

Роль эпох в обучении модели

Основная цель обучения модели — дать модели возможность изучать закономерности из данных. Это достигается путем настройки внутренних параметров модели, известных как веса модели, для минимизации функции потерь, которая количественно определяет ошибку между прогнозами модели и фактической основной истиной. Во время одной эпохи модель обрабатывает каждый образец данных, и алгоритм оптимизации, такой как стохастический градиентный спуск (SGD), обновляет эти веса.

Обучение модели в течение нескольких эпох позволяет ей итеративно уточнять свои параметры. С каждым проходом модель, в теории, должна лучше справляться со своей задачей, будь то классификация изображений или обнаружение объектов. Этот процесс управляется с помощью популярных фреймворков глубокого обучения, таких как PyTorch или TensorFlow.

Эпохи vs. Итерации vs. Пакеты

Несмотря на взаимосвязь, эти термины описывают разные аспекты процесса обучения, и их часто путают.

  • Эпоха: Один полный цикл, когда модель увидела весь обучающий набор данных.
  • Размер пакета: Количество обучающих выборок, используемых в одной итерации. Из-за ограничений памяти часто непрактично обрабатывать весь набор данных сразу.
  • Итерация: Однократное обновление весов модели. Итерация включает в себя обработку одного пакета данных и выполнение прямого и обратного прохода (обратное распространение).

Например, если набор данных содержит 10 000 изображений, а размер пакета составляет 100, одна эпоха будет состоять из 100 итераций (10 000 изображений / 100 изображений на пакет).

Определение правильного количества эпох

Выбор правильного количества эпох является важной частью настройки гиперпараметров. Это предполагает поиск баланса, чтобы избежать двух распространенных проблем:

  • Недообучение: Это происходит, когда модель не обучена достаточное количество эпох. Она не может изучить скрытые закономерности в данных и плохо работает как на обучающих, так и на тестовых данных.
  • Переобучение: Это происходит, когда модель обучается слишком много эпох. Она начинает «запоминать» обучающие данные, включая шум, и теряет способность обобщать их на новые, невидимые данные. Хотя она может иметь отличную точность на обучающем наборе, ее производительность на данных валидации будет низкой.

Распространенным методом борьбы с переобучением является ранняя остановка, когда обучение прекращается, как только производительность модели на проверочном наборе перестает улучшаться. Прогресс можно отслеживать с помощью таких инструментов, как TensorBoard, или через такие платформы, как Ultralytics HUB, что помогает визуализировать метрики обучения по эпохам.

Реальные примеры

Концепция эпох является универсальной в приложениях глубокого обучения.

  1. Автономное вождение: Модель обнаружения объектов для автономного транспортного средства обучается на огромном наборе данных, таком как Argoverse. Модель, такая как Ultralytics YOLO11, может быть обучена в течение 50-100 эпох. После каждой эпохи ее производительность на проверочном наборе измеряется с использованием таких метрик, как средняя точность (mAP). Инженеры выберут модель из той эпохи, которая предлагает наилучший баланс скорости и точности перед развертыванием.

  2. Анализ медицинских изображений: Модель для обнаружения опухолей на сканах головного мозга обучается на специализированном наборе данных медицинской визуализации. Учитывая, что такие наборы данных могут быть небольшими, модель можно обучать в течение нескольких сотен эпох. Чтобы предотвратить переобучение, используются такие методы, как аугментация данных, и после каждой эпохи внимательно отслеживается ошибка проверки. Это гарантирует, что конечная модель хорошо обобщается на сканы новых пациентов. Следование установленным советам по обучению моделей имеет решающее значение для успеха в таких критически важных приложениях.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас
Ссылка скопирована в буфер обмена