Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

Grokking

Изучи феномен грокинга (grokking) в глубоком обучении. Узнай, как модели Ultralytics YOLO26 переходят от простого запоминания к обобщению в процессе длительного обучения.

Grokking — это увлекательный феномен в глубоком обучении, при котором нейронная сеть после тренировки в течение значительно длительного периода (часто спустя долгое время после того, как она, по-видимому, переобучилась на тренировочных данных) внезапно демонстрирует резкое улучшение точности на валидации. В отличие от стандартных кривых обучения, где производительность улучшается постепенно, grokking включает в себя «фазовый переход», при котором модель переходит от запоминания конкретных примеров к пониманию обобщаемых закономерностей. Эта концепция бросает вызов традиционному подходу «ранней остановки», предполагая, что для определенных сложных задач, особенно в large language models (LLMs) и алгоритмических рассуждениях, упорство в тренировке является ключом к раскрытию истинного интеллекта.

Link to this sectionФазы Grokking#

Процесс grokking обычно разворачивается в две отдельные стадии, которые могут сбить с толку практиков, полагающихся на стандартные метрики experiment tracking. Сначала модель быстро минимизирует функцию потерь на training data, в то время как производительность на validation data остается низкой или неизменной. Это создает большой разрыв в обобщении, который обычно интерпретируется как overfitting. Однако, если обучение продолжается значительно дольше этой точки, сеть в конечном итоге «постигает» (groks) базовую структуру, что приводит к резкому падению ошибки на валидации и скачку точности.

Последние исследования показывают, что это отложенное обобщение происходит потому, что neural network сначала изучает «быстрые», но хрупкие корреляции (запоминание) и только потом обнаруживает «медленные», но устойчивые признаки (обобщение). Такое поведение тесно связано с геометрией ландшафта loss function и динамикой оптимизации, что исследовано в работах ученых из OpenAI и Google DeepMind.

Link to this sectionGrokking vs. переобучение (Overfitting)#

Крайне важно различать grokking и стандартное переобучение, так как на ранних стадиях они выглядят похоже, но приводят к разным результатам.

  • Переобучение (Overfitting): Модель запоминает шум в тренировочном наборе. По мере продолжения обучения ошибка на валидации растет и никогда не восстанавливается. Стандартные методы regularization или ранняя остановка обучения являются обычными средствами защиты.
  • Grokking: Модель сначала запоминает, но в конечном итоге реструктурирует свои внутренние model weights, чтобы найти более простое и общее решение. Ошибка на валидации драматически снижается после долгого плато.

Понимание этого различия жизненно важно при обучении современных архитектур, таких как Ultralytics YOLO26, где может потребоваться отключение механизмов ранней остановки, чтобы выжать максимум производительности на сложных наборах данных с множеством закономерностей.

Link to this sectionРеальные приложения#

Хотя изначально grokking наблюдался в небольших алгоритмических наборах данных, он имеет значительные последствия для практической разработки ИИ.

  • Алгоритмическое рассуждение: В задачах, требующих логического вывода или математических операций (например, сложение по модулю), модели часто не могут обобщать, пока не пройдут фазу grokking. Это критически важно для разработки reasoning models, которые могут решать многошаговые задачи, а не просто имитировать текст.
  • Обучение компактных моделей: Для создания эффективных моделей для edge AI инженеры часто обучают небольшие сети в течение более длительных периодов. Grokking позволяет этим компактным моделям изучать сжатые, эффективные представления данных, что соответствует целям эффективности Ultralytics Platform.

Link to this sectionЛучшие практики и оптимизация#

Чтобы вызвать grokking, исследователи часто используют специальные стратегии оптимизации. Высокие learning rates и существенное weight decay (форма L2-регуляризации) способствуют фазовому переходу. Более того, количество данных играет свою роль; grokking наиболее заметен, когда размер набора данных находится как раз на пороге возможностей модели — концепция, связанная с феноменом double descent.

При использовании высокопроизводительных библиотек, таких как PyTorch, обеспечение численной стабильности во время таких длительных тренировочных запусков имеет существенное значение. Процесс требует значительных вычислительных ресурсов, что делает эффективные конвейеры обучения на Ultralytics Platform ценными для управления долгосрочными экспериментами.

Link to this sectionПример кода: Включение длительного обучения#

Чтобы допустить возможность появления grokking, часто приходится обходить стандартные механизмы ранней остановки. Следующий пример демонстрирует, как настроить запуск обучения Ultralytics YOLO с увеличенным количеством эпох и отключенным ожиданием (patience), давая модели время на переход от запоминания к обобщению.

from ultralytics import YOLO

# Load the state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")

# Train for extended epochs to facilitate grokking
# Setting patience=0 disables early stopping, allowing training to continue
# even if validation performance plateaus temporarily.
model.train(data="coco8.yaml", epochs=1000, patience=0, weight_decay=0.01)

Link to this sectionСвязанные концепции#

  • Double Descent: Родственный феномен, при котором ошибка на тесте уменьшается, увеличивается, а затем снова уменьшается по мере увеличения размера модели или объема данных.
  • Generalization: Способность модели хорошо работать на невидимых ранее данных, что является конечной целью процесса grokking.
  • Optimization Algorithms: Методы (такие как SGD или Adam), используемые для навигации по ландшафту функции потерь и облегчения фазового перехода.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения