Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

Grokking

Explora el fenómeno del "grokking" en el aprendizaje profundo. Aprende cómo los modelos de Ultralytics YOLO26 pasan de la memorización a la generalización durante un entrenamiento prolongado.

Grokking refers to a fascinating phenomenon in deep learning where a neural network, after training for a significantly extended period—often long after it appears to have overfitted the training data—suddenly experiences a sharp improvement in validation accuracy. Unlike standard learning curves where performance improves gradually, grokking involves a "phase transition" where the model shifts from memorizing specific examples to understanding generalizable patterns. This concept challenges traditional "early stopping" wisdom, suggesting that for certain complex tasks, especially in large language models (LLMs) and algorithmic reasoning, perseverance in training is key to unlocking true intelligence.

Link to this sectionLas fases del grokking#

El proceso de grokking suele desarrollarse en dos etapas diferenciadas que pueden confundir a los profesionales que dependen de métricas estándar de seguimiento de experimentos. Inicialmente, el modelo minimiza rápidamente la pérdida en los datos de entrenamiento mientras que el rendimiento en los datos de validación sigue siendo pobre o plano. Esto genera una gran brecha de generalización, que suele interpretarse como sobreajuste. Sin embargo, si el entrenamiento continúa significativamente más allá de este punto, la red finalmente "grokka" la estructura subyacente, provocando que la pérdida de validación caiga en picado y la precisión se dispare.

Investigaciones recientes sugieren que esta generalización retardada ocurre porque la red neuronal primero aprende correlaciones "rápidas" pero frágiles (memorización) y solo después descubre características "lentas" pero robustas (generalización). Este comportamiento está estrechamente vinculado a la geometría del panorama de la función de pérdida y a las dinámicas de optimización, tal como se explora en artículos de investigadores de OpenAI y Google DeepMind.

Link to this sectionGrokking frente a sobreajuste#

Es crucial distinguir el grokking del sobreajuste estándar, ya que se presentan de forma similar en las primeras etapas pero divergen en el resultado.

  • Sobreajuste: El modelo memoriza ruido en el conjunto de entrenamiento. A medida que avanza el entrenamiento, el error de validación aumenta y nunca se recupera. Las técnicas estándar de regularización o detener el entrenamiento antes de tiempo son los remedios habituales.
  • Grokking: El modelo memoriza inicialmente, pero eventualmente reestructura sus pesos del modelo internos para encontrar una solución más simple y general. El error de validación disminuye drásticamente tras una larga meseta.

Entender esta distinción es vital al entrenar arquitecturas modernas como Ultralytics YOLO26, donde puede ser necesario desactivar los mecanismos de parada temprana para exprimir el máximo rendimiento en conjuntos de datos difíciles y cargados de patrones.

Link to this sectionAplicaciones en el mundo real#

Aunque se observó inicialmente en pequeños conjuntos de datos algorítmicos, el grokking tiene implicaciones significativas para el desarrollo práctico de IA.

  • Razonamiento algorítmico: En tareas que requieren deducción lógica u operaciones matemáticas (como la suma modular), los modelos a menudo no logran generalizar hasta que pasan por la fase de grokking. Esto es crítico para desarrollar modelos de razonamiento capaces de resolver problemas de varios pasos en lugar de limitarse a imitar texto.
  • Entrenamiento de modelos compactos: Para crear modelos eficientes para IA en el borde, los ingenieros suelen entrenar redes más pequeñas durante periodos más largos. El grokking permite que estos modelos compactos aprendan representaciones de datos comprimidas y eficientes, similares a los objetivos de eficiencia de la Plataforma Ultralytics.

Link to this sectionBuenas prácticas y optimización#

Para inducir el grokking, los investigadores suelen utilizar estrategias de optimización específicas. Las tasas de aprendizaje altas y un weight decay sustancial (una forma de regularización L2) son conocidos por fomentar la transición de fase. Además, la cantidad de datos juega un papel importante; el grokking es más visible cuando el tamaño del conjunto de datos está justo en el umbral de lo que el modelo puede manejar, un concepto relacionado con el fenómeno de doble descenso.

Al utilizar bibliotecas de alto rendimiento como PyTorch, garantizar la estabilidad numérica durante estos entrenamientos extendidos es fundamental. El proceso requiere recursos de cómputo significativos, lo que hace que los flujos de entrenamiento eficientes en la Plataforma Ultralytics sean valiosos para gestionar experimentos de larga duración.

Link to this sectionEjemplo de código: Habilitar el entrenamiento extendido#

Para permitir un posible grokking, a menudo hay que eludir los mecanismos estándar de parada temprana. El siguiente ejemplo demuestra cómo configurar una ejecución de entrenamiento de Ultralytics YOLO con épocas extendidas y paciencia desactivada, dando al modelo tiempo para hacer la transición de la memorización a la generalización.

from ultralytics import YOLO

# Load the state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")

# Train for extended epochs to facilitate grokking
# Setting patience=0 disables early stopping, allowing training to continue
# even if validation performance plateaus temporarily.
model.train(data="coco8.yaml", epochs=1000, patience=0, weight_decay=0.01)

Link to this sectionConceptos relacionados#

  • Doble descenso: Un fenómeno relacionado donde el error de prueba disminuye, aumenta y luego vuelve a disminuir a medida que aumenta el tamaño del modelo o los datos.
  • Generalización: La capacidad de un modelo para funcionar bien con datos no vistos, que es el objetivo final del proceso de grokking.
  • Algoritmos de optimización: Los métodos (como SGD o Adam) utilizados para navegar por el panorama de pérdida y facilitar la transición de fase.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático