Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Torna al glossario Ultralytics

Grokking

Esplora il fenomeno del grokking nel deep learning. Impara come i modelli Ultralytics YOLO26 passano dalla memorizzazione alla generalizzazione durante un addestramento prolungato.

Il termine grokking si riferisce a un affascinante fenomeno nel deep learning in cui una rete neurale, dopo un addestramento prolungato — spesso molto tempo dopo che sembra aver effettuato l'overfitting sui dati di addestramento — sperimenta improvvisamente un netto miglioramento nell'accuratezza di validazione. A differenza delle normali curve di apprendimento in cui le prestazioni migliorano gradualmente, il grokking comporta una "transizione di fase" in cui il modello passa dalla memorizzazione di esempi specifici alla comprensione di modelli generalizzabili. Questo concetto sfida la saggezza tradizionale dell'"early stopping", suggerendo che per determinati compiti complessi, specialmente nei large language models (LLM) e nel ragionamento algoritmico, la perseveranza nell'addestramento è fondamentale per sbloccare la vera intelligenza.

Link to this sectionLe fasi del grokking#

Il processo di grokking si svolge tipicamente in due fasi distinte che possono confondere i professionisti che si affidano alle metriche standard di experiment tracking. Inizialmente, il modello minimizza rapidamente la loss sui training data mentre le prestazioni sui validation data rimangono scarse o piatte. Ciò crea un ampio gap di generalizzazione, solitamente interpretato come overfitting. Tuttavia, se l'addestramento continua significativamente oltre questo punto, la rete alla fine "grokka" la struttura sottostante, causando il crollo della loss di validazione e un picco nell'accuratezza.

Ricerche recenti suggeriscono che questa generalizzazione ritardata si verifichi perché la neural network apprende prima correlazioni "veloci" ma fragili (memorizzazione) e solo successivamente scopre caratteristiche "lente" ma robuste (generalizzazione). Questo comportamento è strettamente legato alla geometria del panorama della loss function e alle dinamiche di ottimizzazione, come esplorato in articoli di ricercatori presso OpenAI e Google DeepMind.

Link to this sectionGrokking vs. Overfitting#

È fondamentale distinguere il grokking dall'overfitting standard, poiché si presentano in modo simile nelle fasi iniziali ma divergono nel risultato.

  • Overfitting: Il modello memorizza il rumore nel set di addestramento. Man mano che l'addestramento procede, l'errore di validazione aumenta e non recupera mai. Le tecniche standard di regularization o l'interruzione anticipata dell'addestramento sono i rimedi consueti.
  • Grokking: Il modello memorizza inizialmente ma alla fine ristruttura i propri model weights interni per trovare una soluzione più semplice e generale. L'errore di validazione diminuisce drasticamente dopo un lungo plateau.

Comprendere questa distinzione è vitale quando si addestrano architetture moderne come Ultralytics YOLO26, dove potrebbe essere necessario disabilitare i meccanismi di early stopping per ottenere le massime prestazioni su dataset difficili e ricchi di pattern.

Link to this sectionApplicazioni nel mondo reale#

Sebbene inizialmente osservato in piccoli dataset algoritmici, il grokking ha implicazioni significative per lo sviluppo pratico dell'IA.

  • Ragionamento algoritmico: In compiti che richiedono deduzione logica o operazioni matematiche (come l'addizione modulare), i modelli spesso non riescono a generalizzare finché non attraversano la fase di grokking. Questo è fondamentale per sviluppare reasoning models in grado di risolvere problemi a più passaggi invece di limitarsi a imitare il testo.
  • Addestramento di modelli compatti: Per creare modelli efficienti per l' edge AI, gli ingegneri spesso addestrano reti più piccole per periodi più lunghi. Il grokking consente a questi modelli compatti di apprendere rappresentazioni dei dati compresse ed efficienti, simili agli obiettivi di efficienza della Ultralytics Platform.

Link to this sectionBest practice e ottimizzazione#

Per indurre il grokking, i ricercatori utilizzano spesso strategie di ottimizzazione specifiche. Alti learning rates e un sostanziale weight decay (una forma di regolarizzazione L2) sono noti per favorire la transizione di fase. Inoltre, la quantità di dati gioca un ruolo; il grokking è più visibile quando la dimensione del dataset è esattamente alla soglia di ciò che il modello può gestire, un concetto legato al fenomeno del double descent.

Quando si utilizzano librerie ad alte prestazioni come PyTorch, garantire la stabilità numerica durante questi addestramenti prolungati è essenziale. Il processo richiede risorse di calcolo significative, rendendo le pipeline di addestramento efficienti sulla Ultralytics Platform preziose per gestire esperimenti di lunga durata.

Link to this sectionEsempio di codice: Abilitazione dell'addestramento esteso#

Per consentire un potenziale grokking, spesso devi bypassare i meccanismi standard di early stopping. Il seguente esempio mostra come configurare un addestramento Ultralytics YOLO con epoche estese e pazienza disabilitata, dando al modello il tempo di passare dalla memorizzazione alla generalizzazione.

from ultralytics import YOLO

# Load the state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")

# Train for extended epochs to facilitate grokking
# Setting patience=0 disables early stopping, allowing training to continue
# even if validation performance plateaus temporarily.
model.train(data="coco8.yaml", epochs=1000, patience=0, weight_decay=0.01)

Link to this sectionConcetti correlati#

  • Double Descent: Un fenomeno correlato in cui l'errore di test diminuisce, aumenta e poi diminuisce di nuovo man mano che le dimensioni del modello o i dati aumentano.
  • Generalization: La capacità di un modello di ottenere buone prestazioni su dati non visti, che è l'obiettivo finale del processo di grokking.
  • Optimization Algorithms: I metodi (come SGD o Adam) utilizzati per navigare nel panorama della loss e facilitare la transizione di fase.

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning