Glossario

LightGBM

Scopri LightGBM, il framework di gradient boosting veloce ed efficiente per grandi insiemi di dati, che garantisce un'elevata precisione nelle applicazioni di apprendimento automatico.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

LightGBM, acronimo di Light Gradient Boosting Machine, è un framework di gradient boosting open-source ad alte prestazioni sviluppato da Microsoft Research. È ampiamente utilizzato nel Machine Learning (ML) per compiti come la classificazione, la regressione e il ranking, soprattutto quando si ha a che fare con grandi insiemi di dati(Big Data). LightGBM è rinomato per la sua velocità ed efficienza: spesso raggiunge un'elevata precisione consumando meno memoria rispetto ad altri algoritmi di boosting. Si basa su concetti presenti negli algoritmi ad albero decisionale e fa parte della famiglia dei metodi di gradient boosting, costruendo iterativamente un insieme di learners deboli per creare un modello predittivo forte.

Come LightGBM raggiunge velocità ed efficienza

LightGBM impiega diverse tecniche innovative per ottimizzare le prestazioni e gestire efficacemente i dati su larga scala:

  • Gradient-based One-Side Sampling (GOSS): Questo metodo si concentra sulle istanze dei dati con gradienti più grandi (quelle che al momento sono poco previste), mentre elimina in modo casuale le istanze con gradienti piccoli. In questo modo si mantiene l'accuratezza e si riduce significativamente la quantità di dati necessari per l'addestramento di ogni albero.
  • Exclusive Feature Bundling (EFB): Questa tecnica raggruppa le caratteristiche reciprocamente esclusive (caratteristiche che raramente assumono valori non nulli contemporaneamente), riducendo di fatto il numero di caratteristiche(riduzione della dimensionalità) senza perdere informazioni significative. Questo accelera la formazione riducendo la complessità di trovare i migliori punti di divisione.
  • Crescita degli alberi in base alle foglie: A differenza della tradizionale crescita per livelli, che espande gli alberi strato per strato, LightGBM fa crescere gli alberi foglia per foglia. Sceglie la foglia con la massima riduzione della perdita da dividere, il che porta a una convergenza più rapida e ad alberi potenzialmente più complessi, anche se a volte può portare a un overfitting se non è adeguatamente vincolato. Per saperne di più sulla crescita per foglia puoi consultare la documentazione ufficiale.

Queste ottimizzazioni, combinate con implementazioni efficienti che sfruttano tecniche come gli algoritmi basati sugli istogrammi, rendono LightGBM eccezionalmente veloce ed efficiente dal punto di vista della memoria, consentendo l'addestramento su enormi set di dati che potrebbero essere proibitivi per altri framework che utilizzano algoritmi di ottimizzazione standard.

Caratteristiche principali di LightGBM

LightGBM offre diversi vantaggi ai professionisti della ML:

  • Velocità ed efficienza: Velocità di formazione significativamente più elevata e minore utilizzo di memoria rispetto a molti altri framework di boosting.
  • Alta precisione: Spesso fornisce risultati all'avanguardia nelle attività con dati tabellari.
  • SupportoGPU : Supporta la formazione su GPU per un'ulteriore accelerazione.
  • Formazione parallela e distribuita: È in grado di gestire insiemi di dati estremamente grandi grazie alla formazione distribuita su più macchine.
  • Gestione delle caratteristiche categoriali: Può gestire direttamente le caratteristiche categoriali, eliminando spesso la necessità di un'ampia progettazione delle caratteristiche come la codifica a un solo punto.
  • Regolarizzazione: Include i parametri di regolarizzazione (come L1 e L2) per evitare l'overfitting.
  • Gestione dei dati su larga scala: Progettato per lavorare in modo efficiente con insiemi di dati molto grandi che potrebbero non entrare in memoria.
  • Sintonizzazione iperparametrica: Offre vari parametri che possono essere regolati attraverso la sintonizzazione degli iperparametri per ottimizzare le prestazioni per compiti specifici.

Consulta la documentazione ufficiale di LightGBM e il suo repository GitHub per informazioni dettagliate sull'uso e sulle funzioni avanzate. Una corretta pre-elaborazione dei dati rimane importante per ottenere risultati ottimali.

Confronto con altri framework di boosting

LightGBM viene spesso paragonata ad altre popolari librerie di gradient boosting come XGBoost e CatBoost. Le differenze principali includono:

  • Velocità: LightGBM è generalmente considerato più veloce di XGBoost, soprattutto su grandi insiemi di dati, grazie alle sue tecniche GOSS e EFB. La velocità di CatBoost può essere competitiva, soprattutto con le caratteristiche categoriali.
  • Utilizzo della memoria: LightGBM in genere utilizza meno memoria di XGBoost.
  • Caratteristiche categoriali: CatBoost ha una sofisticata gestione integrata delle caratteristiche categoriali e spesso supera LightGBM e XGBoost (che richiede una pre-elaborazione come la codifica one-hot) nei dataset con molte variabili categoriali. LightGBM offre una gestione diretta ma potrebbe essere meno robusto dell'approccio di CatBoost.
  • Crescita dell'albero: LightGBM utilizza la crescita per foglie, mentre XGBoost e CatBoost utilizzano tipicamente la crescita per livelli (sebbene XGBoost offra anche l'opzione per foglie).
  • Iperparametri: Ogni libreria ha un proprio set di iperparametri che richiedono una messa a punto. CatBoost spesso richiede una messa a punto minore per ottenere buoni risultati.

La scelta dipende spesso dalle caratteristiche specifiche del set di dati (dimensioni, tipi di elementi) e dai requisiti del progetto. Risorse come questo articolo di confronto offrono ulteriori spunti.

Applicazioni del mondo reale

I punti di forza di LightGBM lo rendono adatto a diverse applicazioni che coinvolgono dati strutturati o tabellari:

  1. Rilevamento delle frodi: Nel settore finanziario(AI nella finanza), LightGBM è in grado di elaborare rapidamente milioni di record di transazioni(modellazione predittiva) per identificare modelli sottili indicativi di attività fraudolente in tempo quasi reale. La sua velocità è fondamentale per intervenire tempestivamente. I sistemi di rilevamento delle frodi traggono grandi vantaggi dalla sua efficienza.
  2. Manutenzione predittiva: I produttori(AI nel settore manifatturiero) utilizzano LightGBM per analizzare i dati dei sensori dei macchinari. Grazie all'addestramento sui dati storici delle prestazioni e dei guasti delle apparecchiature, il modello può prevedere i potenziali guasti prima che si verifichino, consentendo una manutenzione proattiva e riducendo i tempi di fermo. Scopri di più sui concetti di manutenzione predittiva.

Altre applicazioni comuni sono la previsione del tasso di abbandono dei clienti, i sistemi di raccomandazione, la previsione del tasso di click-through, il credit scoring e la previsione della domanda. Le sue prestazioni lo hanno reso una scelta popolare nelle competizioni di scienza dei dati, come quelle ospitate su Kaggle.

Mentre LightGBM eccelle con i dati tabellari per le classiche attività di ML, si distingue da modelli come Ultralytics YOLO. I modelli YOLO sono architetture specializzate di deep learning (DL) progettate per compiti di computer vision (CV) come il rilevamento di oggetti, la classificazione di immagini e la segmentazione di immagini su dati video o immagini non strutturate. Piattaforme come Ultralytics HUB facilitano lo sviluppo e la distribuzione di questi modelli CV. LightGBM rimane uno strumento fondamentale per i problemi di dati strutturati in cui la velocità e l'efficienza su grandi insiemi di dati sono fondamentali. Per maggiori dettagli tecnici, puoi consultare il documento di ricerca originale su LightGBM.

Leggi tutto