Scopri la potenza del deep learning: esplora le reti neurali, le tecniche di training e le applicazioni nel mondo reale in AI, sanità e altro ancora.
L'apprendimento profondo (Deep Learning, DL) è un sottoinsieme trasformativo del Machine Learning (ML) che consente ai computer di imparare dall'esperienza e comprendere il mondo in termini di gerarchia di concetti. Ispirato alla struttura biologica del struttura biologica del cervello umano, il DL utilizza architetture complesse e multistrato note come reti neurali (NN) per elaborare grandi quantità di dati. dati. A differenza degli algoritmi tradizionali, che spesso richiedono l'intervento umano per definire le regole, i modelli DL eseguono automaticamente estrazione delle caratteristiche, identificando modelli intricati modelli complessi che vanno dai semplici bordi di un'immagine ai complessi significati semantici di un testo. Questa capacità rende la DL il motore di molti progressi moderni nel campo dell'intelligenza artificiale (AI). Intelligenza Artificiale (IA), in particolare in campi come Visione artificiale (CV) e elaborazione del linguaggio naturale (NLP).
Il termine "profondo" in Deep Learning si riferisce al numero di strati nascosti della rete neurale. Mentre una rete semplice rete semplice può avere uno o due strati, i modelli profondi possono averne decine o addirittura centinaia. Ogni strato è costituito da nodi, o neuroni, che elaborano i dati in ingresso utilizzando pesi del modello e una funzione di attivazione, come ReLU o Sigmoid. Durante la fase di addestramento, il modello è esposto a dati etichettati e regola i suoi parametri interni per e aggiusta i suoi parametri interni per ridurre al minimo gli errori.
Questo aggiustamento si ottiene attraverso un processo chiamato backpropagation, che calcola il gradiente della funzione di perdita. della funzione di perdita. Un algoritmo di algoritmo di ottimizzazione, tipicamente gradiente, aggiorna i pesi per migliorare l'accuratezza. migliorare l'accuratezza. Nell'arco di molte iterazioni, o epoche, la rete rete impara a mappare gli ingressi e le uscite con grande precisione, "imparando" di fatto dai dati di addestramento. dati di addestramento.
Sebbene la DL faccia parte del ML, i due metodi differiscono in modo significativo nel loro approccio ai dati. I metodi tradizionali di ML si basano spesso sull'ingegnerizzazione manuale delle caratteristiche, in cui gli esperti di esperti del dominio devono selezionare e formattare esplicitamente le caratteristiche che il modello deve analizzare. Per esempio, nel riconoscimento delle immagini, un esperto potrebbe scrivere del codice per detect bordi o gli angoli.
I modelli di Deep Learning, invece, apprendono queste caratteristiche in modo automatico. A convoluzionale (CNN), un'architettura di DL comune, potrebbe imparare a detect bordi nel primo strato, le forme nel secondo e gli oggetti riconoscibili come auto o volti negli strati più profondi. oggetti riconoscibili come automobili o volti negli strati più profondi. Questo elimina la necessità di estrarre manualmente le caratteristiche e permette alla DL di scalare efficacemente con i Big Data.
La versatilità del Deep Learning ha portato alla sua adozione in numerosi settori.
L'implementazione di un modello di Deep Learning per l'inferenza è semplice con le moderne librerie. Di seguito è riportato un esempio di di utilizzo di un modello YOLO11 pre-addestrato per detect oggetti in un'immagine.
from ultralytics import YOLO
# Load a pretrained YOLO11 model (a deep learning architecture)
model = YOLO("yolo11n.pt")
# Run inference on a source image
results = model("https://ultralytics.com/images/bus.jpg")
# Display the detection results
results[0].show()
Lo sviluppo di modelli DL richiede framework software e hardware robusti.
Per una comprensione più ampia del campo, risorse come la documentazione del Documentazione sull'apprendimento profondo del MIT e Guida all'intelligenza artificiale dell'IBM forniscono lettura.