Sintonizzati su YOLO Vision 2025!
25 settembre 2025
10:00 — 18:00 BST
Evento ibrido
Yolo Vision 2024
Glossario

Deep Learning (DL)

Scopri la potenza del deep learning: esplora le reti neurali, le tecniche di training e le applicazioni nel mondo reale in AI, sanità e altro ancora.

Il Deep Learning (DL) è un sottocampo specializzato del Machine Learning (ML) che utilizza reti neurali multistrato per apprendere da enormi quantità di dati. Ispirati alla struttura del cervello umano, i modelli DL, spesso chiamati reti neurali profonde, sono progettati per apprendere automaticamente rappresentazioni gerarchiche dei dati. Ciò significa che i livelli iniziali apprendono caratteristiche semplici e i livelli successivi le combinano per apprendere modelli sempre più complessi. Questa capacità ha reso il DL la forza trainante dei principali progressi nell'Intelligenza Artificiale (AI), in particolare in domini complessi come la Computer Vision (CV) e l'Elaborazione del Linguaggio Naturale (NLP).

Come funziona il Deep Learning

Il cuore del Deep Learning sono le reti neurali profonde, ovvero reti neurali con più livelli nascosti tra i livelli di input e output. Il termine "deep" (profondo) in Deep Learning si riferisce a questa profondità. Ogni livello contiene unità di elaborazione (neuroni) che applicano un'operazione matematica, regolata da una funzione di attivazione, al loro input. Durante l'addestramento, la rete viene alimentata con grandi set di dati e un algoritmo chiamato backpropagation viene utilizzato per regolare i parametri interni della rete, o pesi. Questo processo di regolazione, in genere guidato da un algoritmo di ottimizzazione come la discesa del gradiente, riduce al minimo la differenza tra le previsioni del modello e la verità di base effettiva, come definita da una funzione di perdita. Ciò consente alla rete di scoprire automaticamente schemi complessi senza essere esplicitamente programmata per farlo. Un documento storico chiave che ha contribuito a rendere popolare il DL moderno è il paper di AlexNet del 2012, che ha ottenuto risultati all'avanguardia sul set di dati ImageNet.

Deep Learning contro Machine Learning

Sebbene il Deep Learning sia un sottoinsieme del Machine Learning, la distinzione principale risiede nel loro approccio alla rappresentazione dei dati. I metodi di ML tradizionali spesso si basano fortemente sull'estrazione manuale delle caratteristiche (feature engineering), in cui esperti del settore creano meticolosamente caratteristiche dai dati grezzi per aiutare il modello a fare previsioni accurate. Al contrario, i modelli di DL eseguono l'estrazione automatica delle caratteristiche. La struttura gerarchica delle reti profonde consente loro di apprendere le caratteristiche rilevanti direttamente dai dati. Questo rende il DL particolarmente potente per la gestione di dati non strutturati come immagini, testo e audio, dove l'estrazione manuale delle caratteristiche è spesso impraticabile. Ad esempio, nel riconoscimento delle immagini, un modello di DL può imparare a identificare bordi e texture nei suoi primi livelli, poi parti di oggetti come occhi e nasi nei livelli intermedi e, infine, interi oggetti come facce nei livelli più profondi.

Applicazioni ed Esempi

La capacità del Deep Learning di elaborare dati complessi ha portato alla sua adozione in numerosi settori e applicazioni. Due esempi importanti includono:

  1. Veicoli autonomi: Le auto a guida autonoma si affidano fortemente al DL per la percezione in tempo reale. I modelli Ultralytics YOLO, una famiglia di modelli DL all'avanguardia, vengono utilizzati per il rilevamento di oggetti per identificare pedoni, altri veicoli e segnali stradali. Allo stesso modo, il DL viene utilizzato per la segmentazione delle immagini per distinguere la superficie stradale percorribile dall'ambiente circostante, il che è fondamentale per una navigazione sicura. Leggi di più sul suo utilizzo nell'AI nelle auto a guida autonoma.
  2. Analisi di immagini mediche: In ambito sanitario, i modelli DL assistono i radiologi nell'analisi delle scansioni mediche. Le Reti Neurali Convoluzionali (CNN), un'architettura DL popolare per la visione, possono essere addestrate per rilevare anomalie come tumori nelle risonanze magnetiche cerebrali o segni di malattia nelle radiografie con elevata accuratezza. Ciò può portare a una diagnosi più precoce e a migliori risultati per i pazienti, come si è visto in applicazioni come il rilevamento di tumori cerebrali.

Strumenti e Framework

Lo sviluppo di modelli DL è facilitato da varie librerie software e piattaforme. I framework open-source più diffusi includono:

Piattaforme come Ultralytics HUB forniscono ambienti integrati per l'addestramento di modelli personalizzati, la distribuzione e la gestione di modelli DL, in particolare per attività di computer vision utilizzando modelli come YOLO11. Uno sviluppo efficace spesso comporta pratiche come la rigorosa ottimizzazione degli iperparametri, la comprensione delle metriche di performance e l'utilizzo dell'accelerazione GPU per un addestramento del modello efficiente. Lo sviluppo e la distribuzione di questi sistemi complessi sono spesso gestiti attraverso pratiche MLOps.

Unisciti alla community di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora
Link copiato negli appunti