Un'introduzione all'emergente campo dell'AI neuro-simbolica
Esplora come l'AI neuro-simbolica mira a combinare apprendimento e logica per costruire sistemi che comprendono il contesto e forniscono decisioni più trasparenti e spiegabili.

Oggi, grazie alla rapida crescita dell'intelligenza artificiale (IA) e alla crescente disponibilità di potenza di calcolo, vengono rilasciati modelli di IA avanzati più velocemente che mai. In effetti, lo spazio dell'IA sta guidando un'innovazione significativa in molti settori.
Ad esempio, nella sanità, i sistemi di IA vengono utilizzati per assistere in attività come l'analisi di immagini mediche per una diagnosi precoce. Tuttavia, come ogni tecnologia, anche l'IA ha i suoi limiti.
Una preoccupazione importante è la trasparenza. Ad esempio, un modello di rilevamento oggetti potrebbe individuare con precisione un tumore in una risonanza magnetica cerebrale, ma può essere difficile capire come il modello sia arrivato a tale conclusione. Questa mancanza di spiegabilità rende più difficile per medici e ricercatori fidarsi o convalidare pienamente i risultati dell'IA.
È esattamente per questo che c'è un interesse crescente nell'emergente campo dell'IA neuro-simbolica. L'IA neuro-simbolica combina i punti di forza del riconoscimento di pattern del deep learning con il ragionamento strutturato basato su regole che si trova nell'IA simbolica. L'obiettivo è creare sistemi che facciano previsioni accurate, ma che possano anche spiegare il loro ragionamento in un modo che gli esseri umani possano comprendere.
In questo articolo, esploreremo come funziona l'intelligenza artificiale neuro-simbolica e come unisce apprendimento e ragionamento per costruire sistemi più trasparenti e consapevoli del contesto. Iniziamo!
Link to this sectionI due lati dell'IA neuro-simbolica: Apprendimento e ragionamento#
Prima di addentrarci nell'IA neuro-simbolica, esaminiamo più da vicino i due sottocampi che unisce: deep learning e IA simbolica.
Il deep learning si concentra sul riconoscimento di pattern nei dati, mentre l'IA simbolica usa regole, logica o buon senso per ragionare sui problemi. Ognuno ha punti di forza, ma anche limitazioni. Combinandoli, l'IA neuro-simbolica crea sistemi in grado sia di apprendere dai dati sia di spiegare le proprie decisioni in modo più chiaro.
Link to this sectionUna panoramica del deep learning#
Il deep learning è un ramo del machine learning che utilizza reti neurali artificiali, vagamente ispirate al modo in cui il cervello elabora le informazioni. Queste reti apprendono analizzando grandi quantità di dati e regolando le loro connessioni interne per migliorare le prestazioni.
Ciò consente loro di riconoscere pattern in immagini, suoni e testo senza bisogno di regole scritte a mano per ogni situazione. Per questo motivo, il deep learning è altamente efficace per attività focalizzate sulla percezione come il riconoscimento di immagini, l'elaborazione vocale e la traduzione linguistica.
Un buon esempio è un modello di visione artificiale addestrato per segmentare oggetti nelle immagini. Con un numero sufficiente di esempi etichettati, può imparare a separare strade, veicoli e pedoni in filmati di traffico in tempo reale.
Tuttavia, nonostante la loro precisione, i modelli di deep learning spesso faticano a spiegare chiaramente come sono arrivati a un risultato specifico. Questa sfida, comunemente chiamata problema della scatola nera (black box problem), rende più difficile per gli utenti interpretare o verificare le decisioni del modello, specialmente in aree sensibili come la sanità o la finanza. È significativo perché un'IA responsabile richiede trasparenza, fiducia e la capacità di capire perché un modello ha fatto una determinata previsione.
Link to this sectionEsplorare l'IA simbolica#
L'IA simbolica adotta un approccio più strutturato all'intelligenza e al processo decisionale. Rappresenta la conoscenza usando simboli e applica regole logiche per lavorare con tale conoscenza, in modo simile a come usiamo il ragionamento e il linguaggio per risolvere problemi. Ogni passaggio nel processo di ragionamento è definito, il che rende le decisioni dell'IA simbolica trasparenti e più facili da spiegare.
La conoscenza simbolica funziona particolarmente bene in attività che seguono regole chiare e ben definite, come la pianificazione, la programmazione o la gestione di conoscenze strutturate. Tuttavia, l'IA simbolica fatica con dati non strutturati o situazioni che non rientrano perfettamente in categorie predefinite.
Un esempio comune di approcci simbolici in azione sono i primi programmi di scacchi. Seguivano regole create a mano e strategie fisse anziché apprendere da partite precedenti o adattarsi a diversi avversari. Di conseguenza, il loro modo di giocare tendeva ad essere rigido e prevedibile.

Fig 1. Uno sguardo alla struttura dell'IA e ai suoi sottocampi. (Immagine dell'autore)
Link to this sectionCos'è l'IA neuro-simbolica?#
Negli anni 2010, man mano che il deep learning veniva adottato più ampiamente, i ricercatori hanno iniziato a cercare modi per andare oltre il semplice riconoscimento di pattern e verso la comprensione delle relazioni e del contesto. Questo cambiamento ha reso possibile per i modelli di IA non solo rilevare oggetti in una scena, come un gatto e un tappetino, ma anche interpretare come quegli oggetti si relazionano, come riconoscere che il gatto è seduto sul tappetino.
Tuttavia, questo progresso ha anche evidenziato una limitazione fondamentale. I modelli di deep learning possono riconoscere i pattern estremamente bene, ma spesso faticano a spiegare il loro ragionamento o a gestire situazioni non familiari. Questa rinnovata attenzione al ragionamento ha riportato i ricercatori a un campo che esiste dagli anni '80: l'IA neuro-simbolica.
L'IA neuro-simbolica integra deep learning e IA simbolica. Consente ai modelli di apprendere dagli esempi nello stesso modo in cui fa il deep learning, applicando al contempo logica e ragionamento come fa l'IA simbolica.
In parole povere, l'IA neuro-simbolica può riconoscere informazioni, comprendere il contesto e fornire spiegazioni più chiare per le sue decisioni. Questo approccio ci avvicina allo sviluppo di sistemi di IA che si comportano in modo più affidabile e simile all'uomo.

Fig 2. Capire l'IA neuro-simbolica (Immagine dell'autore)
Link to this sectionLe basi di come funziona l'IA neuro-simbolica#
Un'architettura neuro-simbolica unisce apprendimento e ragionamento all'interno di un unico framework. Solitamente include tre parti principali: un livello di percezione neurale che interpreta i dati grezzi, un livello di ragionamento simbolico che applica la logica e un livello di integrazione che collega i due. Successivamente, esamineremo più da vicino ogni livello.
Link to this sectionIl livello di percezione neurale#
Il componente di percezione neurale elabora dati non strutturati, come immagini, video, testo o audio, e li converte in rappresentazioni interne con cui il sistema può lavorare. Solitamente utilizza modelli di deep learning per rilevare pattern e identificare oggetti o caratteristiche nell'input. In questa fase, il sistema riconosce ciò che è presente nei dati, ma non ragiona ancora sul significato, sulle relazioni o sul contesto.
Ecco alcuni tipi comuni di modelli di deep learning utilizzati in questo livello:
- Reti neurali convoluzionali (CNN): Sono un tipo di rete neurale progettata per elaborare dati a griglia come le immagini. Le CNN utilizzano filtri convoluzionali per scansionare un'immagine e rilevare pattern come bordi, texture e forme. Sovrapponendo questi pattern, imparano a riconoscere oggetti come auto, frutta e persone.
- Transformer: I Transformer sono modelli progettati per capire come le diverse parti di un input si relazionano tra loro. Invece di leggere le informazioni rigorosamente in ordine, possono guardare più parti dei dati contemporaneamente e decidere quali sono le più importanti. Questo li aiuta a comprendere il contesto in testo, immagini o entrambi. Grazie a questa flessibilità, i Transformer sono l'architettura principale dietro la maggior parte dei moderni modelli linguistici e molti sistemi visione-linguaggio.
- Reti neurali ricorrenti (RNN): Questo tipo di modello è progettato per analizzare dati sequenziali, come segnali vocali o serie temporali. Mantiene una memoria degli input precedenti, il che significa che le sue previsioni possono tenere conto del contesto nel tempo.
In definitiva, questi modelli neurali estraggono e rappresentano caratteristiche significative dai dati grezzi. Questo output diventa quindi l'input per il livello di ragionamento simbolico, che interpreta e ragiona su ciò che il sistema ha rilevato.
Link to this sectionIl livello di ragionamento simbolico#
Il livello di ragionamento simbolico prende le informazioni prodotte dal livello di percezione neurale e le interpreta usando la logica. Invece di lavorare solo dai pattern, si basa su elementi come regole, grafi di conoscenza, basi di conoscenza e ontologie (descrizioni organizzate di concetti e di come si relazionano tra loro). Questi aiutano il sistema a capire come i diversi elementi si incastrano e quali azioni hanno senso in una determinata situazione.
Ad esempio, in un'auto a guida autonoma, il livello di percezione neurale potrebbe riconoscere un semaforo rosso nel feed della fotocamera. Il livello di ragionamento simbolico può quindi applicare una regola come: “Se il semaforo è rosso, il veicolo deve fermarsi.” Poiché il ragionamento si basa su regole chiare, le decisioni del sistema sono più facili da spiegare e verificare, il che è particolarmente importante in situazioni in cui la sicurezza e la responsabilità sono fondamentali.
Link to this sectionIl livello di integrazione#
Il livello di integrazione collega il livello di percezione neurale e il livello di ragionamento simbolico, assicurando che apprendimento e ragionamento operino insieme. In una direzione, converte gli output dei modelli neurali (come il rilevamento di un pedone) in rappresentazioni simboliche che descrivono l'oggetto e i suoi attributi.
Nell'altra direzione, prende regole simboliche (ad esempio, “un veicolo deve fermarsi se un pedone è sulle strisce pedonali”) e le traduce in segnali che guidano i modelli neurali. Ciò può comportare l'evidenziazione di aree pertinenti di un'immagine, l'influenza sull'attenzione o la definizione dei percorsi decisionali del modello.
Questo scambio bidirezionale forma un feedback loop. Il lato neurale guadagna struttura e interpretabilità dalle regole simboliche, mentre il lato simbolico può adattarsi in modo più efficace basandosi su dati del mondo reale. Tecniche come le reti neurali logiche (LNN) aiutano a facilitare questa interazione incorporando vincoli logici direttamente nelle architetture neurali.
Collegando percezione e ragionamento in questo modo, l'IA neuro-simbolica può produrre decisioni che sono sia accurate che più facili da interpretare. Molti ricercatori vedono questo approccio come un passo promettente verso un'IA più affidabile e allineata con l'uomo, e potenzialmente come una base per il futuro progresso verso l'intelligenza artificiale generale (AGI).
Link to this sectionApplicazioni dell'IA neuro-simbolica#
Ora che abbiamo una migliore comprensione di cosa sia l'IA neuro-simbolica e come funzioni, diamo un'occhiata ad alcuni dei suoi casi d'uso nel mondo reale.
Link to this sectionGuidare in modo più sicuro: Dal vedere i pedoni al comprenderli#
I veicoli autonomi devono comprendere l'ambiente circostante per operare in sicurezza. Utilizzano tecnologie come la visione artificiale per rilevare pedoni, veicoli, segnaletica stradale e strisce pedonali.
Sebbene i modelli di deep learning possano identificare questi oggetti con precisione, non sempre comprendono cosa significhino quegli oggetti nel contesto o come si relazionino tra loro in una situazione reale. Ad esempio, un modello neurale potrebbe riconoscere un pedone sulle strisce, ma non sa dire se stia per attraversare o se stia solo in piedi ad aspettare.
L'IA neuro-simbolica tenta di colmare questo divario consentendo ai veicoli a guida autonoma di combinare il riconoscimento visivo con il ragionamento logico, in modo che possano interpretare le situazioni anziché limitarsi a identificare oggetti. Recenti ricerche sull'IA hanno dimostrato che i sistemi che combinano la percezione neurale con regole simboliche possono migliorare la previsione del comportamento dei pedoni.
In questi sistemi, il componente neurale analizza indizi visivi come la postura, il movimento e la posizione di un pedone. Il componente simbolico applica quindi regole logiche, considerando fattori come se la persona si trova vicino a un passaggio pedonale o cosa indica l'attuale semaforo.
Combinando queste due prospettive, il sistema neuro-simbolico può fare di più che limitarsi a rilevare un pedone. Può fare una previsione ragionevole sul fatto che il pedone stia per attraversare e può spiegare perché ha preso quella decisione. Ciò porta a un comportamento più sicuro e trasparente nei veicoli autonomi.

Fig 3. Fare previsioni basate sul comportamento osservato dei pedoni utilizzando l'IA neuro-simbolica. (Fonte)
Link to this sectionInterpretazione logica nella visual question answering#
Un'altra applicazione importante dell'IA neuro-simbolica è la visual question answering (VQA). I sistemi VQA sono progettati per rispondere a domande sulle immagini.
Riunisce modelli linguistici di grandi dimensioni (LLM) e modelli visivi per eseguire ragionamenti multimodali, combinando ciò che il sistema vede con ciò che comprende. Ad esempio, se a un sistema VQA viene mostrata un'immagine e gli viene chiesto: “La tazza è sul tavolo?”, deve riconoscere gli oggetti ma anche comprendere la relazione tra loro. Deve determinare se la tazza si trova effettivamente sopra il tavolo nella scena.
Un recente studio ha dimostrato come l'IA neuro-simbolica possa migliorare la VQA integrando la percezione neurale con il ragionamento simbolico. Nel sistema proposto, la rete neurale analizza prima l'immagine per riconoscere oggetti e i loro attributi, come colore, forma o dimensione.
Il componente di ragionamento simbolico applica quindi regole logiche per interpretare come questi oggetti si relazionano tra loro e per rispondere alla domanda. Se viene chiesto “Quanti cilindri grigi ci sono nella scena?”, la parte neurale identifica tutti i cilindri e i loro colori, mentre la parte simbolica li filtra in base ai criteri e conta quelli corretti.

Fig 4. Esempi di scenari VQA in cui sono necessari conoscenza astratta e logica. (Fonte)
Tale ricerca mostra come la VQA neuro-simbolica possa andare oltre il semplice fornire risposte. Poiché il modello può mostrare i passaggi che ha compiuto per arrivare a una conclusione, supporta l'IA spiegabile, in cui i sistemi fanno previsioni e giustificano il loro ragionamento in un modo che le persone possono comprendere.
Link to this sectionPro e contro dell'IA neuro-simbolica#
Ecco alcuni dei principali vantaggi dell'utilizzo dell'IA neuro-simbolica:
- Abilità di ragionamento più forti: A differenza dei puri modelli di deep learning, l'IA neuro-simbolica può eseguire attività che richiedono ragionamento multi-passaggio, pianificazione, rispetto delle regole e gestione di aree di conoscenza strutturata, dove l'IA simbolica eccelle tradizionalmente.
- Adattabilità: Questi sistemi hanno buone prestazioni su attività nuove o non viste in precedenza poiché possono ragionare logicamente oltre ciò su cui sono stati addestrati. Invece di memorizzare solo i dati, comprendono relazioni e pattern.
- Robustezza al rumore e all'ambiguità: I vincoli logici possono aiutare a prevenire errori quando i dati sono rumorosi, incompleti o ambigui. Il livello di ragionamento può imporre regole che guidano o correggono le previsioni neurali.
Nonostante il suo potenziale, l'IA neuro-simbolica è ancora in evoluzione e comporta alcune sfide pratiche. Ecco alcune delle sue principali limitazioni:
- Integrazione complessa: Sebbene questo framework ibrido offra una forte interpretabilità, la progettazione di algoritmi che uniscono percezione e ragionamento rimane impegnativa.
- Scalabilità: Il ragionamento simbolico può diventare lento o computazionalmente costoso quando si ha a che fare con grandi grafi di conoscenza o complessi insiemi di regole. Ciò può rendere più difficile distribuire in modo efficiente applicazioni in tempo reale, come la guida autonoma, l'elaborazione video o il ragionamento su conoscenze su larga scala.
- Robustezza del ragionamento: Se le regole simboliche sono troppo rigide, i sistemi potrebbero faticare in scenari del mondo reale ambigui o imprevedibili. Bilanciare l'apprendimento flessibile con un ragionamento affidabile è ancora una sfida in corso.
Link to this sectionPunti chiave#
L'IA neuro-simbolica rappresenta un passo importante verso la costruzione di sistemi di IA che possono non solo percepire il mondo, ma anche ragionare su di esso e spiegare le proprie decisioni. A differenza dei tradizionali sistemi di deep learning, che si basano principalmente su pattern appresi dai dati, l'IA neuro-simbolica combina l'apprendimento statistico con la logica e la conoscenza strutturata. Piuttosto che sostituire il deep learning, si basa su di esso, avvicinandoci un po' di più allo sviluppo di un'IA in grado di comprendere e ragionare in modo più simile all'uomo.
Unisciti alla nostra community ed esplora il nostro repository GitHub. Dai un'occhiata alle nostre pagine delle soluzioni per scoprire varie applicazioni dell'IA in agricoltura e della visione artificiale nella sanità. Scopri le nostre opzioni di licenza e inizia a costruire il tuo progetto di IA visiva!






