Percettori e reti neurali: Principi di base della visione artificiale

Abirami Vina

5 minuti di lettura

25 ottobre 2024

Capire come le reti neurali stanno trasformando la tecnologia moderna, dal controllo qualità nelle catene di approvvigionamento alle ispezioni autonome dei servizi pubblici con i droni.

Negli ultimi decenni, le reti neurali sono diventate gli elementi costitutivi di molte innovazioni chiave dell'intelligenza artificiale (AI). Le reti neurali sono modelli computazionali che cercano di imitare le complesse funzioni del cervello umano. Aiutano le macchine a imparare dai dati e a riconoscere gli schemi per prendere decisioni informate. In questo modo, consentono di creare sottocampi dell'IA come la computer vision e l'apprendimento profondo in settori come la sanità, la finanza e le auto a guida autonoma

Capire come funziona una rete neurale può dare un'idea più precisa di quella "scatola nera" che è l'IA, contribuendo a demistificare il modo in cui la tecnologia all'avanguardia è integrata nelle nostre funzioni quotidiane . In questo articolo esploreremo cosa sono le reti neurali, come funzionano e come si sono evolute nel corso degli anni. Daremo inoltre uno sguardo al ruolo che svolgono nelle applicazioni di computer vision. Iniziamo!

Che cos'è un perceptron nell'IA?

Prima di parlare in dettaglio delle reti neurali, diamo un'occhiata ai percettori. Sono il tipo più elementare di rete neurale e costituiscono la base per la costruzione di modelli più complessi. 

Il perceptron è un algoritmo lineare di apprendimento automatico utilizzato per l'apprendimento supervisionato (apprendimento da dati di formazione etichettati). È noto anche come rete neurale a singolo strato ed è tipicamente utilizzato per compiti di classificazione binaria che differenziano tra due classi di dati. Se si cerca di visualizzare un percettrone, lo si può considerare come un singolo neurone artificiale. 

__wf_reserved_inherit
Figura 1. Un perceptron è un singolo neurone artificiale.

Capire come funziona un perceptron

Un perceptron può ricevere diversi input, combinarli con i pesi, decidere a quale categoria appartengono e agire come un semplice decision-maker. È costituito da quattro parametri principali: i valori di ingresso (chiamati anche nodi), i pesi e le polarizzazioni, la somma della rete e una funzione di attivazione. 

Ecco come funziona:

  • Input e pesi: Supponiamo di avere diverse informazioni (input), ognuna delle quali ha un peso che ne indica l'importanza. Inoltre, il bias aiuta il percettrone a essere più flessibile nel prendere decisioni.
  • Calcolo della somma ponderata: Il perceptron moltiplica ogni ingresso per il suo peso e poi somma tutto, compreso il bias, per ottenere una somma ponderata.
  • Prendere una decisione: Quindi, il percettrone utilizza una funzione di attivazione per determinare l'uscita finale. Essa prende la somma ponderata e decide se il perceptron deve attivarsi o meno. Nel caso più semplice, la funzione di attivazione è una funzione a gradini che dà un'uscita pari a uno se la somma ponderata è superiore a una certa soglia e a zero in caso contrario. In questo modo, l'input ponderato viene convertito in una decisione di tipo sì o no.
  • Apprendimento e miglioramento: Se il perceptron commette un errore, regola i pesi per cercare di migliorare la volta successiva. Questo processo aiuta il modello a imparare dai propri errori.
__wf_reserved_inherit
Figura 2. Panoramica di un percettrone. fonte: indiantechwarrior.com

Il ruolo dei percettori nella computer vision

I percettori svolgono un ruolo importante per aiutarci a comprendere le basi della computer vision. Sono la base delle reti neurali avanzate. A differenza dei percettori, le reti neurali non si limitano a un singolo strato. Sono costituite da più strati di perceptron interconnessi, che consentono di apprendere modelli complessi e non lineari. Le reti neurali possono gestire compiti più avanzati e produrre output sia binari che continui. Ad esempio, le reti neurali possono essere utilizzate per compiti avanzati di visione artificiale, come la segmentazione delle istanze e la stima della posa.

L'evoluzione della tecnologia di visione computerizzata dalle reti neurali

La storia delle reti neurali risale a diversi decenni fa ed è ricca di ricerche e scoperte interessanti. Diamo un'occhiata più da vicino ad alcuni di questi eventi chiave. 

Ecco una rapida carrellata delle prime tappe:

  • 1940s: Warren McCulloch e Walter Pitts sviluppano un semplice circuito per imitare il funzionamento del cervello.
  • 1958: Rosenblatt introduce il perceptron.
  • 1970s: Paul Werbos ha ideato il concetto di backpropagation (un metodo di addestramento che aiuta una rete neurale ad apprendere minimizzando la differenza tra le uscite previste e quelle effettive). La backpropagation ha reso possibile l'addestramento di reti neurali multistrato e ha aperto la strada al deep learning.
  • 1980s: Ricercatori come Geoffrey Hinton e Yann LeCun studiano il connessionismo, che si occupa di come le reti di unità interconnesse possano formare processi cognitivi. Il loro lavoro ha gettato le basi per le moderne reti neurali.
  • 1990s: Jürgen Schmidhuber e Sepp Hochreiter propongono la rete di memoria a breve termine (LSTM) che è diventata essenziale per i compiti di previsione delle sequenze.
__wf_reserved_inherit
Figura 3. L'evoluzione delle reti neurali.

Con il passaggio al XXI secolo, la ricerca sulle reti neurali è decollata e ha portato a progressi ancora maggiori. Negli anni Duemila, il lavoro di Hinton sulle macchine di Boltzmann ristrette - un tipo di rete neurale che trova modelli nei dati - ha svolto un ruolo fondamentale nel progresso del deep learning. Ha reso più semplice l'addestramento delle reti profonde, aiutando a superare i problemi legati ai modelli complessi e rendendo l'apprendimento profondo più pratico ed efficace.

Poi, negli anni 2010, la ricerca ha subito una rapida accelerazione grazie all'aumento dei big data e del calcolo parallelo. Un momento saliente di questo periodo è stata la vittoria di AlexNet nella competizione ImageNet (2012). AlexNet, una rete neurale convoluzionale profonda, è stata una svolta importante perché ha dimostrato quanto potesse essere potente l'apprendimento profondo per le attività di computer vision, come il riconoscimento accurato delle immagini. Ha contribuito a innescare la rapida crescita dell'IA nel campo del riconoscimento visivo. 

Oggi le reti neurali si stanno evolvendo con nuove innovazioni come i trasformatori, ottimi per comprendere le sequenze, e le reti neurali a grafo, che funzionano bene con le relazioni complesse nei dati. Anche tecniche come l'apprendimento per trasferimento - che prevede l'utilizzo di un modello addestrato su un compito per un altro - e l'apprendimento auto-supervisionato, in cui i modelli imparano senza bisogno di dati etichettati, stanno ampliando le possibilità delle reti neurali.

Capire le reti neurali: Le basi

Ora che abbiamo chiarito le nostre basi, cerchiamo di capire che cos'è esattamente una rete neurale. Le reti neurali sono un tipo di modello di apprendimento automatico che utilizza nodi o neuroni interconnessi in una struttura a strati che ricorda il cervello umano. Questi nodi o neuroni elaborano e imparano dai dati, consentendo loro di eseguire compiti come il riconoscimento di modelli. Inoltre, le reti neurali sono adattive, quindi possono imparare dai propri errori e migliorare nel tempo. Ciò consente loro di affrontare con maggiore precisione problemi complessi, come il riconoscimento facciale.

__wf_reserved_inherit
Figura 4. Una rete neurale.

Le reti neurali sono costituite da più processori che lavorano in parallelo, organizzati in strati. Sono costituite da uno strato di ingresso, uno strato di uscita e diversi strati nascosti intermedi. Lo strato di ingresso riceve i dati grezzi, in modo simile a come i nostri nervi ottici recepiscono le informazioni visive.

Ogni livello passa poi il suo output al successivo, invece di lavorare direttamente con l'input originale, proprio come i neuroni nel cervello inviano segnali da uno all'altro. Lo strato finale produce l'output della rete. Grazie a questo processo, una rete neurale artificiale (RNA) può imparare a svolgere compiti di visione al computer come la classificazione delle immagini.

Un'applicazione industriale delle reti neurali nella computer vision

Dopo aver capito cosa sono e come funzionano le reti neurali, vediamo un'applicazione che mostra il potenziale delle reti neurali nella computer vision.

Ispezione di linee elettriche nel settore energetico

Le reti neurali sono alla base di modelli di visione artificiale come Ultralytics YOLO11 e possono essere utilizzate per ispezionare visivamente le linee elettriche con i droni. L'industria dei servizi di pubblica utilità deve affrontare sfide logistiche quando si tratta di ispezionare e mantenere le sue vaste reti di linee elettriche. Queste linee si estendono spesso in aree urbane trafficate o in paesaggi remoti e accidentati. Tradizionalmente, queste ispezioni venivano effettuate da una squadra di terra. Pur essendo efficaci, questi metodi manuali sono costosi, richiedono molto tempo e possono esporre i lavoratori a rischi ambientali ed elettrici. Le ricerche dimostrano che il lavoro sulle linee di distribuzione è tra i dieci lavori più pericolosi d'America, con un tasso di mortalità annuo di 30-50 lavoratori ogni 100.000.

Tuttavia, la tecnologia dei droni può rendere le ispezioni aeree un'opzione più pratica ed economica. La tecnologia all'avanguardia consente ai droni di volare su distanze più lunghe senza dover cambiare frequentemente la batteria durante le ispezioni. Molti droni sono ora integrati con l'intelligenza artificiale e dispongono di funzioni automatiche per evitare gli ostacoli e di migliori capacità di rilevamento dei guasti. Queste caratteristiche consentono di ispezionare aree affollate con molte linee elettriche e di catturare immagini di alta qualità da distanze maggiori. Molti Paesi stanno adottando l'uso di droni e computer vision per le attività di ispezione delle linee elettriche. In Estonia, ad esempio, il 100% di tutte le ispezioni di linee elettriche viene effettuato con questi droni.

__wf_reserved_inherit
Fig. 5. Un tecnico che utilizza droni e strumenti di intelligenza artificiale per ispezionare le linee elettriche (immagine a sinistra) e il drone che sta utilizzando (immagine a destra).

Punti di forza 

Le reti neurali hanno fatto molta strada dalla ricerca alle applicazioni e sono diventate una parte importante dei moderni progressi tecnologici. Consentono alle macchine di apprendere, riconoscere modelli e prendere decisioni informate utilizzando ciò che hanno imparato. Dalla sanità alla finanza, dai veicoli autonomi alla produzione, queste reti stanno guidando l'innovazione e trasformando i settori. Man mano che continuiamo a esplorare e perfezionare i modelli di reti neurali, il loro potenziale di ridefinizione di ulteriori aspetti della nostra vita quotidiana e delle nostre operazioni commerciali diventa sempre più chiaro.

Per saperne di più, visitate il nostro repository GitHub e partecipate alla nostra comunità. Esplorate le applicazioni dell'IA nel settore manifatturiero e agricolo sulle nostre pagine dedicate alle soluzioni. 🚀

Costruiamo insieme il futuro
dell'IA!

Iniziate il vostro viaggio nel futuro dell'apprendimento automatico

Iniziare gratuitamente
Link copiato negli appunti