Esplorazione di Google Beam: uno strumento di videoconferenza 3D di nuova generazione

Abirami Vina

4 minuti di lettura

19 giugno 2025

Scoprite Google Beam, uno strumento di videoconferenza 3D di nuova generazione. Scoprite come utilizza l'imaging 3D e l'intelligenza artificiale per consentire riunioni virtuali realistiche e coinvolgenti.

Le videochiamate e le riunioni virtuali hanno reso possibile il lavoro a distanza, aiutando i team a rimanere in contatto tra paesi e fusi orari diversi. Sono diventate parte integrante della nostra vita e hanno cambiato il nostro modo di comunicare.

Tuttavia, nonostante la loro diffusione, la tecnologia di base delle videoconferenze è rimasta per lo più invariata per anni. Grazie ai recenti progressi, le piattaforme di videoconferenza stanno iniziando a cambiare, con l'obiettivo di dare una sensazione più naturale e realistica.

È interessante notare che alla conferenza annuale degli sviluppatori (Google I/O 2025), Google ha presentato il suo nuovo strumento di comunicazione video, noto come Google Beam. Beam utilizza l' intelligenza artificiale (AI) e la tecnologia di videoconferenza 3D per andare oltre i tradizionali schermi piatti e creare un'esperienza più coinvolgente e personale.

Figura 1. Il CEO di Google, Sundar Pichai, presenta Google Beam(Fonte).

In effetti, Google Beam è stato progettato per dare la sensazione che la persona con cui si sta parlando sia proprio lì davanti a noi. A differenza delle normali videochiamate, restituisce i sottili segnali umani, come il contatto visivo e il movimento naturale che cambia a seconda della prospettiva, dettagli che spesso si perdono sugli schermi piatti.

In questo articolo approfondiremo cos'è Google Beam, come è stato sviluppato, come funziona e le sue applicazioni. Iniziamo!

Passare dal Progetto Starline a Google Beam

Prima di dare un'occhiata più da vicino a Google Beam, cerchiamo di capire meglio il suo predecessore, Project Starline.

Presentato al Google I/O 2021, Project Starline era un'iniziativa di ricerca che mirava a rendere la comunicazione a distanza più realistica, quasi come se ci si trovasse nella stessa stanza. Funzionava creando immagini 3D a grandezza naturale delle persone in tempo reale. Anche se la tecnologia ha attirato molta attenzione, richiedeva configurazioni complesse e hardware pesante.

Figura 2. Uno sguardo al Progetto Starline(Fonte).

Nel corso degli anni, con l'avanzare della tecnologia, Google ha perfezionato il software e semplificato l'hardware. Dopo quattro anni di sviluppo, il Project Starline si è evoluto in Google Beam, una soluzione più compatta e facile da usare.

Google Beam utilizza l'intelligenza artificiale per migliorare le videochiamate creando immagini più realistiche e in 3D delle persone con cui si parla. Trasforma i normali video 2D in viste che si adattano alle diverse angolazioni, aiutando a mantenere il contatto visivo e rendendo più visibili le espressioni facciali. Include anche funzioni come la traduzione in tempo reale, il tracciamento della testa e l'audio spaziale.

Una panoramica di Google Beam

Google Beam è stato sviluppato per funzionare senza accessori aggiuntivi come le cuffie per la realtà aumentata (AR) o la realtà virtuale (VR). Al contrario, è dotato di un display, di un sistema di telecamere e di un hardware integrati per creare immagini in 3D. In questo modo le videochiamate risultano più naturali, comode e coinvolgenti rispetto alle tipiche riunioni video.

Figura 3. Un esempio di utilizzo di Google Beam(fonte).

Come Google Beam crea riunioni virtuali realistiche

Ora che abbiamo discusso di come è nato Google Beam, diamo un'occhiata più da vicino al suo funzionamento.

Acquisizione di immagini per una collaborazione remota immersiva

Tutto inizia con l'acquisizione di informazioni visive. Beam utilizza sei telecamere ad alta risoluzione per scattare foto da diverse angolazioni contemporaneamente. 

Queste telecamere aiutano a tracciare i tratti del viso, il linguaggio del corpo e i piccoli movimenti in tempo reale. L'intelligenza artificiale svolge un ruolo fondamentale ottimizzando le impostazioni delle telecamere e mantenendo tutti i feed video perfettamente sincronizzati. Questo prepara il sistema alla fase successiva: l'elaborazione dei dati.

Da immagini 2D a videoconferenze 3D

Successivamente, l'intelligenza artificiale viene utilizzata per combinare i sei feed delle telecamere 2D e generare un modello 3D in tempo reale della persona in vista. Invece di sovrapporre semplicemente le immagini 2D, ricostruisce la profondità, le ombre e le relazioni spaziali per creare un gemello digitale 3D completo.

Per costruire questo modello 3D, Beam utilizza tecniche di intelligenza artificiale e di visione artificiale, come la stima della profondità e il tracciamento del movimento. Questi metodi aiutano a determinare la distanza di una persona dalla telecamera, il modo in cui si muove e la posizione del corpo. Grazie a questi dati, il sistema è in grado di mappare con precisione i tratti del viso e le parti del corpo nello spazio 3D.

Il modello AI dietro Beam aggiorna la rappresentazione 3D a 60 fotogrammi al secondo (FPS) per mantenere le conversazioni fluide e realistiche. Inoltre, effettua regolazioni in tempo reale per riflettere con precisione i movimenti della persona.

Figura 4. Le sei telecamere di Google Beam catturano immagini da diverse angolazioni(Fonte).

I sistemi di visualizzazione a campo chiaro di Google Beam

Il modello 3D viene visualizzato sul sistema Beam del ricevitore mediante un display a campo chiaro. A differenza degli schermi convenzionali che presentano la stessa immagine a entrambi gli occhi, un display a campo chiaro emette immagini leggermente diverse per ciascun occhio, simulando il modo in cui percepiamo la profondità nella vita reale. Questo crea un'esperienza visiva più realistica e tridimensionale.

Figura 5. Scambio di battimani virtuali attraverso Google Beam(Fonte).

Tracciamento della testa in tempo reale con precisione millimetrica

Una delle caratteristiche più impressionanti di Google Beam è la capacità di seguire l'intelligenza artificiale in tempo reale. Il sistema utilizza un preciso tracciamento della testa e degli occhi per seguire i movimenti fin nei minimi dettagli. 

Ad esempio, il motore AI di Beam è in grado di rilevare continuamente la posizione della testa dell'utente e di apportare sottili modifiche all'immagine in tempo reale. In questo modo si ha l'impressione che la persona sullo schermo sia davvero seduta di fronte a noi. Quando si muove la testa, l'immagine 3D si sposta di conseguenza, proprio come in una vera conversazione faccia a faccia.

Elaborazione audio per una comunicazione virtuale potenziata dall'intelligenza artificiale

Beam migliora anche l'esperienza audio utilizzando un suono spaziale che corrisponde alla posizione della persona sullo schermo. Se una persona si trova sul lato sinistro del display, la sua voce sembrerà provenire da sinistra. Quando la persona si sposta, l'audio si adatta alla sua posizione. In questo modo le conversazioni risultano più naturali e il cervello segue l'interlocutore senza alcuno sforzo aggiuntivo.

Questo funziona combinando tecniche di audio direzionale con il tracciamento in tempo reale. Beam utilizza l'audio spaziale per simulare il modo in cui percepiamo naturalmente il suono nel mondo reale (in base alla direzione da cui proviene e a come raggiunge ciascun orecchio). Il sistema tiene anche traccia dei movimenti della testa dello spettatore e regola l'uscita audio di conseguenza, in modo che il suono rimanga "attaccato" alla persona sullo schermo. 

Applicazioni di Google Beam

Google Beam, sebbene ancora in fase iniziale, mostra un potenziale promettente nel settore delle videoconferenze. Ecco alcune delle sue applicazioni principali:

  • Collaborazione a distanza: Google Beam può rendere più personali ed efficaci le riunioni, in particolare le discussioni di leadership o le trattative ad alto rischio. Catturando fattori sottili come il linguaggio del corpo e il contatto visivo, aiuta le persone a sentirsi più presenti, anche quando sono lontane.
  • Istruzione: Beam ha il potenziale per rendere l'apprendimento virtuale più emozionante e accessibile. Immaginate uno scienziato che tiene una lezione dal vivo agli studenti di mezzo mondo, con la sensazione di essere nella stessa stanza.
  • Assistenza sanitaria: Beam potrebbe rendere più personali i consulti a distanza. Quando medici e pazienti possono vedersi chiaramente e stabilire un contatto visivo naturale, si crea fiducia e l'interazione diventa più umana.
  • Industrie creative: Per le persone che lavorano nei settori creativi, come animatori, artisti e produttori, Beam può rendere più facile e naturale il lavoro di squadra a distanza. Sia che si tratti di un brainstorming di idee o di una revisione di un progetto, sembra di essere seduti insieme in uno studio piuttosto che in una videochiamata.

Pro e contro di Google Beam

Ecco alcuni dei principali vantaggi offerti da un'innovazione come Google Beam:

  • Non sono necessarie cuffie: A differenza di molte tecnologie immersive, Beam funziona senza bisogno di cuffie AR o VR. Questo rende l'esperienza più confortevole ed evita problemi comuni come la cinetosi o l'inconveniente di indossare attrezzature aggiuntive.
  • Riduzione dell'affaticamento dello schermo: Il display 3D offre un'esperienza di visione più naturale e confortevole, che può contribuire a ridurre l'affaticamento degli occhi rispetto a chi fissa a lungo gli schermi piatti.
  • Traduzione linguistica in tempo reale: Beam può incorporare una traduzione in tempo reale alimentata dall'intelligenza artificiale, facilitando la comunicazione naturale tra persone che parlano lingue diverse in riunioni internazionali o in ambienti di apprendimento.

Beam è un promettente passo avanti, ma come ogni nuova tecnologia presenta alcune limitazioni. Ecco alcuni aspetti da considerare:

  • Requisiti hardware: Beam richiede attrezzature specializzate e di alto livello, come display a campo chiaro e telecamere multiple, il che lo rende costoso e meno accessibile per i singoli e le organizzazioni più piccole.
  • Non è portatile: Il sistema Beam è progettato per l'installazione fissa e non è pensato per essere facilmente spostato, il che ne limita la flessibilità e l'uso in ambienti mobili o in evoluzione.

Punti di forza

Google Beam è un passo affascinante verso una comunicazione virtuale più umana. Pur essendo ancora nelle fasi iniziali, ha il potenziale per trasformare il modo in cui ci incontriamo, ci connettiamo e collaboriamo. Grazie alla combinazione di intelligenza artificiale avanzata, immagini 3D e audio spaziale, crea un'esperienza a distanza più realistica e coinvolgente.

Google continua a migliorare l'hardware di Beam, a renderlo ancora più piccolo e possibilmente a portarlo agli utenti di tutti i giorni, offrendo interessanti possibilità per il futuro della comunicazione virtuale. Insieme alle nuove tendenze tecnologiche come le riunioni olografiche e gli avatar 3D, Beam sta definendo un nuovo standard per le riunioni virtuali.

Unitevi alla nostra comunità e date un'occhiata alle nostre opzioni di licenza per iniziare a lavorare con la computer vision oggi stesso. Consultate il nostro repository GitHub per saperne di più sull'IA. Leggete le nostre pagine dedicate alle soluzioni per conoscere i vari casi d'uso dell'IA nella vendita al dettaglio e della computer vision in agricoltura

Costruiamo insieme il futuro
dell'IA!

Iniziate il vostro viaggio nel futuro dell'apprendimento automatico

Iniziare gratuitamente
Link copiato negli appunti