Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Vision AI

Alla scoperta di Google Beam: uno strumento di videoconferenza 3D di nuova generazione

Scopri Google Beam, uno strumento di videoconferenza 3D di nuova generazione. Esplora come utilizza l'imaging 3D e l'IA per consentire riunioni virtuali realistiche e coinvolgenti.

ABAbirami Vina
4 min read
Videoconferenza 3D Google Beam per riunioni virtuali coinvolgenti

Le videochiamate e le riunioni virtuali hanno reso possibile il lavoro da remoto, aiutando i team a rimanere in contatto attraverso paesi e fusi orari. Sono diventate parte integrante della nostra vita quotidiana e hanno trasformato il modo in cui comunichiamo.

Tuttavia, nonostante la loro diffusione, la tecnologia alla base delle videoconferenze è rimasta sostanzialmente invariata per anni. Grazie ai recenti progressi, le piattaforme di videoconferenza stanno iniziando a evolversi, puntando a un'esperienza più naturale e realistica.

È interessante notare che, durante la sua conferenza annuale per sviluppatori (Google I/O 2025), Google ha presentato il suo nuovo strumento di comunicazione video, noto come Google Beam. Beam utilizza l'intelligenza artificiale (AI) e la tecnologia di videoconferenza 3D per superare i tradizionali schermi piatti e creare un'esperienza più immersiva e simile a quella dal vivo.

Il CEO di Google Sundar Pichai che presenta Google Beam

Fig 1. Il CEO di Google, Sundar Pichai, introduce Google Beam (Fonte).

In effetti, Google Beam è progettato per darti la sensazione che la persona con cui stai parlando sia proprio di fronte a te. A differenza delle normali videochiamate, recupera sottili segnali umani, come il contatto visivo e i movimenti naturali che variano con la tua prospettiva, dettagli che spesso vanno perduti sugli schermi piatti.

In questo articolo, approfondiremo cos'è Google Beam, come è stato sviluppato, come funziona e quali sono le sue applicazioni. Cominciamo!

Link to this sectionDa Project Starline a Google Beam#

Prima di esaminare più da vicino Google Beam, cerchiamo di capire meglio il suo predecessore, Project Starline.

Presentato al Google I/O 2021, Project Starline era un'iniziativa di ricerca volta a rendere la comunicazione remota più realistica, quasi come se fossi nella stessa stanza. Funzionava creando immagini 3D a grandezza naturale delle persone in tempo reale. Sebbene la tecnologia abbia attirato molta attenzione, richiedeva configurazioni complesse e hardware ingombrante.

Uno sguardo a Project Starline

Fig 2. Uno sguardo a Project Starline (Fonte).

Nel corso degli anni, man mano che la tecnologia avanzava, Google ha perfezionato il software e semplificato l'hardware. Dopo quattro anni di sviluppo, Project Starline si è evoluto in Google Beam, una soluzione più compatta e facile da usare.

Google Beam utilizza l'AI per migliorare le videochiamate creando immagini 3D più realistiche delle persone con cui parli. Trasforma i normali video 2D in viste che si adattano a diverse angolazioni, aiutando a mantenere il contatto visivo e rendendo le espressioni facciali più facili da vedere. Include anche funzionalità come la traduzione in tempo reale, il tracking della testa e l'audio spaziale.

Link to this sectionUna panoramica di Google Beam#

Google Beam è stato sviluppato per funzionare senza accessori aggiuntivi come visori per la realtà aumentata (AR) o la realtà virtuale (VR). Al contrario, viene fornito con il proprio display integrato, un sistema di telecamere e l'hardware necessario per creare visualizzazioni 3D. Questo rende le videochiamate più naturali, confortevoli e coinvolgenti rispetto alle tipiche riunioni video.

Un esempio dell'utilizzo di Google Beam

Fig 3. Un esempio di utilizzo di Google Beam (Fonte).

Link to this sectionCome Google Beam crea riunioni virtuali realistiche#

Ora che abbiamo discusso di come è nato Google Beam, analizziamo più da vicino come funziona.

Link to this sectionAcquisizione delle immagini per una collaborazione remota immersiva#

Tutto inizia con l'acquisizione delle informazioni visive. Beam utilizza sei telecamere ad alta risoluzione per scattare foto da diverse angolazioni contemporaneamente.

Queste telecamere aiutano a tracciare le caratteristiche del viso, il linguaggio del corpo e i piccoli movimenti in tempo reale. L'AI gioca un ruolo chiave ottimizzando le impostazioni della telecamera e mantenendo tutti i feed video perfettamente sincronizzati. Questo prepara il sistema alla fase successiva: l'elaborazione dei dati.

Link to this sectionDalle immagini 2D alla videoconferenza 3D#

Successivamente, l'AI viene utilizzata per combinare i sei feed video 2D e generare un modello 3D in tempo reale della persona inquadrata. Piuttosto che limitarsi a sovrapporre immagini 2D, ricostruisce profondità, ombre e relazioni spaziali per creare un gemello digitale 3D completo.

Per costruire questo modello 3D, Beam utilizza l'AI e tecniche di visione artificiale come la stima della profondità e il motion tracking. Questi metodi aiutano a determinare quanto una persona è lontana dalla telecamera, come si muove e come è posizionato il suo corpo. Con questi dati, il sistema può mappare accuratamente le caratteristiche del viso e le parti del corpo nello spazio 3D.

Il modello AI dietro Beam aggiorna la rappresentazione 3D a 60 fotogrammi al secondo (FPS) per mantenere le conversazioni fluide e realistiche. Effettua anche regolazioni in tempo reale per riflettere accuratamente i movimenti della persona.

Le sei fotocamere di Google Beam che catturano immagini da diverse angolazioni

Fig 4. Le sei telecamere di Google Beam acquisiscono immagini da diverse angolazioni (Fonte).

Link to this sectionSistemi di display a campo luminoso di Google Beam#

Il modello 3D viene visualizzato sul sistema Beam del ricevente utilizzando un display a campo luminoso (light-field). A differenza degli schermi convenzionali che presentano la stessa immagine a entrambi gli occhi, un display a campo luminoso emette immagini leggermente diverse per ogni occhio, simulando il modo in cui percepiamo la profondità nella vita reale. Questo crea un'esperienza visiva tridimensionale più realistica.

Scambio di virtual high-five tramite Google Beam

Fig 5. Scambio di cinque virtuali tramite Google Beam (Fonte).

Link to this sectionHead tracking in tempo reale con precisione millimetrica#

Una delle caratteristiche più impressionanti di Google Beam è la sua capacità di tracking AI in tempo reale. Il sistema utilizza un preciso tracking della testa e degli occhi per seguire i movimenti fin nei minimi dettagli.

Ad esempio, il motore AI di Beam può tracciare continuamente la posizione della testa dell'utente ed effettuare sottili regolazioni all'immagine in tempo reale. Questo crea l'impressione che la persona sullo schermo sia davvero seduta di fronte a te. Mentre muovi la testa, l'immagine 3D cambia di conseguenza, proprio come in una vera conversazione faccia a faccia.

Link to this sectionElaborazione audio per la comunicazione virtuale potenziata dall'AI#

Beam migliora anche l'esperienza audio utilizzando un suono spaziale che corrisponde alla posizione della persona sullo schermo. Se qualcuno si trova sul lato sinistro del display, la sua voce sembrerà provenire da sinistra. Man mano che cambia posizione, l'audio si regola di conseguenza. Questo rende le conversazioni più naturali e aiuta il tuo cervello a seguire chi sta parlando senza alcuno sforzo extra.

Ciò funziona combinando tecniche audio direzionali con il tracking in tempo reale. Beam utilizza l'audio spaziale per simulare come percepiamo naturalmente il suono nel mondo reale (in base alla direzione da cui proviene e a come raggiunge ogni orecchio). Il sistema traccia anche i movimenti della testa dello spettatore e regola l'uscita audio di conseguenza, in modo che il suono rimanga “attaccato” alla persona sullo schermo.

Link to this sectionApplicazioni di Google Beam#

Google Beam, sebbene sia ancora nelle fasi iniziali, mostra un potenziale promettente nel campo delle videoconferenze. Ecco alcune delle sue applicazioni principali:

  • Collaborazione remota: Google Beam può rendere le riunioni, specialmente le discussioni di leadership o le negoziazioni ad alto rischio, più personali ed efficaci. Catturando fattori sottili come il linguaggio del corpo e il contatto visivo, aiuta le persone a sentirsi più presenti, anche quando sono distanti.
  • Istruzione: Beam ha il potenziale per rendere l'apprendimento virtuale più coinvolgente e accessibile. Immagina uno scienziato che tiene una lezione dal vivo per studenti dall'altra parte del mondo, e sembra davvero che siano nella stessa stanza.
  • Sanità: Beam potrebbe rendere le consulenze remote più personali. Quando medici e pazienti possono vedersi chiaramente e mantenere un contatto visivo naturale, si crea fiducia e l'interazione appare più umana.
  • Industrie creative: Per chi lavora in campi creativi, come animatori, artisti e produttori, Beam può rendere il lavoro di squadra da remoto più semplice e naturale. Che si tratti di fare brainstorming o di revisionare un progetto, la sensazione è più quella di essere insieme in uno studio che in una videochiamata.

Link to this sectionPro e contro di Google Beam#

Ecco alcuni dei principali vantaggi che un'innovazione come Google Beam porta sul tavolo:

  • Nessun visore necessario: A differenza di molte tecnologie immersive, Beam funziona senza richiedere visori AR o VR. Questo rende l'esperienza più confortevole ed evita problemi comuni come la cinetosi o l'inconveniente di indossare attrezzature extra.
  • Affaticamento visivo ridotto: Il display 3D offre un'esperienza visiva più naturale e confortevole, che può aiutare a ridurre l'affaticamento degli occhi rispetto al fissare schermi piatti per lunghi periodi.
  • Traduzione linguistica in tempo reale: Beam può incorporare la traduzione in tempo reale basata su AI, rendendo più facile per le persone che parlano lingue diverse comunicare naturalmente in riunioni internazionali o ambienti di apprendimento.

Beam è un passo avanti promettente, ma come ogni nuova tecnologia, presenta alcune limitazioni. Ecco alcuni aspetti da considerare:

  • Requisiti hardware: Beam richiede attrezzature specializzate e di fascia alta, come display a campo luminoso e telecamere multiple, il che lo rende costoso e meno accessibile per i singoli e per le organizzazioni più piccole.
  • Non portatile: Il sistema Beam è progettato per un'installazione fissa e non è pensato per essere spostato facilmente, il che ne limita la flessibilità e l'uso in ambienti mobili o in continua evoluzione.

Link to this sectionPunti chiave#

Google Beam è un passo affascinante verso una comunicazione virtuale più umana. Sebbene sia ancora nelle sue fasi iniziali, ha il potenziale per trasformare il modo in cui ci incontriamo, ci connettiamo e collaboriamo. Combinando AI avanzata, imaging 3D e audio spaziale, crea un'esperienza remota più realistica e coinvolgente.

Mentre Google continua a migliorare l'hardware di Beam, rendendolo ancora più piccolo e potenzialmente accessibile agli utenti di tutti i giorni, si aprono prospettive entusiasmanti per il futuro della comunicazione virtuale. Insieme a nuovi trend tecnologici come le riunioni olografiche e gli avatar 3D, Beam sta definendo un nuovo standard per le riunioni virtuali.

Unisciti alla nostra community e dai un'occhiata alle nostre opzioni di licenza per iniziare oggi stesso con la visione artificiale. Controlla il nostro repository GitHub per saperne di più sull'AI. Leggi le nostre pagine sulle soluzioni per avere approfondimenti sui vari casi d'uso dell'AI nella vendita al dettaglio e della visione artificiale in agricoltura.

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning