Esplorazione delle ultime funzionalità di Grok 3: il chatbot di xAI

Abirami Vina

5 minuti di lettura

10 marzo 2025

Scoprite il modello LLM (large language model) Grok 3, le sue modalità specializzate e i benchmark. Scoprite come compete con i principali modelli e imparate a usarlo.

Lanciato il 17 febbraio 2025, Grok 3 è un LLM (large language model) sviluppato da xAI, una società fondata da Elon Musk. In precedenza, abbiamo dato un'occhiata al lancio di Grok 2.0 e alla sua integrazione con FLUX.1. Partendo da queste basi, Grok 3 offre un ragionamento migliore, tempi di risposta più rapidi e accesso alle informazioni in tempo reale. Come le versioni precedenti, Grok 3 è integrato con X (ex Twitter). 

Durante il lancio di Grok 3, Elon Musk, CEO di xAI, e il suo team hanno spiegato le motivazioni alla base di Grok. Hanno sottolineato che la missione di Grok 3 e di xAI è quella di scoprire le verità dell'universo attraverso un'incessante curiosità, anche se questo a volte significa che la verità è in contrasto con ciò che è politicamente corretto.

Elon ha anche spiegato il significato del nome del modello: "Grok è una parola tratta da un romanzo di Heinlein, Stranger in a Strange Land. È usata da un ragazzo cresciuto su Marte, e la parola Grok significa comprendere pienamente e profondamente qualcosa".

__wf_reserved_inherit
Figura 1. Il lancio di Grok 3.

In questo articolo esploreremo le caratteristiche di Grok 3, i suoi benchmark di prestazioni e le sue varie modalità AI. Iniziamo!

L'evoluzione di Grok 3

Prima di dare uno sguardo dettagliato a Grok 3, ripercorriamo l'evoluzione di Grok. Ecco una rapida carrellata delle tappe fondamentali che hanno portato a Grok 3:

  • Grok 0: è stato il primo prototipo di ricerca di xAI, che utilizza 33 miliardi di parametri - pesi regolabili che consentono al modello di catturare modelli linguistici complessi.
  • Grok 1: la prima versione pubblica di Grok fu lanciata nel novembre 2023. Era in grado di partecipare a discussioni su argomenti di tendenza, ma aveva capacità di ragionamento limitate.
  • Grok 1.5: questa versione è arrivata nel marzo del 2024 e offre una memoria e un ragionamento logico migliori. Sebbene abbia mostrato dei miglioramenti, aveva ancora difficoltà con gli aggiornamenti in tempo reale e la risoluzione di problemi complessi.
  • Grok 2: ha debuttato nell'agosto 2024 con prestazioni migliorate, ragionamento avanzato e integrazione dei dati in tempo reale. Nonostante i miglioramenti, generava ancora allucinazioni (risposte plausibili ma imprecise) su argomenti di nicchia.

La tecnologia alla base dello sviluppo di Grok 3

Con il miglioramento di ogni versione, lo sviluppo di Grok ha richiesto un'infrastruttura più potente per supportare le funzioni avanzate e l'apprendimento in tempo reale. Le iterazioni precedenti avevano limiti di velocità e adattabilità, quindi xAI ha sfruttato un sistema più capace per soddisfare le crescenti esigenze del modello di intelligenza artificiale.

Al centro di questo aggiornamento c'è Colossus, un supercomputer progettato da xAI. Colossus è stato costruito in soli 122 giorni. xAI ha installato 100.000 GPU NVIDIA H100 (Graphics Processing Units), creando uno dei più grandi data center di AI. Poi, in 92 giorni, il numero di GPU è stato raddoppiato. Questo ha permesso a Grok 3 di elaborare più dati, imparare più velocemente e migliorare man mano che le persone interagivano con lui.

__wf_reserved_inherit
Figura 2. Grok 3 è alimentato da Colossus.

Inoltre, per mantenere velocità ed efficienza, Grok 3 utilizza una tecnica chiamata test-time compute at scale (TTCS). Questa tecnica regola la potenza di calcolo in base alla complessità della domanda: le domande semplici utilizzano meno energia, mentre quelle più complesse ricevono risorse aggiuntive. In questo modo il modello è in grado di fornire risposte rapide e precise, utilizzando le risorse in modo efficiente.

Versioni specializzate del modello Grok 3 AI

Una delle caratteristiche principali di Grok 3 è che è disponibile in versioni specializzate che possono essere utilizzate per compiti diversi. Vediamo come ogni versione aumenta le prestazioni e migliora l'esperienza dell'utente.

Grok 3 Mini: Progettato per attività semplici e veloci

Con l'ingresso dell'intelligenza artificiale generativa nella vita di tutti i giorni, è probabile che vi siate imbattuti in chatbot che impiegano troppo tempo per rispondere. Grok 3 Mini, una versione semplificata di Grok 3, è stato progettato per risolvere questo problema, fornendo risposte rapide con una minore richiesta di calcolo. 

Il sistema conserva le funzionalità principali di Grok 3, rendendolo utile per le applicazioni che richiedono prestazioni fluide e convenienti nelle conversazioni in tempo reale. Ad esempio, i chatbot di assistenza clienti e gli assistenti virtuali interattivi possono utilizzare Grok 3 Mini.

Grok 3 Think: costruito per la risoluzione di problemi complessi

Mentre Grok 3 Mini è progettato per la velocità, Grok 3 Think è costruito per il ragionamento avanzato e l'analisi profonda. Addestrato attraverso l'apprendimento per rinforzo su larga scala, Grok 3 Think affronta problemi complessi analizzando attentamente le query, correggendo gli errori attraverso il backtracking ed esplorando più approcci. 

Ad esempio, quando si risolve un problema matematico in più fasi, Grok 3 Think lo suddivide in passaggi logici. La modalità Think, unica nel suo genere, consente agli utenti di ispezionare la catena di pensiero che sta dietro alla risposta finale. Questa modalità è utile per compiti come prove matematiche, sfide di codifica e problemi basati sulla logica.

Una panoramica delle varie modalità di Grok 3 

Oltre alla modalità Pensa, Grok 3 dispone di un paio di modalità progettate per compiti diversi. Vediamo di seguito queste modalità di Grok 3 e di esplorare le funzioni aggiuntive che offrono.

La modalità Big Brain di Grok 3 per il ragionamento avanzato dell'intelligenza artificiale

La modalità Big Brain di Grok 3 può essere utilizzata per compiti che richiedono un'analisi profonda e la risoluzione di problemi strutturati. Va oltre l'elaborazione standard utilizzando una potenza di calcolo supplementare per affrontare sfide complesse con maggiore precisione.

In particolare, questa modalità privilegia il ragionamento dettagliato rispetto alla velocità. Richiede più tempo per generare le risposte, ma fornisce intuizioni ben strutturate, utili per la ricerca, la codifica e i compiti di intelligenza artificiale in più fasi. Ricercatori e sviluppatori possono utilizzare questa modalità per compiti in cui l'accuratezza è una priorità. 

La modalità DeepSearch di Grok 3 per approfondimenti ben studiati

La modalità DeepSearch di Grok 3 aiuta il modello a rimanere aggiornato, recuperando dati dal vivo e verificando le fonti prima di rispondere. A differenza di molti modelli di intelligenza artificiale che si basano esclusivamente sulle conoscenze memorizzate, che possono diventare rapidamente obsolete, DeepSearch recupera le informazioni più recenti dal web. In questo modo le risposte rimangono accurate anche quando i fatti e gli eventi si evolvono rapidamente. 

Che si tratti di seguire le ultime notizie, di seguire le tendenze del mercato o di verificare le nuove scoperte scientifiche, DeepSearch è un modo rapido e affidabile per accedere alle informazioni più aggiornate. 

Colmando il divario tra i dati di addestramento statici e il flusso in continua evoluzione degli eventi del mondo reale, DeepSearch migliora l'accuratezza e la pertinenza delle risposte di Grok 3.

__wf_reserved_inherit
Figura 3. Uno sguardo alla modalità DeepSearch di Grok 3.

Una panoramica dei benchmark delle prestazioni di Grok 3

Quando si tratta di benchmarking, Grok 3 offre risultati impressionanti in una serie di compiti. Per quanto riguarda il ragionamento, ha ottenuto il 93,3% nell'American Invitational Mathematics Examination (AIME) del 2025, dimostrando la sua forte capacità di affrontare problemi matematici complessi. Ha inoltre ottenuto l'84,6% nei compiti di ragionamento per esperti di livello universitario (GPQA) e il 79,4% nelle sfide di codifica misurate da LiveCodeBench, dimostrando la sua abilità nel gestire la risoluzione di problemi in più fasi e la generazione di codice.

Anche la sua versione semplificata, Grok 3 Mini, ha ottenuto risultati notevoli, con un punteggio del 95,8% su AIME 2024 e dell'80,4% su LiveCodeBench, il che dimostra che è in grado di bilanciare efficienza e prestazioni elevate.

__wf_reserved_inherit
Figura 4. Grok 3 supera i principali modelli di intelligenza artificiale nei principali benchmark.

Grok 3 vs ChatGPT

Vi starete chiedendo: come si pone Grok 3 rispetto al suo più grande concorrente, ChatGPT? ChatGPT di OpenAI è stato per anni un nome di spicco nel settore dell'intelligenza artificiale, migliorando costantemente con ogni nuova versione. 

Nel frattempo, Grok è entrato nel mercato più tardi, nel 2023, partendo da uno svantaggio. Le prime versioni hanno faticato a ragionare, soprattutto se confrontate con il GPT-4

Tuttavia, xAI si è messo al passo con Grok 1.5 e Grok 2. Ora, con Grok 3, ha apportato notevoli miglioramenti. Ora, con Grok 3, sono stati apportati miglioramenti significativi. Infatti, se confrontato con i suoi concorrenti, Grok 3 dimostra costantemente capacità avanzate di ragionamento e di risoluzione dei problemi che lo distinguono nei compiti che richiedono analisi approfondite e riflessioni complesse.

__wf_reserved_inherit
Figura 5. Grok 3 vs ChatGPT.

Comprendere il dibattito su Grok 3 

Con l'evoluzione di Grok, sono state sollevate alcune preoccupazioni riguardo alla moderazione dei contenuti e all'accuratezza delle informazioni. Ad esempio, la sua nuova modalità di interazione vocale - disponibile per gli abbonati premium - offre una serie di personalità, tra cui un'impostazione "scombinata" che utilizza un linguaggio forte e un tono schietto. 

Se da un lato questa modalità riflette l'obiettivo di xAI di fornire un'esperienza conversazionale più libera, dall'altro sollecita importanti discussioni sulla creazione di linee guida e sulla mitigazione della diffusione della disinformazione.

Allo stesso modo, poiché Grok 3 può utilizzare dati in tempo reale da X, può generare informazioni non verificate o distorte. A differenza dei modelli che si basano su dati statici, i continui aggiornamenti rendono la moderazione più impegnativa. Queste discussioni evidenziano la sfida continua dello sviluppo di un'intelligenza artificiale responsabile

Come utilizzare Grok 3 AI

Nonostante queste preoccupazioni, Grok 3 viene ampiamente utilizzato. Se siete interessati a provarlo, ecco come accedere alle sue funzioni: 

  • Interfaccia di chat: Gli utenti possono interagire con Grok 3 attraverso la sua interfaccia di chat per attività quali la risposta a domande, la generazione di contenuti e l'assistenza alla codifica.
  • Applicazione mobile: Grok 3 è accessibile su piattaforme iOS e Android attraverso l'applicazione dedicata.

  • Piani premium: Grok 3 offre funzioni avanzate attraverso i piani premium.

  • API: Gli sviluppatori possono attualmente accedere all'API di Grok 2. L'API per Grok 3 non è ancora stata rilasciata, ma xAI ha dichiarato che sarà presto disponibile.

Punti di forza

Grok 3 è un LLM con funzioni di apprendimento in tempo reale e modalità specializzate. Si distingue in aree come la ricerca, il coding e la risoluzione di problemi, grazie all'estrazione di dati in tempo reale per ottenere risposte più accurate.

Sebbene la moderazione dei contenuti rimanga un argomento di discussione, la sua capacità di migliorare e adattarsi lo ha trasformato in un forte concorrente nello spazio dei chatbot AI. Con ogni aggiornamento, Grok diventa sempre più avanzato. 

Unisciti alla nostra comunità ed esplora gli ultimi progressi in materia di IA sul nostro repository GitHub. Scoprite l'IA nelle auto a guida autonoma e la visione computerizzata nella sanità attraverso le nostre pagine dedicate alle soluzioni. Scoprite i nostri piani di licenza e iniziate a lavorare con l'IA oggi stesso!

Costruiamo insieme il futuro
dell'IA!

Iniziate il vostro viaggio nel futuro dell'apprendimento automatico

Iniziare gratuitamente
Link copiato negli appunti