Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Vision AI

OpenAI o1: una nuova serie di modelli OpenAI per il ragionamento AI

Scopri i nuovi modelli OpenAI o1 appena lanciati e cosa li rende speciali. Daremo anche un'occhiata a come funzionano e al loro impatto sul futuro dell'AI.

ABAbirami Vina
5 min read
OpenAI o1, una nuova serie di modelli OpenAI per il ragionamento AI

La community dell'IA è in fermento con speculazioni sul prossimo passo dei modelli GPT di OpenAI, che molti chiamano "Project Strawberry". Il motivo è che se chiedi a GPT-4o quante R ci sono nella parola "strawberry", ti risponderà che ci sono due R nella parola "strawberry". Può sembrare strano, considerando quanto sia potente GPT-4o. Tuttavia, il modello è costruito per elaborare il sottotesto, non le parole esatte. Si diceva che il prossimo modello avrebbe cercato di risolvere questo problema. Sam Altman ha alimentato ulteriormente queste voci pubblicando foto di fragole sul suo account X (precedentemente noto come Twitter).

Con l'ultimo annuncio di OpenAI di giovedì 12 settembre, abbiamo finalmente una risposta alle speculazioni! È stato rilasciato OpenAI o1, una nuova serie di modelli di IA progettati per rallentare e pensare prima di rispondere. È interessante notare che OpenAI o1 riesce a ragionare meglio e a rispondere correttamente alla domanda sulle fragole! In questo articolo parleremo di cos'è OpenAI o1, come funziona, dove può essere utilizzato e cosa significa per il futuro dell'IA. Iniziamo!

Un esempio di come interrogare OpenAI o1 riguardo alle fragole

Fig 1. Un esempio di richiesta a OpenAI o1 sulle fragole.

Link to this sectionNuovi progressi nell'IA da parte di OpenAI#

A luglio 2024, i dirigenti di OpenAI hanno condiviso che la ricerca di OpenAI si sta avvicinando a un livello umano di risoluzione dei problemi, indicato come livello 2 dell'IA. È chiaro che questo livello si concentra sul ragionamento, dato che OpenAI introduce la sua nuova serie di modelli, OpenAI o1, come un sistema che pensa prima di rispondere. OpenAI o1 è un nuovo LLM (large language model), un modello di IA che comprende e genera testo simile a quello umano imparando schemi da enormi quantità di dati linguistici. È stato progettato per gestire problemi complessi che richiedono un ragionamento approfondito.

La prospettiva di OpenAI sulle fasi dell'IA

Fig 2. La prospettiva di OpenAI sulle fasi dell'IA.

Il modello è stato addestrato utilizzando l'apprendimento per rinforzo, una tecnica in cui il modello impara a prendere decisioni migliori attraverso tentativi ed errori ricevendo premi o penalità per le sue azioni. L'algoritmo di apprendimento per rinforzo aiuta il modello a pensare in modo più efficace seguendo una catena di pensieri. OpenAI ha anche condiviso che le prestazioni di o1 migliorano continuamente con una maggiore formazione basata sull'apprendimento per rinforzo e con più tempo trascorso a "pensare" durante la risoluzione dei problemi, dimostrando che sia un addestramento prolungato che un'elaborazione ponderata aiutano a potenziare le capacità del modello.

Sebbene OpenAI o1 sia un progresso significativo per il ragionamento complesso, è ancora un modello iniziale e manca di alcune funzionalità che rendono ChatGPT utile, come la navigazione sul web o il caricamento di file e immagini. Per molte attività comuni, GPT-4o potrebbe essere ancora più capace per ora. Tuttavia, OpenAI o1 segna un grande passo avanti nella capacità dell'IA di gestire ragionamenti complessi, motivo per cui OpenAI sta avviando una nuova serie e la chiama OpenAI o1.

Link to this sectionCome i nuovi modelli OpenAI migliorano il ragionamento dell'IA#

OpenAI o1 può essere utilizzato per attività come decodificare cifrari, risolvere sfide di programmazione, rispondere a problemi di matematica, affrontare cruciverba e persino gestire argomenti complessi in scienza, sicurezza e sanità. Con un simpatico riferimento al nome in codice del progetto, OpenAI ha mostrato le capacità di ragionamento del modello decifrando un codice che ha rivelato il messaggio "THERE ARE THREE R’S IN STRAWBERRY."

Oltre a risolvere cifrari, OpenAI o1 è anche esperto di programmazione. Ottiene ottimi risultati in sfide di programmazione competitiva come quelle su Codeforces, una piattaforma in cui i programmatori risolvono complessi problemi di codice a tempo. In queste sfide, il modello raggiunge alti punteggi Elo (un sistema di punteggio che misura i livelli di abilità in base alle prestazioni contro altri concorrenti) e supera i modelli precedenti. Eccelle anche in matematica e ottiene buoni risultati in esami come l'American Invitational Mathematics Examination (AIME).

Benchmark delle capacità di programmazione di o1

Fig 3. Benchmarking delle capacità di programmazione di o1.

Questi progressi posizionano OpenAI o1 come un aggiornamento significativo rispetto ai modelli precedenti come GPT-4o. Apre nuove possibilità per l'IA in settori come business, sviluppo, ricerca e sanità. Ad esempio, nella ricerca genetica, OpenAI o1 può analizzare rapidamente un gran numero di articoli di ricerca, individuando scoperte chiave e connessioni tra marcatori genetici e malattie. Comprende un linguaggio scientifico complesso e può riassumere punti importanti, aiutando i ricercatori a concentrarsi sulle informazioni più rilevanti.

Link to this sectionUno sguardo più attento alla catena di pensiero#

Abbiamo visto in precedenza che OpenAI o1 introduce un processo di ragionamento chiamato "Chain of Thought". Consente al modello di affrontare problemi complessi in modo simile alle strategie cognitive umane. Il modello può suddividere le sfide in passaggi più piccoli e gestibili e perfezionare iterativamente il suo approccio. A differenza dei modelli precedenti che si basavano sul riconoscimento immediato di schemi, o1 ottimizza il suo processo decisionale esplorando molteplici percorsi di ragionamento, imparando sia dai successi che dagli errori attraverso l'apprendimento per rinforzo.

OpenAI ha deciso di mantenere nascoste agli utenti queste catene di pensieri grezze, offrendo invece riepiloghi che forniscono informazioni sul ragionamento del modello senza esporre ogni passaggio. Questa decisione aiuta a prevenire l'uso improprio del processo di pensiero del modello, consentendo comunque agli sviluppatori di monitorare e perfezionare la sicurezza e l'allineamento dell'IA. Osservando internamente le catene nascoste, gli sviluppatori possono garantire che o1 aderisca alle linee guida etiche ed eviti comportamenti dannosi.

Link to this sectionBenchmarking di OpenAI o1#

OpenAI o1 mostra notevoli miglioramenti rispetto a GPT-4o in diversi benchmark che testano le capacità di ragionamento e di risoluzione dei problemi. All'American Invitational Mathematics Examination (AIME) 2024, un impegnativo esame di matematica per i migliori studenti delle scuole superiori, o1 ha raggiunto un tasso di precisione del 74% con un solo campione per problema, rispetto al 12% di GPT-4o. Con il consenso su 64 campioni, la sua precisione è aumentata all'83% e, utilizzando un metodo di ri-classificazione raffinato con 1.000 campioni, ha raggiunto il 93%, collocandosi tra i primi 500 studenti a livello nazionale.

Oltre alla matematica, o1 ha ottenuto risultati eccezionali anche nei benchmark che testano le conoscenze scientifiche, come il GPQA Diamond, che copre domande di livello dottorato in chimica, fisica e biologia. Sorprendentemente, o1 ha superato esperti umani con dottorato in questo test, diventando il primo modello di IA a farlo. Ha anche superato GPT-4o in 54 categorie su 57 nel benchmark MMLU, che testa la comprensione in una vasta gamma di materie, tra cui storia, diritto e scienza.

Benchmark di OpenAI o1

Fig 4. Benchmarking di OpenAI o1.

Link to this sectionProva OpenAI o1#

OpenAI ha introdotto due nuovi modelli di IA nella serie o1: o1-preview e o1-mini. Il modello o1-preview è progettato per pensare più profondamente prima di rispondere, eccellendo in compiti di ragionamento complesso in ambito scientifico, di programmazione e di matematica. Offre capacità avanzate di risoluzione dei problemi per gli utenti che affrontano progetti impegnativi. Al contrario, o1-mini è un modello più piccolo, più veloce e più conveniente, ottimizzato specificamente per il ragionamento STEM, in particolare matematica e programmazione. Sebbene possa avere una conoscenza del mondo meno ampia, o1-mini eguaglia quasi le prestazioni di o1-preview in valutazioni chiave come la competizione matematica AIME e le sfide di programmazione Codeforces, il tutto a un costo inferiore dell'80%.

Confronto tra modelli OpenAI

Fig 5. Confronto tra i modelli OpenAI.

Puoi provare questi modelli attraverso varie piattaforme OpenAI. Gli utenti di ChatGPT Plus e Team possono accedere sia a o1-preview che a o1-mini tramite il selettore di modelli, sperimentando funzionalità di ragionamento avanzate direttamente in ChatGPT. Gli sviluppatori con accesso API di livello 5 possono iniziare a creare prototipi con questi modelli, sebbene alcune funzionalità avanzate siano ancora in fase di sviluppo. OpenAI prevede anche di rendere o1-mini disponibile a tutti gli utenti di ChatGPT Free a breve. Esplorando questi modelli, potrai sperimentare in prima persona i progressi nel ragionamento dell'IA e scegliere quello che meglio si adatta alle tue esigenze.

Link to this sectionConsiderazioni sull'IA etica da parte di OpenAI#

OpenAI si è concentrata sull'etica e la sicurezza durante lo sviluppo della serie di modelli o1. Prima di rilasciare i modelli o1-preview e o1-mini, hanno condotto valutazioni approfondite, inclusi test esterni e controlli interni per rischi come contenuti non consentiti, allucinazioni e pregiudizi. I modelli sono progettati con capacità di ragionamento avanzate per comprendere e seguire meglio le regole di sicurezza.

OpenAI ha anche implementato misure di salvaguardia come liste di blocco e classificatori di sicurezza per gestire i rischi. Il modello o1 ha un livello di rischio complessivo medio. Presenta rischi bassi in aree come la sicurezza informatica e l'autonomia del modello e rischi medi in aree come i contenuti CBRN (chimici, biologici, radiologici e nucleari) e la persuasione. Il Safety Advisory Group e il Board di OpenAI hanno esaminato queste misure di sicurezza per garantire che il modello sia sicuro ed etico da utilizzare.

Scorecard di OpenAI o1

Fig 6. Scorecard di OpenAI o1.

Link to this sectionDalle voci alla realtà: OpenAI o1 entra in scena#

OpenAI o1 è un grande passo avanti nel ragionamento dell'IA, trasformando alcune delle prime voci in realtà. A differenza di GPT-4o, la serie o1 pensa in modo più approfondito utilizzando un approccio "Chain of Thought", suddividendo problemi complessi in passaggi più piccoli per risposte migliori. Attualmente disponibile come anteprima anticipata in ChatGPT e nell'API, OpenAI prevede di aggiungere funzionalità come la navigazione web e il caricamento di file e immagini. OpenAI ha anche condiviso che prevede di continuare a sviluppare e rilasciare modelli della serie GPT, insieme alla nuova serie OpenAI o1. Mentre l'IA continua a evolversi, progressi come questi stanno aprendo la strada a sistemi di IA più potenti, intuitivi e versatili che possono assistere e comprendere meglio le esigenze umane.

Rimani aggiornato sulle ultime novità nell'IA unendoti alla nostra community! Vai al nostro repository GitHub per vedere come stiamo sperimentando soluzioni di IA in settori come la produzione e la sanità. 🚀

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning