OpenAI o1: Uma nova série de modelos OpenAI para raciocínio de IA
Informa-te sobre os modelos OpenAI o1 recentemente lançados e o que os torna especiais. Também vamos analisar como funcionam e o seu impacto no futuro da IA.

A comunidade de IA tem estado repleta de especulações sobre o próximo passo para os modelos GPT da OpenAI, com muitos a referirem-se a ele como "Projeto Strawberry". A razão por trás disso é que, se pedires ao GPT-4o para contar quantos R's existem na palavra "strawberry", ele dir-te-á que existem dois R's na palavra "strawberry." Pode parecer estranho, considerando quão poderoso é o GPT-4o. No entanto, o modelo foi criado para processar o subtexto, não as palavras exatas. Havia rumores de que o próximo modelo visaria resolver isto. Sam Altman alimentou ainda mais estes rumores ao publicar fotos de morangos na sua conta no X (anteriormente conhecido como Twitter).
Com o anúncio mais recente da OpenAI na quinta-feira, 12 de setembro, finalmente temos uma resposta para a especulação! Foi lançado o OpenAI o1, uma nova série de modelos de IA concebidos para abrandar e pensar antes de responder. Curiosamente, o OpenAI o1 consegue raciocinar melhor e responder corretamente à pergunta sobre morangos! Neste artigo, vamos discutir o que é o OpenAI o1, como funciona, onde pode ser utilizado e o que significa para o futuro da IA. Vamos começar!

Fig 1. Um exemplo de como solicitar ao OpenAI o1 informações sobre morangos.
Link to this sectionNovos avanços em IA pela OpenAI#
Em julho de 2024, os executivos da OpenAI partilharam que a investigação da OpenAI está a aproximar-se de um nível humano de resolução de problemas, referido como nível 2 de IA. É claro que este nível se concentra no raciocínio, uma vez que a OpenAI apresenta a sua nova série de modelos, OpenAI o1, como algo que pensa antes de responder. O OpenAI o1 é um novo LLM (modelo de linguagem grande), um modelo de IA que compreende e gera texto semelhante ao humano ao aprender padrões a partir de enormes quantidades de dados linguísticos. Foi concebido para lidar com problemas complexos que exigem um raciocínio profundo.

Fig 2. Perspetiva da OpenAI sobre as Fases da IA.
O modelo foi treinado utilizando aprendizagem por reforço, uma técnica em que o modelo aprende a tomar melhores decisões através de tentativa e erro, recebendo recompensas ou penalizações pelas suas ações. O algoritmo de aprendizagem por reforço ajuda o modelo a pensar de forma mais eficaz, seguindo uma cadeia de pensamento. A OpenAI partilhou também que o desempenho do o1 continua a melhorar com mais aprendizagem por reforço durante o treino e com mais tempo gasto a "pensar" durante a resolução de problemas, mostrando que tanto o treino prolongado como o processamento reflexivo ajudam a impulsionar as capacidades do modelo.
Embora o OpenAI o1 seja um avanço significativo para o raciocínio complexo, ainda é um modelo inicial e carece de algumas funcionalidades que tornam o ChatGPT útil, tais como navegar na web ou carregar ficheiros e imagens. Para muitas tarefas comuns, o GPT-4o pode ainda ser mais capaz por enquanto. No entanto, o OpenAI o1 marca um grande passo em frente na capacidade da IA para lidar com raciocínio complexo, motivo pelo qual a OpenAI está a iniciar uma nova série e a chamá-la de OpenAI o1.
Link to this sectionComo os novos modelos da OpenAI melhoram o raciocínio da IA#
O OpenAI o1 pode ser usado para tarefas como decifrar códigos, resolver desafios de programação, responder a problemas matemáticos, abordar palavras cruzadas e até lidar com tópicos complexos em ciência, segurança e saúde. Numa alusão divertida ao nome de código do projeto, a OpenAI demonstrou as competências de raciocínio do modelo ao decifrar um código que revelou a mensagem "THERE ARE THREE R’S IN STRAWBERRY."
Para além de resolver códigos, o OpenAI o1 também tem competências em codificação. Tem um bom desempenho em desafios de programação competitiva como os do Codeforces, uma plataforma onde programadores resolvem problemas complexos de código em condições cronometradas. Nestes desafios, o modelo atinge classificações Elo elevadas (um sistema de pontuação que mede níveis de habilidade com base no desempenho contra outros concorrentes) e supera modelos anteriores. Também se destaca em matemática e tem um bom desempenho em exames como o American Invitational Mathematics Examination (AIME).

Fig 3. Benchmarking das Capacidades de Codificação do o1.
Estes avanços posicionam o OpenAI o1 como uma atualização significativa em relação a modelos anteriores como o GPT-4o. Abre novas possibilidades para a IA em áreas como negócios, desenvolvimento, investigação e saúde. Por exemplo, na investigação genética, o OpenAI o1 pode analisar rapidamente um grande número de artigos de investigação, selecionando descobertas-chave e ligações entre marcadores genéticos e doenças. Compreende linguagem científica complexa e pode resumir pontos importantes, ajudando os investigadores a concentrarem-se na informação mais relevante.
Link to this sectionUm olhar mais atento à cadeia de pensamento#
Vimos anteriormente que o OpenAI o1 introduz um processo de raciocínio de "Cadeia de Pensamento". Permite ao modelo enfrentar problemas complexos de uma forma semelhante às estratégias cognitivas humanas. O modelo pode dividir desafios em passos menores e geríveis e refinar iterativamente a sua abordagem. Ao contrário de modelos anteriores que dependiam do reconhecimento de padrões imediato, o o1 otimiza a sua tomada de decisão explorando múltiplos caminhos de raciocínio, aprendendo tanto com os sucessos como com os erros através da aprendizagem por reforço.
A OpenAI decidiu manter estas cadeias de pensamento brutas ocultas dos utilizadores, oferecendo em vez disso resumos que fornecem uma visão do raciocínio do modelo sem expor cada passo. Esta decisão ajuda a prevenir a utilização indevida do processo de pensamento do modelo, permitindo ainda que os programadores monitorem e refinem a segurança e o alinhamento da IA. Ao observar as cadeias ocultas internamente, os programadores podem garantir que o o1 adere às diretrizes éticas e evita comportamentos prejudiciais.
Link to this sectionBenchmarking do OpenAI o1#
O OpenAI o1 apresenta grandes melhorias em relação ao GPT-4o em vários benchmarks que testam competências de raciocínio e resolução de problemas. No American Invitational Mathematics Examination (AIME) 2024, um exame de matemática desafiante para os melhores alunos do ensino secundário, o o1 atingiu uma taxa de precisão de 74% com apenas uma amostra por problema, comparado com 12% do GPT-4o. Com consenso em 64 amostras, a sua precisão aumentou para 83%, e ao usar um método de reclassificação refinado com 1.000 amostras, atingiu 93%, colocando-o entre os 500 melhores alunos nacionalmente.
Para além da matemática, o o1 também teve um desempenho excecional em benchmarks que testam conhecimentos científicos, como o GPQA Diamond, que abrange questões de nível de doutoramento em química, física e biologia. Notavelmente, o o1 superou especialistas humanos com doutoramento neste teste, tornando-o o primeiro modelo de IA a fazê-lo. Também superou o GPT-4o em 54 de 57 categorias no benchmark MMLU, que testa a compreensão num conjunto diversificado de assuntos, incluindo história, direito e ciência.

Fig 4. Benchmarking do OpenAI o1.
Link to this sectionExperimenta o OpenAI o1#
A OpenAI apresentou dois novos modelos de IA na série o1: o1-preview e o1-mini. O modelo o1-preview foi concebido para pensar mais profundamente antes de responder, destacando-se em tarefas de raciocínio complexas em ciência, codificação e matemática. Oferece capacidades avançadas de resolução de problemas para utilizadores que enfrentam projetos desafiantes. Em contraste, o o1-mini é um modelo mais pequeno, mais rápido e mais rentável, otimizado especificamente para raciocínio STEM, particularmente matemática e codificação. Embora possa ter menos conhecimento geral do mundo, o o1-mini quase iguala o desempenho do o1-preview em avaliações chave como a competição de matemática AIME e os desafios de codificação do Codeforces, tudo com 80% menos custo.

Fig 5. Comparação de Modelos da OpenAI.
Podes experimentar estes modelos através de várias plataformas da OpenAI. Os utilizadores do ChatGPT Plus e Team podem aceder tanto ao o1-preview como ao o1-mini através do seletor de modelos, experienciando capacidades de raciocínio melhoradas diretamente no ChatGPT. Os programadores com acesso de nível 5 à API podem começar a criar protótipos com estes modelos, embora algumas funcionalidades avançadas ainda estejam em desenvolvimento. A OpenAI também planeia disponibilizar o o1-mini para todos os utilizadores do ChatGPT Free em breve. Ao explorares estes modelos, podes vivenciar em primeira mão os avanços no raciocínio da IA e escolher aquele que melhor se adapta às tuas necessidades.
Link to this sectionConsiderações éticas de IA feitas pela OpenAI#
A OpenAI concentrou-se em ética e segurança durante o desenvolvimento da série de modelos o1. Antes de lançar os modelos o1-preview e o1-mini, realizaram avaliações exaustivas, incluindo testes externos e verificações internas de riscos como conteúdo proibido, alucinações e preconceitos. Os modelos são concebidos com capacidades de raciocínio avançadas para compreender e seguir melhor as regras de segurança.
A OpenAI também implementou salvaguardas como listas de bloqueio e classificadores de segurança para gerir riscos. O modelo o1 tem uma classificação de risco global média. Apresenta baixos riscos em áreas como cibersegurança e autonomia do modelo e riscos médios em áreas como conteúdo CBRN (Químico, Biológico, Radiológico e Nuclear) e persuasão. O Grupo Consultivo de Segurança e o Conselho da OpenAI reviu estas medidas de segurança para garantir que o modelo é seguro e ético de usar.

Fig 6. Cartão de Pontuação do OpenAI o1.
Link to this sectionDos rumores à realidade: o OpenAI o1 entra em cena#
O OpenAI o1 é um grande passo em frente no raciocínio da IA, transformando alguns dos primeiros rumores em realidade. Ao contrário do GPT-4o, a série o1 pensa mais profundamente ao usar uma abordagem de "Cadeia de Pensamento", dividindo problemas complexos em passos menores para melhores respostas. Atualmente disponível como uma pré-visualização inicial no ChatGPT e na API, a OpenAI planeia adicionar funcionalidades como navegação na web e carregamento de ficheiros e imagens. A OpenAI partilhou também que planeia continuar a desenvolver e lançar modelos na série GPT, juntamente com a nova série OpenAI o1. À medida que a IA continua a evoluir, avanços como estes estão a abrir caminho para sistemas de IA mais poderosos, intuitivos e versáteis que podem ajudar e compreender melhor as necessidades humanas.
Mantém-te a par das últimas novidades em IA juntando-te à nossa comunidade! Dirige-te ao nosso repositório GitHub para veres como somos pioneiros em soluções de IA em setores como manufatura e saúde. 🚀






