O modelo mundial de IA Genie 3 da DeepMind converte prompts de texto ou imagem em ambientes 3D. Este avanço marca mais um passo em direção à inteligência semelhante à humana.
.webp)
O modelo mundial de IA Genie 3 da DeepMind converte prompts de texto ou imagem em ambientes 3D. Este avanço marca mais um passo em direção à inteligência semelhante à humana.
.webp)
Em 5 de agosto de 2025, Google DeepMind lançou a sua última versão do modelo Genie, conhecido como Genie 3. Trata-se de um novo modelo de IA que pode converter as instruções de texto de um utilizador em ambientes dinâmicos e interactivos.
Esses ambientes, ou mundos de IA, possibilitam que o usuário navegue e interaja com eles em tempo real, como em um videogame. Os usuários também podem expandir ou modificar o ambiente, fornecendo prompts de texto adicionais, permitindo alterações em tempo real sem reiniciar a simulação.
O que torna o mais recente modelo Genie Google particularmente impactante é o facto de poder ser utilizado para treinar agentes de IA. Isto implica ensinar os agentes de IA a tomar decisões ou a executar tarefas utilizando dados e feedback. Ao utilizar um ambiente 3D simulado em vez do mundo real, os investigadores podem evitar muitos dos desafios, custos e riscos da formação no mundo real.
Google Genie 3 também pode simular cenários complexos, como testar um carro autónomo a conduzir com mau tempo ou um fato de asa a planar em terreno montanhoso.
Neste artigo, vamos explorar Google Genie 3 e as suas capacidades. Vamos começar!

Antes de nos debruçarmos sobre os modelos Genie do Google DeepMind, vamos compreender melhor o que são modelos mundiais.
Os modelos mundiais são sistemas de IA que aprendem regras do mundo real, como física, movimento e relações espaciais, a partir de texto, imagens, vídeos e conjuntos de dados de movimento. Isto permite-lhes criar cenas realistas e prever como elas evoluem. Os modelos Genie são exemplos de tais sistemas.
Aqui está uma breve descrição dos modelos anteriores Google Genie que abriram caminho para o Genie 3:
Com base nos modelos Genie anteriores, o Genie 3 é o mais recente e mais avançado da série. Baseia-se particularmente no Genie 2, que pode gerar novos ambientes virtuais, e no Veo 3, o mais recente modelo de geração de vídeo da Google DeepMind. O Veo 3 demonstra uma profunda compreensão da física e da forma como os objectos interagem no mundo real.
Enquanto o Veo 3 utiliza um motor de física codificado, Google Genie 3 ensina a si próprio como funciona a física utilizando um método conhecido como aprendizagem auto-supervisionada. Trata-se de uma técnica de aprendizagem de IA em que um modelo de IA aprende padrões e relações a partir de dados não rotulados, gerando os seus próprios sinais de aprendizagem.
A capacidade de aprendizagem auto-supervisionada do Google Genie 3 é crucial para a formação de sistemas de IA, como agentes de IA ou robôs de IA, para lidar com várias tarefas. De facto, os investigadores da Google DeepMind vêem o Genie 3 como um passo importante para a criação da Inteligência Artificial Geral (AGI).

AGI é uma forma teórica de IA que pode entender e aprender qualquer tarefa ou assunto e aplicar esse conhecimento em diferentes situações, muito parecido com um humano. Ao contrário dos modelos de inteligência artificial de hoje, que são construídos para tarefas específicas e lutam para transferir suas habilidades para novos problemas, a AGI seria capaz de se adaptar e aprender em uma ampla gama de contextos.
Aqui estão alguns dos principais recursos suportados pelo Genie 3:

Google Genie 3 pode tornar a aprendizagem, a investigação e a formação mais envolventes e cativantes. Por exemplo, nas salas de aula, pode dar vida à história, à ciência ou à geografia, permitindo que os alunos explorem cidades antigas ou viajem pelo espaço. Do mesmo modo, para os programadores de inteligência artificial, oferece mundos virtuais realistas para praticar estratégias, enfrentar desafios e melhorar as capacidades de tomada de decisões.
Os cientistas também podem usá-lo para criar simulações controladas para testar ideias, estudar ecossistemas ou observar o comportamento de objetos. Outra aplicação interessante é no desenvolvimento de jogos de vídeo. Os desenvolvedores de jogos podem transformar prompts de texto em mundos de jogos detalhados, acelerando o desenvolvimento e reduzindo a necessidade de grandes equipes.

Embora Google Genie 3 ofereça muitas funcionalidades e vantagens, também é importante ter em conta as suas desvantagens.
Aqui estão algumas limitações a serem consideradas:
Google Genie 3 representa um avanço significativo na criação de mundos 3D realistas e interactivos com IA. Pode dar vida a ideias a partir de simples comandos de texto, simular a física e até treinar sistemas de IA em espaços virtuais seguros.
Embora ainda tenha limites, abre muitas possibilidades para pesquisa, jogos e desenvolvimento de IA. É também um passo crucial em direção a sistemas AGI que podem pensar e aprender mais como os humanos.
Confira nosso repositório no GitHub para descobrir mais sobre IA. Junte-se à nossa comunidade ativa e descubra inovações em setores como IA no varejo e Visão de IA na manufatura. Para começar a usar a visão computacional hoje mesmo, confira nossas opções de licenciamento.