DeepMind의 Genie 3 AI 월드 모델은 텍스트 또는 이미지 프롬프트를 3D 환경으로 변환합니다. 이러한 발전은 인간과 유사한 지능을 향한 또 다른 단계를 의미합니다.
.webp)
DeepMind의 Genie 3 AI 월드 모델은 텍스트 또는 이미지 프롬프트를 3D 환경으로 변환합니다. 이러한 발전은 인간과 유사한 지능을 향한 또 다른 단계를 의미합니다.
.webp)
2025년 8월 5일, Google 딥마인드는 최신 버전의 지니 모델인 지니 3을 출시했습니다. 이는 사용자의 텍스트 프롬프트를 동적인 대화형 환경으로 변환할 수 있는 새로운 AI 모델입니다.
이러한 환경 또는 AI 세계를 통해 사용자는 비디오 게임에서와 마찬가지로 실시간으로 탐색하고 상호 작용할 수 있습니다. 또한 사용자는 추가 텍스트 프롬프트를 제공하여 환경을 확장하거나 수정할 수 있으므로 시뮬레이션을 다시 시작하지 않고도 즉석에서 변경할 수 있습니다.
최신 Genie Google 모델이 특히 영향력 있는 이유는 AI 에이전트를 교육하는 데 사용할 수 있다는 점입니다. 여기에는 데이터와 피드백을 사용하여 AI 에이전트가 의사 결정을 내리거나 작업을 수행하도록 교육하는 것이 포함됩니다. 연구자들은 실제 세계 대신 시뮬레이션된 3D 환경을 사용함으로써 실제 훈련에서 발생하는 많은 어려움, 비용, 위험을 피할 수 있습니다.
또한 Google 지니 3는 악천후를 통과하는 자율 주행 자동차나 산악 지형을 활공하는 윙슈트 테스트와 같은 복잡한 시나리오를 시뮬레이션할 수 있습니다.
이 도움말에서는 Google 지니 3와 그 기능에 대해 살펴봅니다. 시작해 보겠습니다!

Google 딥마인드의 지니 모델에 대해 자세히 알아보기 전에 먼저 월드 모델에 대해 더 잘 이해해 보겠습니다.
세계 모델은 텍스트, 이미지, 비디오 및 움직임 데이터 세트에서 물리, 움직임 및 공간 관계와 같은 실제 규칙을 학습하는 AI 시스템입니다. 이를 통해 현실적인 장면을 만들고 진화 방식을 예측할 수 있습니다. Genie 모델은 이러한 시스템의 예입니다.
다음은 Genie 3의 기반을 닦은 초기 Google Genie 모델을 간략히 소개합니다:
이전 Genie 모델을 기반으로 한 Genie 3는 시리즈 중 가장 최신의 가장 진보된 모델입니다. 특히 새로운 가상 환경을 생성할 수 있는 Genie 2와 Google 딥마인드의 최신 동영상 생성 모델인 Veo 3를 기반으로 구축되었습니다. Veo 3는 물리학에 대한 깊은 이해와 현실 세계에서 사물이 상호 작용하는 방식을 보여줍니다.
베오 3는 하드 코딩된 물리 엔진을 사용하지만, Google 지니 3는 자기 지도 학습이라는 방법을 사용하여 물리 작동 방식을 스스로 학습합니다. 이는 AI 모델이 자체 학습 신호를 생성하여 레이블이 없는 데이터에서 패턴과 관계를 학습하는 AI 학습 기법입니다.
Google 지니 3의 자가 지도 학습 기능은 AI 에이전트나 AI 로봇과 같은 AI 시스템이 다양한 작업을 처리하도록 훈련시키는 데 매우 중요합니다. 실제로 Google 딥마인드의 연구원들은 지니 3를 인공 일반 지능(AGI)을 개발하는 데 중요한 단계로 보고 있습니다.

AGI는 인간과 마찬가지로 모든 작업이나 주제를 이해하고 학습하고 해당 지식을 다양한 상황에 적용할 수 있는 이론적인 형태의 AI입니다. 특정 작업을 위해 구축되고 기술을 새로운 문제로 이전하는 데 어려움을 겪는 오늘날의 인공 지능 모델과 달리 AGI는 광범위한 컨텍스트에서 적응하고 학습할 수 있습니다.
Genie 3에서 지원하는 주요 기능은 다음과 같습니다:

Google Genie 3는 학습, 연구, 교육을 더욱 몰입감 있고 흥미롭게 만들 수 있습니다. 예를 들어, 교실에서 학생들이 고대 도시를 탐험하거나 우주를 여행하도록 하여 역사, 과학 또는 지리에 생동감을 불어넣을 수 있습니다. 마찬가지로 인공지능 개발자에게는 전략을 연습하고, 문제를 해결하며, 의사 결정 능력을 향상시킬 수 있는 현실적인 가상 세계를 제공합니다.
과학자들은 또한 아이디어를 테스트하고, 생태계를 연구하거나, 물체의 행동을 관찰하기 위해 제어된 시뮬레이션을 만드는 데 사용할 수 있습니다. 또 다른 흥미로운 응용 분야는 비디오 게임 개발입니다. 게임 개발자는 텍스트 프롬프트를 자세한 게임 세계로 전환하여 개발 속도를 높이고 대규모 팀의 필요성을 줄일 수 있습니다.

Google 지니 3는 많은 기능과 이점을 제공하지만, 단점도 고려해야 합니다.
다음은 고려해야 할 몇 가지 제한 사항입니다.
Google 지니 3는 AI로 사실적인 인터랙티브 3D 세계를 만드는 데 있어 큰 진전을 이루었습니다. 간단한 텍스트 프롬프트에서 아이디어를 실현하고, 물리학을 시뮬레이션하고, 안전한 가상 공간에서 AI 시스템을 훈련할 수도 있습니다.
여전히 한계는 있지만 연구, 게임, AI 개발에 대한 많은 가능성을 열어줍니다. 또한 인간처럼 생각하고 학습할 수 있는 AGI 시스템으로 나아가는 중요한 단계이기도 합니다.
AI에 대해 더 자세히 알고 싶으시면 GitHub 저장소를 확인해 보세요. 활발한 커뮤니티에 참여하여 소매업의 AI, 제조업의 Vision AI와 같은 분야의 혁신을 발견해 보세요. 오늘 바로 컴퓨터 비전을 시작하려면 라이선스 옵션을 확인해 보세요.