Google 지니 3: 딥마인드, 새로운 AI 모델 공개

2025년 8월 5일, Google 딥마인드는 최신 버전의 지니 모델인 지니 3을 출시했습니다. 이는 사용자의 텍스트 프롬프트를 동적인 대화형 환경으로 변환할 수 있는 새로운 AI 모델입니다.

이러한 환경 또는 AI 세계를 통해 사용자는 비디오 게임에서와 마찬가지로 실시간으로 탐색하고 상호 작용할 수 있습니다. 또한 사용자는 추가 텍스트 프롬프트를 제공하여 환경을 확장하거나 수정할 수 있으므로 시뮬레이션을 다시 시작하지 않고도 즉석에서 변경할 수 있습니다.

최신 Genie Google 모델이 특히 영향력 있는 이유는 AI 에이전트를 교육하는 데 사용할 수 있다는 점입니다. 여기에는 데이터와 피드백을 사용하여 AI 에이전트가 의사 결정을 내리거나 작업을 수행하도록 교육하는 것이 포함됩니다. 연구자들은 실제 세계 대신 시뮬레이션된 3D 환경을 사용함으로써 실제 훈련에서 발생하는 많은 어려움, 비용, 위험을 피할 수 있습니다.

또한 Google 지니 3는 악천후를 통과하는 자율 주행 자동차나 산악 지형을 활공하는 윙슈트 테스트와 같은 복잡한 시나리오를 시뮬레이션할 수 있습니다.

이 도움말에서는 Google 지니 3와 그 기능에 대해 살펴봅니다. 시작해 보겠습니다!

그림 1. 윙수트 글라이딩을 보여주는 Genie 3 시뮬레이션의 프레임입니다. (출처)

‍

Google지니 모델의 간략한 역사

Google 딥마인드의 지니 모델에 대해 자세히 알아보기 전에 먼저 월드 모델에 대해 더 잘 이해해 보겠습니다.

세계 모델은 텍스트, 이미지, 비디오 및 움직임 데이터 세트에서 물리, 움직임 및 공간 관계와 같은 실제 규칙을 학습하는 AI 시스템입니다. 이를 통해 현실적인 장면을 만들고 진화 방식을 예측할 수 있습니다. Genie 모델은 이러한 시스템의 예입니다.

다음은 Genie 3의 기반을 닦은 초기 Google Genie 모델을 간략히 소개합니다:

지니 1: 흔히 Google 지니라고 불리는 지니 1은 대화형 가상 환경을 만들 수 있는 Google 딥마인드 최초의 AI 월드 모델입니다. 사용자가 텍스트, 이미지, 사진 또는 스케치로 세계를 묘사하면 Genie가 이를 생성하여 사용자가 장면 내에서 동작을 제어할 수 있도록 했습니다. 시간에 따른 비디오 데이터를 처리하고, 다음 프레임을 예측하고, 사용자 입력을 월드 내 동작으로 변환하도록 설계되었습니다.

지니 2: Google 지니의 기능을 기반으로 한 지니 2는 다양하고 상세한 인터랙티브 3D 세계를 만들 수 있었습니다. 월드 모델로서 가상 환경을 시뮬레이션하고 점프, 수영, 물체 이동과 같은 동작에 사실적으로 반응했습니다. 방대한 비디오 컬렉션을 통해 학습한 이 기술은 사실적인 물체 상호 작용과 생생한 캐릭터 움직임을 구현했습니다.

지니 3란 무엇인가요? Google새로운 AI 모델

이전 Genie 모델을 기반으로 한 Genie 3는 시리즈 중 가장 최신의 가장 진보된 모델입니다. 특히 새로운 가상 환경을 생성할 수 있는 Genie 2와 Google 딥마인드의 최신 동영상 생성 모델인 Veo 3를 기반으로 구축되었습니다. Veo 3는 물리학에 대한 깊은 이해와 현실 세계에서 사물이 상호 작용하는 방식을 보여줍니다.

베오 3는 하드 코딩된 물리 엔진을 사용하지만, Google 지니 3는 자기 지도 학습이라는 방법을 사용하여 물리 작동 방식을 스스로 학습합니다. 이는 AI 모델이 자체 학습 신호를 생성하여 레이블이 없는 데이터에서 패턴과 관계를 학습하는 AI 학습 기법입니다.

Google 지니 3의 자가 지도 학습 기능은 AI 에이전트나 AI 로봇과 같은 AI 시스템이 다양한 작업을 처리하도록 훈련시키는 데 매우 중요합니다. 실제로 Google 딥마인드의 연구원들은 지니 3를 인공 일반 지능(AGI)을 개발하는 데 중요한 단계로 보고 있습니다.

그림 2. Google 지니 3을 사용하여 로봇 로버를 제어하는 시뮬레이션 예시.(출처)

‍

AGI는 인간과 마찬가지로 모든 작업이나 주제를 이해하고 학습하고 해당 지식을 다양한 상황에 적용할 수 있는 이론적인 형태의 AI입니다. 특정 작업을 위해 구축되고 기술을 새로운 문제로 이전하는 데 어려움을 겪는 오늘날의 인공 지능 모델과 달리 AGI는 광범위한 컨텍스트에서 적응하고 학습할 수 있습니다.

AI 세상 구축과 관련된 Google 지니 3의 주요 기능

Genie 3에서 지원하는 주요 기능은 다음과 같습니다:

텍스트-3D 세계 생성: 간단한 텍스트 프롬프트(예: “거리를 걷는 로봇”)를 기본적인 움직임 컨트롤이 있는 플레이 가능한 3D와 유사한 환경으로 바꿀 수 있습니다.

프롬프트 가능한 세계 이벤트: 사용자는 새로운 명령을 입력하여 환경을 동적으로 변경할 수 있습니다(예: 거리에 비 추가).

시각적 기억: Genie 3는 환경에 남겨진 물체를 기억하고 나중에 다시 방문할 수 있도록 하며, 약 1분 동안 지속됩니다.

부드럽고 일관된 비디오 출력: Genie 2에 비해 더 긴 사용 시간으로 720p 해상도에서 24 fps(초당 프레임 수)의 비디오 출력을 유지할 수 있습니다.

그림 3. Google 지니 3는 지니 2보다 더 오래 지속되는 결과물을 생성할 수 있습니다.(출처)

‍

교육에서 게임까지: Google 딥마인드 지니 3의 활용 사례

Google Genie 3는 학습, 연구, 교육을 더욱 몰입감 있고 흥미롭게 만들 수 있습니다. 예를 들어, 교실에서 학생들이 고대 도시를 탐험하거나 우주를 여행하도록 하여 역사, 과학 또는 지리에 생동감을 불어넣을 수 있습니다. 마찬가지로 인공지능 개발자에게는 전략을 연습하고, 문제를 해결하며, 의사 결정 능력을 향상시킬 수 있는 현실적인 가상 세계를 제공합니다.

과학자들은 또한 아이디어를 테스트하고, 생태계를 연구하거나, 물체의 행동을 관찰하기 위해 제어된 시뮬레이션을 만드는 데 사용할 수 있습니다. 또 다른 흥미로운 응용 분야는 비디오 게임 개발입니다. 게임 개발자는 텍스트 프롬프트를 자세한 게임 세계로 전환하여 개발 속도를 높이고 대규모 팀의 필요성을 줄일 수 있습니다.

그림 4. 재미있고 다채로운 인터랙티브 게임을 Genie 3을 사용하여 디자인할 수 있습니다. (출처)

‍

세계 모델로서의 Google Genie 3의 한계

Google 지니 3는 많은 기능과 이점을 제공하지만, 단점도 고려해야 합니다.

다음은 고려해야 할 몇 가지 제한 사항입니다.

제한적인 행동 범위: 가상 세계에서 많은 이벤트를 트리거할 수 있지만, 모든 이벤트가 에이전트 자체에 의해 수행되는 것은 아닙니다. 에이전트가 직접 수행할 수 있는 행동은 여전히 제한적입니다.

다른 에이전트와의 상호 작용: 동일한 환경에서 여러 독립적인 에이전트 간의 현실적인 상호 작용을 만드는 것은 여전히 진행 중인 작업입니다.

실제 정확도: Google Genie 3는 아직 완벽한 지리적 정확도로 실제 위치를 재현할 수 없습니다.

주요 내용

Google 지니 3는 AI로 사실적인 인터랙티브 3D 세계를 만드는 데 있어 큰 진전을 이루었습니다. 간단한 텍스트 프롬프트에서 아이디어를 실현하고, 물리학을 시뮬레이션하고, 안전한 가상 공간에서 AI 시스템을 훈련할 수도 있습니다.

여전히 한계는 있지만 연구, 게임, AI 개발에 대한 많은 가능성을 열어줍니다. 또한 인간처럼 생각하고 학습할 수 있는 AGI 시스템으로 나아가는 중요한 단계이기도 합니다.

AI에 대해 더 자세히 알고 싶으시면 GitHub 저장소를 확인해 보세요. 활발한 커뮤니티에 참여하여 소매업의 AI, 제조업의 Vision AI와 같은 분야의 혁신을 발견해 보세요. 오늘 바로 컴퓨터 비전을 시작하려면 라이선스 옵션을 확인해 보세요.

AI로 3D 세상에 생동감을 불어넣는 Google 지니 3

Google지니 모델의 간략한 역사

지니 3란 무엇인가요? Google새로운 AI 모델

AI 세상 구축과 관련된 Google 지니 3의 주요 기능

교육에서 게임까지: Google 딥마인드 지니 3의 활용 사례

세계 모델로서의 Google Genie 3의 한계

주요 내용

이 카테고리에서 더 읽어보기

컴퓨터 비전으로 구현된 12가지 항공 이미지 활용 사례

의료 진단을 위한 비전 AI 도구

데이터에서 의사결정으로: 기업 전략을 위한 비전 AI 활용

함께 미래의 AI를 만들어 갑시다!