용어집

제너레이티브 AI

제너레이티브 AI가 텍스트, 이미지, 오디오와 같은 독창적인 콘텐츠를 제작하여 혁신적인 애플리케이션으로 산업을 변화시키는 방법을 알아보세요.

생성형 AI는 텍스트, 이미지, 오디오, 동영상 등 새롭고 독창적인 콘텐츠를 만들 수 있는 인공 지능(AI) 시스템의 한 범주입니다. 기존 데이터를 분석하거나 작동하는 기존 AI와 달리, 제너레이티브 모델은 방대한 학습 데이터의 기본 패턴과 구조를 학습하여 학습한 데이터의 특성을 모방한 새로운 결과물을 만들어냅니다. 이 기술은 점점 더 접근하기 쉽고 강력해진 대규모 언어 모델(LLM)과 같은 복잡한 딥러닝 모델에 의해 구동됩니다.

제너레이티브 AI는 어떻게 작동하나요?

생성 AI의 핵심은 방대한 데이터 세트에서 학습된 신경망(NN) 에 의존합니다. 학습 과정에서 모델은 데이터의 확률적 분포를 학습합니다. 프롬프트나 입력이 주어지면 이 학습된 분포를 사용하여 단어, 픽셀, 음표 등 시퀀스에서 다음으로 가장 가능성이 높은 요소를 예측하고 생성합니다. 이 과정을 반복하여 완전한 콘텐츠를 구축합니다. 많은 최신 생성 모델은 주의 메커니즘을 사용하여 입력 데이터의 여러 부분의 중요도를 평가함으로써 복잡하고 긴 범위의 종속성을 포착하고 매우 일관성 있는 출력을 생성할 수 있는 트랜스포머 아키텍처를 기반으로 구축됩니다. 이러한 강력하고 사전 학습된 모델을 흔히 기초 모델이라고 합니다.

생성형 AI와 차별적 AI 비교

생성 AI에 대응하는 것은 차별적 AI입니다. 주요 차이점은 목표에 있습니다:

  • 생성 모델: 새로운 데이터 샘플을 생성하기 위해 데이터의 분포를 학습합니다. "데이터가 어떻게 생겼을까?"라는 질문에 답하는 것이 목표입니다. 예를 들어 텍스트-이미지 합성 또는 텍스트 생성을 위한 모델이 있습니다.
  • 판별 모델: 서로 다른 데이터 클래스 간의 경계를 학습하여 주어진 입력에 대한 레이블을 분류하거나 예측합니다. 이들의 목표는 "이 그룹들 간의 차이점은 무엇인가?"라는 질문에 답하는 것입니다. Ultralytics YOLO와 같은 모델에서 수행하는 이미지 분류객체 감지와 같은 지도 학습의 대부분의 작업이 이 범주에 속합니다.

판별 모델은 분류와 예측에 탁월하지만, 생성 모델은 생성 및 증강에 탁월합니다.

실제 애플리케이션

제너레이티브 AI는 광범위한 애플리케이션을 통해 수많은 산업을 혁신하고 있습니다:

  1. 콘텐츠 제작 및 증강: GPT-4와 같은 모델은 기사, 이메일, 코드를 작성할 수 있으며, DALL-E 3 및 Midjourney와 같은 텍스트-이미지 변환 모델은 간단한 텍스트 설명에서 멋진 비주얼을 만들어냅니다. 이는 마케팅과 엔터테인먼트에서 소프트웨어 개발에 이르기까지 다양한 분야에 혁신을 일으키고 있으며, GitHub Copilot과 같은 도구가 개발자를 지원하고 있습니다.
  2. 합성 데이터 생성: 생성형 AI는 사실적인 인공 데이터를 생성하여 다른 머신러닝(ML) 모델을 학습시킬 수 있습니다. 예를 들어, 자동차 분야의 AI에서는 드문 주행 시나리오를 생성하여 자율 주행 차량의 인식 모델의 견고성을 향상시킬 수 있습니다. 마찬가지로 의료 분야에서는 진단 도구 학습을 위한 합성 의료 이미지를 생성하여 데이터 프라이버시 및 제한된 데이터 세트와 관련된 문제를 극복하는 데 도움을 줄 수 있습니다. 이 기술은 기존의 데이터 증강을 보완합니다.

일반적인 제너레이티브 모델 유형

몇 가지 아키텍처가 제너레이티브 AI의 발전에 중추적인 역할을 해왔습니다:

  • 생성적 적대적 네트워크(GAN): 제너레이터와 판별기라는 두 개의 경쟁 신경망으로 구성되며, 두 신경망이 함께 작동하여 매우 사실적인 결과물을 만들어냅니다.
  • 확산 모델: 이미지에 노이즈를 점진적으로 추가한 다음 그 과정을 역으로 학습하여 충실도가 높은 이미지를 생성합니다. 이는 안정적 확산과 같은 모델의 기반이 되는 기술입니다.
  • 대규모 언어 모델(LLM): 트랜스포머 아키텍처를 기반으로 하는 이 모델은 방대한 양의 텍스트 데이터를 학습하여 인간과 유사한 언어를 이해하고 생성합니다. Google AIMeta AI와 같은 선도적인 연구 기관은 가능성의 한계를 끊임없이 넓혀가고 있습니다.

도전 과제 및 윤리적 고려 사항

생성 AI의 급격한 부상은 상당한 도전 과제를 안겨줍니다. 잘못된 정보 캠페인을 위한 딥페이크 생성이나 지적 재산권 침해와 같은 오용 가능성은 가장 큰 우려 사항입니다. 또한 모델은 학습 데이터에 존재하는 알고리즘 편향을 지속시키고 증폭시킬 수 있습니다. 이러한 문제를 해결하려면 AI 윤리에 대한 강력한 의지와 강력한 거버넌스 프레임워크의 개발이 필요합니다. 또한 이러한 대규모 모델을 학습시키는 것은 계산 집약적이기 때문에 환경에 미치는 영향에 대한 우려도 제기됩니다. Ultralytics HUB와 같은 MLOps 플랫폼을 통해 모델 수명 주기를 효율적으로 관리하면 개발과 배포를 간소화할 수 있습니다.

울트라 애널리틱스 커뮤니티 가입

AI의 미래와 함께하세요. 글로벌 혁신가들과 연결, 협업, 성장하기

지금 가입하기
링크가 클립보드에 복사됨