욜로 비전 선전
선전
지금 참여하기
용어집

생성적 AI

생성적 AI가 텍스트, 이미지, 오디오와 같은 독창적인 콘텐츠를 생성하여 혁신적인 애플리케이션으로 산업을 어떻게 변화시키는지 알아보세요.

생성형 AI는 텍스트, 이미지, 오디오, 비디오 등 새롭고 독창적인 콘텐츠를 만들 수 있는 인공지능(AI) 시스템의 한 범주입니다. 기존 데이터를 분석하거나 기존 데이터에 따라 작동하는 기존 AI와 달리, 생성 모델은 방대한 훈련 데이터 코퍼스에서 기본 패턴과 구조를 학습하여 훈련된 데이터의 특성을 모방하는 새로운 결과물을 생성합니다. 이 기술은 대규모 언어 모델(LLM)과 같은 복잡한 딥러닝 모델을 통해 구동되며, 이러한 모델은 점점 더 접근성이 높아지고 강력해지고 있습니다.

Generative AI는 어떻게 작동하나요?

핵심적으로 생성형 AI는 대규모 데이터 세트에서 훈련된 신경망(NN)에 의존합니다. 훈련 중에 모델은 데이터의 확률 분포를 학습합니다. 프롬프트 또는 입력이 주어지면 이 학습된 분포를 사용하여 단어, 픽셀 또는 음표와 같은 시퀀스에서 가장 가능성이 높은 다음 요소를 예측하고 생성합니다. 이 프로세스는 전체 콘텐츠를 구축하기 위해 반복됩니다. 많은 최신 생성 모델은 입력 데이터의 여러 부분의 중요도를 평가하기 위해 어텐션 메커니즘을 사용하는 Transformer 아키텍처를 기반으로 구축되어 복잡하고 장거리 종속성을 캡처하고 고도로 일관된 출력을 생성할 수 있습니다. 이러한 강력한 사전 훈련된 모델을 기반 모델이라고도 합니다.

생성형 AI vs. 판별형 AI

Generative AI의 상대는 discriminative AI입니다. 주요 차이점은 목표에 있습니다.

  • 생성 모델: 새로운 데이터 샘플을 생성하기 위해 데이터 분포를 학습합니다. 목표는 "데이터가 어떻게 보이는가?"라는 질문에 답하는 것입니다. 예로는 텍스트-이미지 합성 또는 텍스트 생성 모델이 있습니다.
  • 판별 모델: 서로 다른 데이터 클래스 간의 경계를 학습하여 주어진 입력에 대한 레이블을 분류하거나 예측합니다. 이들의 목표는 "이러한 그룹 간의 차이점은 무엇입니까?"라는 질문에 답하는 것입니다. 이미지 분류객체 감지와 같이 지도 학습의 대부분의 작업은 Ultralytics YOLO와 같은 모델에서 수행되며 이 범주에 속합니다.

판별 모델은 분류 및 예측에 탁월하지만, 생성 모델은 생성 및 증강에 뛰어납니다.

실제 애플리케이션

생성형 AI는 광범위한 애플리케이션을 통해 수많은 산업을 혁신하고 있습니다.

  1. 콘텐츠 제작 및 증강: GPT-4와 같은 모델은 기사, 이메일 및 코드를 작성할 수 있으며, 텍스트-이미지 모델(예: DALL-E 3 및 Midjourney)은 간단한 텍스트 설명에서 멋진 시각적 자료를 만듭니다. 이는 마케팅 및 엔터테인먼트에서 소프트웨어 개발에 이르기까지 다양한 분야에 혁명을 일으키고 있으며, GitHub Copilot와 같은 도구가 개발자를 지원합니다.
  2. 합성 데이터 생성: 생성적 AI는 다른 머신 러닝(ML) 모델을 학습하기 위해 현실적인 인공 데이터를 생성할 수 있습니다. 예를 들어 자동차 AI에서 희귀한 운전 시나리오를 생성하여 자율 주행 차량의 인식 모델의 견고성을 향상시킬 수 있습니다. 마찬가지로 의료 분야에서는 진단 도구를 훈련하기 위한 합성 의료 이미지를 생성하여 데이터 개인 정보 보호 및 제한된 데이터 세트와 관련된 문제를 해결하는 데 도움이 됩니다. 이 기술은 기존의 데이터 증강을 보완합니다.

일반적인 생성 모델 유형

몇 가지 아키텍처가 생성적 AI 발전에 중추적인 역할을 했습니다.

  • Generative Adversarial Networks (GANs): 매우 사실적인 출력을 생성하기 위해 함께 작동하는 두 개의 경쟁적인 신경망(생성기와 판별기)으로 구성됩니다.
  • 확산 모델(Diffusion Models): 이미지에 점진적으로 노이즈를 추가한 다음, 프로세스를 되돌려 고품질 이미지를 생성하는 방법을 학습합니다. 이는 Stable Diffusion과 같은 모델의 기반 기술입니다.
  • 대규모 언어 모델(LLM): 트랜스포머 아키텍처를 기반으로 하는 이러한 모델은 방대한 양의 텍스트 데이터로 학습하여 인간과 유사한 언어를 이해하고 생성합니다. Google AIMeta AI와 같은 선도적인 연구 기관들은 가능한 것의 경계를 끊임없이 넓히고 있습니다.

과제 및 윤리적 고려 사항

생성형 AI의 급속한 부상은 상당한 과제를 안고 있습니다. 허위 정보 캠페인을 위해 딥페이크를 만들거나 지적 재산권을 침해하는 등 오용될 가능성이 있다는 점이 주요 문제입니다. 또한 모델은 학습 데이터에 존재하는 알고리즘 편향을 영속시키고 증폭시킬 수 있습니다. 이러한 문제를 해결하려면 AI 윤리에 대한 강력한 의지와 강력한 거버넌스 프레임워크 개발이 필요합니다. 또한 이러한 대규모 모델을 훈련하는 것은 계산 집약적이므로 환경 영향에 대한 우려가 제기됩니다. Ultralytics HUB와 같은 MLOps 플랫폼을 통해 모델 라이프사이클을 효율적으로 관리하면 개발 및 배포를 간소화하는 데 도움이 될 수 있습니다.

Ultralytics 커뮤니티에 참여하세요

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기
클립보드에 링크가 복사되었습니다.