YOLO26 소개: 차세대 비전 AI입니다.
Ultralytics
Ultralytics 용어집으로 돌아가기

Text-to-Video

텍스트-비디오(Text-to-Video) 생성 AI를 살펴보세요. 모델이 텍스트로부터 동적 콘텐츠를 합성하고, 생성된 비디오를 분석하고 추적하기 위해 Ultralytics YOLO26을 어떻게 사용하는지 배우세요.

Text-to-Video는 텍스트 설명에서 직접 동적 비디오 콘텐츠를 합성하는 데 중점을 두는 generative AI의 고급 분야입니다. 이러한 시스템은 자연어 프롬프트를 해석하여 시간이 지남에 따라 진화하는 일관된 이미지 시퀀스를 생성하며, 정적 text-to-image 생성과 전체 동영상 사이의 간극을 효과적으로 메워줍니다. 이 기술은 객체와 장면의 시각적 의미(사물의 모습)뿐만 아니라 3차원 공간 내에서 사물이 어떻게 움직이고 물리적으로 상호 작용하는지에 대한 시간적 역학을 이해하기 위해 복잡한 deep learning (DL) 아키텍처에 의존합니다. 리치 미디어에 대한 수요가 증가함에 따라 Text-to-Video는 애니메이션 및 비디오 제작의 노동 집약적인 과정을 자동화하는 창작자들을 위한 핵심 도구로 부상하고 있습니다.

Link to this section비디오 생성 메커니즘#

The process of transforming text into video involves a synergy between natural language processing (NLP) and computer vision synthesis. The pipeline typically begins with a text encoder, often based on the Transformer architecture, which converts a user's prompt into high-dimensional embeddings. These embeddings guide a generative model, such as a diffusion model or a Generative Adversarial Network (GAN), to produce visual frames.

이 과정의 중요한 과제는 **temporal consistency(시간적 일관성)**를 유지하는 것입니다. 단일 이미지를 생성하는 것과 달리, 모델은 프레임 사이에서 객체가 깜빡이거나 의도치 않게 변형되거나 사라지지 않도록 해야 합니다. 이를 달성하기 위해 모델은 대규모 비디오-텍스트 쌍 datasets으로 학습되어 시간이 지남에 따라 픽셀이 어떻게 이동해야 하는지를 예측하는 방법을 배웁니다. frame interpolation과 같은 기술은 움직임을 부드럽게 하고 프레임 속도를 높이기 위해 자주 사용되며, 이는 종종 고성능 GPUs의 상당한 컴퓨팅 성능을 필요로 합니다.

Link to this section실제 애플리케이션 사례#

Text-to-Video 기술은 신속한 시각화와 콘텐츠 생성을 가능하게 함으로써 산업을 변화시키고 있습니다. 두 가지 주요 사용 사례는 다음과 같습니다.

  • Marketing and Advertising: 브랜드는 Text-to-Video를 사용하여 간단한 스크립트에서 고품질 제품 쇼케이스나 소셜 미디어 콘텐츠를 생성합니다. 예를 들어, 마케터는 비용이 많이 드는 물리적 촬영을 조직하지 않고도 "비 내리는 사이버펑크 도시를 달리는 스포츠카" 영상을 생성하여 시각적 컨셉을 테스트할 수 있습니다. 이러한 기능은 다른 AI 모델을 학습시키는 데 사용할 수 있는 다양한 synthetic data 생성을 가능하게 합니다.
  • Film Pre-visualization: Directors and game designers utilize tools like Google's DeepMind Veo for storyboarding. Instead of sketching static panels, creators can generate rough video clips to visualize camera angles, lighting, and pacing instantly. This accelerates the creative pipeline, allowing for rapid iteration on complex narratives before committing to final production.

Link to this section생성과 분석의 구분#

비디오 생성과 비디오 분석을 구분하는 것이 중요합니다. Text-to-Video는 프롬프트를 기반으로 처음부터 새로운 픽셀을 만듭니다. 대조적으로, video understandingobject detection이나 action recognition과 같은 통찰력을 추출하기 위해 기존 영상을 처리하는 것을 포함합니다.

Text-to-Video는 생성 모델에 의존하지만, 비디오 분석은 최신 YOLO26과 같은 판별 모델에 의존합니다. 아래의 코드 스니펫은 후자를 보여줍니다. (AI가 생성했을 수도 있는) 비디오 파일을 로드하고 분석하여 객체를 추적함으로써 워크플로우의 차이를 강조합니다.

from ultralytics import YOLO

# Load the official YOLO26 model for analysis (not generation)
model = YOLO("yolo26n.pt")

# Process a video file to track objects across frames
# Ideally, this distinguishes real objects from generated artifacts
results = model.track(source="path/to/generated_video.mp4", show=True)

Link to this section관련 개념 및 과제#

Text-to-Video의 범위를 완전히 파악하려면 AI 환경의 관련 용어와 비교하는 것이 도움이 됩니다.

  • Text-to-Image: 이는 정적 스냅샷을 생성합니다. Text-to-Video는 시간 차원을 추가하여 모델이 피사체가 이동함에 따라 일관성을 유지하도록 요구합니다.
  • Multi-Modal Learning: Text-to-Video는 본질적으로 멀티모달이며 텍스트 데이터를 시각적 미디어로 변환합니다. 이는 텍스트를 오디오 파형으로 변환하는 text-to-speech와 유사합니다.
  • Computer Vision (CV): 일반적으로 기계가 이미지를 "보고" 이해하는 능력을 의미합니다. Text-to-Video는 그 반대입니다. 기계가 시각적 콘텐츠를 "상상"하고 생성합니다.

빠른 발전에도 불구하고 높은 컴퓨팅 비용과 비디오가 물리 법칙을 무시하는 hallucinations 가능성을 포함한 과제가 남아 있습니다. 또한 AI ethicsdeepfakes의 확산에 관한 중요한 우려도 존재합니다. 그러나 Meta Movie Gen과 같은 모델이 진화함에 따라, Ultralytics Platform을 통해 관리되는 전문적인 워크플로우로 더 높은 충실도와 더 나은 통합을 기대할 수 있습니다.

Explore solutions

Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.

더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.

더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.

더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.

더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.

더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.

더 알아보기
Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.

더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.

더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.

더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.

더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.

더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.

더 알아보기
Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.

더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.

더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.

더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.

더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.

더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.

더 알아보기

미래의 AI를 함께 구축합시다!

머신 러닝의 미래와 함께 여정을 시작하십시오.