YOLO26 소개: 차세대 비전 AI입니다.
Ultralytics
Ultralytics 용어집으로 돌아가기

Diffusion Transformer (DiT)

Diffusion Transformer (DiT)가 고충실도 합성을 위해 어떻게 트랜스포머와 확산 모델을 결합하는지 알아보십시오. 스케일링, Sora, 그리고 Ultralytics YOLO26에 대해 학습해 보십시오.

Diffusion Transformer(DiT)는 transformers의 순차적 처리 능력과 diffusion models의 고충실도 이미지 합성 기능을 결합한 고급 생성형 아키텍처입니다. 기존의 확산 기반 시스템은 입력을 반복적으로 노이즈 제거하고 이미지를 생성하기 위해 주로 합성곱 U-Net 아키텍처에 크게 의존했습니다. DiT는 이 U-Net 백본을 확장 가능한 Transformer 아키텍처로 대체하여, Vision Transformer (ViT)가 이미지를 분석하는 방식과 유사하게 시각 데이터를 패치 시퀀스로 처리합니다. 이러한 패러다임의 전환을 통해 모델은 더 예측 가능하게 확장될 수 있으며, 증가된 컴퓨팅 자원을 활용하여 더욱 사실적이고 일관된 결과를 출력할 수 있습니다.

Link to this sectionDiT와 기존 Diffusion 모델의 차이점#

전통적인 diffusion 모델은 현대 Generative AI의 토대이지만, 그 U-Net 백본은 방대한 파라미터 수로 확장할 때 종종 병목 현상에 직면합니다. 반면, Diffusion Transformer는 Large Language Models (LLMs)에서 관찰된 스케일링 법칙을 고유하게 계승합니다. 공간적 다운샘플링 편향을 제거하고 글로벌 self-attention 메커니즘을 활용함으로써, DiT는 전체 이미지나 비디오 프레임에 걸쳐 복잡한 공간적 관계를 학습합니다. 이러한 스케일링 동작의 기원에 대해 더 깊이 알아보려면 이러한 효율성 벤치마크를 정립한 original DiT research paper published on arXiv를 검토해 보시기 바랍니다.

Link to this section실제 활용 사례#

Diffusion Transformer의 유연성과 확장성은 다양한 computer vision 분야에서 중요한 돌파구를 마련했습니다:

  1. 고충실도 비디오 생성: DiT 아키텍처의 가장 두드러진 응용 분야는 OpenAI's Sora model과 같은 텍스트-비디오 모델에서 찾아볼 수 있습니다. 시간적 일관성과 3D 공간을 이해함으로써, DiT는 프레임별로 물리적 논리를 유지하는 수 분 길이의 초현실적인 비디오 클립을 합성하여 디지털 콘텐츠 제작과 시각 효과 분야에 혁신을 일으키고 있습니다.

  2. 고급 이미지 합성: 상업적 디자인과 artificial intelligence 아트 생성 분야에서 DiT는 전례 없는 텍스트-이미지 충실도를 제공합니다. 이는 창의적인 에이전시들이 매우 정확한 마케팅 자산을 생성하는 데 활용되며, 이전의 U-Net 모델이 구현하기 어려웠던 정확한 타이포그래피와 구성적 사실성을 갖춘 복잡한 프롬프트를 렌더링합니다.

Link to this sectionTransformer 개념 구현하기#

DiT는 주로 무거운 생성 작업에 사용되지만, 표준 deep learning 라이브러리를 사용하여 DiT가 의존하는 기본적인 self-attention 메커니즘을 탐색할 수 있습니다. 다음 Python 코드 조각은 PyTorch를 사용하여 평탄화된 이미지 패치가 DiT 네트워크의 핵심 연산인 Transformer 레이어를 통해 처리되는 방식을 보여줍니다.

import torch
import torch.nn as nn

# Define a standard Transformer layer acting as a DiT building block
transformer_layer = nn.TransformerEncoderLayer(d_model=256, nhead=8)

# Simulate flattened latent image patches (Sequence Length, Batch Size, Features)
latent_patches = torch.rand(196, 1, 256)

# Apply self-attention to process and relate patches globally
output_features = transformer_layer(latent_patches)
print(f"Processed feature shape: {output_features.shape}")

attention 레이어에 대한 포괄적인 기술 세부 정보는 PyTorch documentation on Transformer modules에서 훌륭한 시작점을 제공합니다.

Link to this section생성과 탐지의 가교#

Diffusion Transformer는 콘텐츠 생성의 최첨단을 나타내지만, 많은 엔터프라이즈 워크플로우는 합성보다는 실시간 시각 분석을 필요로 합니다. object detectionimage segmentation과 같이 고속 추론을 요구하는 작업의 경우, 경량의 에지 최적화 모델이 여전히 업계 표준으로 남아 있습니다.

Ultralytics YOLO26은 이러한 분석적 computer vision tasks를 위해 정확히 설계되었습니다. 이 모델은 대규모 생성형 Transformer가 요구하는 무거운 컴퓨팅 오버헤드 없이, 기본 상태에서 독보적인 속도와 정확도를 제공합니다. 데이터셋 생성에서 엔터프라이즈급 배포까지 손쉽게 전환하기 위해 개발자들은 강력한 시각 AI 파이프라인을 관리하는 엔드투엔드 솔루션인 Ultralytics Platform을 활용합니다. 생성형 모델과 분석형 모델을 비교하는 더 넓은 관점을 원하신다면 Google's Machine Learning Crash Course가 훌륭한 기초 맥락을 제공합니다.

Explore solutions

Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델로 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적, 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.

더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델로 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 더 스마트한 도로를 위해 도로 안전, 운전자 보조 및 차량 자동화를 향상시킵니다.

더 알아보기
Real-time AI that works with your team

소매 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링 기능을 제공합니다.

더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매 분야를 재구성하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 제공합니다.

더 알아보기
Real-time AI that works with your team

로보틱스에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로보틱스 분야의 Vision AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. Vision AI는 품질 관리, 결함 탐지, PPE 준수 및 조립 라인 자동화를 주도합니다.

더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류를 간소화하십시오. 비전 AI는 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링을 가능하게 합니다.

더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델로 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적, 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.

더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델로 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 더 스마트한 도로를 위해 도로 안전, 운전자 보조 및 차량 자동화를 향상시킵니다.

더 알아보기
Real-time AI that works with your team

소매 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링 기능을 제공합니다.

더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매 분야를 재구성하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 제공합니다.

더 알아보기
Real-time AI that works with your team

로보틱스에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로보틱스 분야의 Vision AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. Vision AI는 품질 관리, 결함 탐지, PPE 준수 및 조립 라인 자동화를 주도합니다.

더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류를 간소화하십시오. 비전 AI는 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링을 가능하게 합니다.

더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델로 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적, 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.

더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델로 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 더 스마트한 도로를 위해 도로 안전, 운전자 보조 및 차량 자동화를 향상시킵니다.

더 알아보기
Real-time AI that works with your team

소매 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링 기능을 제공합니다.

더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매 분야를 재구성하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 제공합니다.

더 알아보기
Real-time AI that works with your team

로보틱스에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로보틱스 분야의 Vision AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. Vision AI는 품질 관리, 결함 탐지, PPE 준수 및 조립 라인 자동화를 주도합니다.

더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류를 간소화하십시오. 비전 AI는 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링을 가능하게 합니다.

더 알아보기

미래의 AI를 함께 구축합시다!

머신 러닝의 미래와 함께 여정을 시작하십시오.