용어집

Stable Diffusion

Stable Diffusion이 Ultralytics YOLO26용 합성 데이터를 생성하는 방식을 살펴보세요. 사진처럼 사실적인 이미지를 생성하고 컴퓨터 비전 데이터셋을 강화하는 방법을 지금 바로 배워보세요.

스테이블 디퓨전은 주로 텍스트 설명으로부터 상세한 이미지를 생성하는 데 사용되는 획기적인 딥러닝 모델로, 이를 텍스트-이미지 합성이라고 합니다. 생성형 AI의 한 형태로서, 사용자가 자연어 프롬프트를 입력하여 사진처럼 사실적인 예술 작품, 다이어그램 및 기타 시각적 자산을 생성할 수 있게 합니다. 일부 독점적 선행 모델과 달리, 스태블 디퓨전은 오픈소스로 널리 인정받아 개발자와 연구자들이 강력한 GPU를 탑재한 소비자 등급 하드웨어에서 모델을 실행할 수 있게 합니다. GPU을 장착한 소비자용 하드웨어에서 모델을 실행할 수 있게 합니다. 이러한 접근성은 고품질 이미지 생성을 대중화시켜 현대 AI 환경의 핵심 기술로 자리매김하게 했습니다.

작동 방식

스테이블 디퓨전의 핵심 메커니즘은 "잠재 확산(latent diffusion)"이라는 과정입니다. 이를 이해하려면 선명한 사진을 찍은 후 점차적으로 잡음(가우시안 노이즈)을 추가하여 인식 불가능한 무작위 픽셀로 변환하는 과정을 상상해 보십시오. 이 모델은 이 과정을 역으로 수행하도록 훈련됩니다: 순수한 노이즈로 구성된 캔버스로 시작하여 반복적으로 정제하며, 단계별로 잡음을 제거하여 사용자의 프롬프트 엔지니어링 지침과 일치하는 일관된 이미지를 드러냅니다.

결정적으로, Stable Diffusion은 픽셀 공간이 아닌 "잠재 공간"—이미지 데이터의 압축된 표현—에서 작동합니다. 이는 U-Net으로 알려진 특정 신경망 구조를 CLIP과 같은 텍스트 인코더와 결합하여 단어의 의미적 의미를 이해함으로써, 기존 방법보다 계산 과정을 훨씬 더 효율적으로 만듭니다.

예시: 합성 데이터 검증

Stable Diffusion을 사용하여 데이터셋을 생성할 때, 생성된 객체가 인식 가능한지 확인하는 것이 종종 필요합니다. 다음 Python 이를 수행하는 방법을 보여줍니다. ultralytics 검출 정확도를 확인하기 위해 합성 생성된 이미지에 대해 추론을 실행하는 패키지.

from ultralytics import YOLO

# Load the YOLO26 Nano model for fast inference
model = YOLO("yolo26n.pt")

# Run prediction on a synthetic image generated by Stable Diffusion
# This verifies if the generated object is recognizable by the model
results = model.predict("synthetic_car_image.jpg")

# Display the results to visually inspect the bounding boxes
results[0].show()

향후 방향

확산 모델을 둘러싼 생태계는 빠르게 진화하고 있습니다. 연구자들은 현재 정적 이미지에서 완전한 텍스트-비디오 기능으로 전환하며 비디오 이해 및 생성 능력을 향상시키는 방법을 모색 중입니다. 또한 모델 양자화등을 통한 계산 비용 추가 절감 노력은 이 강력한 모델들을 모바일 기기 및 에지 AI 하드웨어에서 직접 실행 가능하게 하는 것을 목표로 합니다. 기술이 성숙해짐에 따라 생성형 도구와 분석 모델의 통합은 정교한 AI 에이전트 구축을 위한 표준 파이프라인이 될 가능성이 높습니다.

Stable Diffusion

산업 전반의 워크플로우를 간소화하기 위한 Ultralytics YOLO 모델 교육

혁신을 강화하는 유연한 엔터프라이즈 라이선스 솔루션

Ultralytics YOLO 몇 초 만에 AI 모델 훈련하기

작동 방식

관련성 및 실제 응용 분야

1. 컴퓨터 비전 데이터셋 확장

2. 신속 시제품 제작 및 설계

관련 용어 구분하기

예시: 합성 데이터 검증

향후 방향

이 카테고리에서 더 읽어보기

컴퓨터 비전으로 구현된 12가지 항공 이미지 활용 사례

단안 깊이 추정이란 무엇인가? 개요

Ultralytics YOLO 활용한 AI 위협 탐지 기술 분석

Ultralytics 커뮤니티 가입