Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

Latent Diffusion Model (LDM)

Узнай, как латентные диффузионные модели (LDM) эффективно генерируют высококачественные синтетические данные. Открой для себя, как проверять результаты работы LDM с помощью Ultralytics YOLO26 уже сегодня.

Латентно-диффузионная модель (LDM) — это продвинутый тип Generative AI, разработанный для синтеза высококачественных изображений, видео или аудио с удивительной вычислительной эффективностью. В отличие от традиционных моделей, работающих напрямую с высокоразмерными данными пикселей, LDM сжимают входные данные в низкоразмерное представление, называемое латентным пространством. Основной процесс диффузии, который включает итеративное добавление, а затем удаление шума для создания структурированного вывода, происходит полностью внутри этого сжатого пространства. Разделяя генеративное моделирование и пространство пикселей высокого разрешения, LDM радикально снижают требования к памяти и вычислительной мощности для задач deep learning, позволяя запускать сложные генеративные рабочие процессы на потребительском оборудовании.

Link to this sectionРазграничение связанных терминов#

Чтобы понять архитектуру LDM, полезно противопоставить её тесно связанным концепциям computer vision и генеративного ИИ:

  • Diffusion Models против LDM: Стандартные диффузионные модели выполняют свои процессы прямого и обратного зашумления непосредственно на необработанных данных пикселей. Хотя этот подход весьма точен, он вычислительно затратен. LDM решают эту проблему, используя автокодировщик для отображения изображений в меньшее латентное пространство, выполняя диффузию там и декодируя результат обратно в пиксели.
  • Stable Diffusion против LDM: Stable Diffusion — это конкретная, широко используемая реализация латентно-диффузионной модели. Иными словами, все модели Stable Diffusion являются LDM, но не все LDM являются Stable Diffusion.

Link to this sectionРеальные приложения#

Эффективность LDM открыла множество практических применений в исследованиях и индустрии, что в значительной степени задокументировано в фундаментальных научных работах на arXiv и изучено такими организациями, как Google DeepMind.

  • Генерация синтетических данных: Инженеры часто используют LDM для создания разнообразных высокоточных синтетических изображений редких граничных случаев, таких как специфические погодные условия или необычные дефекты в производстве. Эти синтетические данные затем используются для надежного обучения моделей object detection, что сокращает время, необходимое на сбор данных вручную.
  • Продвинутое редактирование изображений и заполнение (inpainting): LDM отлично справляются с изменением существующих изображений на основе текстовых запросов. Креативные индустрии используют эти модели для бесшовной замены фона, заполнения отсутствующих фрагментов изображения (inpainting) или расширения границ холста (outpainting), сохраняя при этом сложное освещение и текстуры.

Link to this sectionПроверка результатов LDM с помощью YOLO26#

При использовании LDM для генерации синтетических наборов данных для машинного обучения крайне важно проверять, обладают ли созданные объекты правильными семантическими признаками. Ты можешь запустить инференс на этих сгенерированных изображениях, используя дискриминативную модель, например Ultralytics YOLO, чтобы обеспечить качество.

from ultralytics import YOLO

# Load the lightweight YOLO26 Nano model for rapid validation
model = YOLO("yolo26n.pt")

# Analyze a synthetic image generated by a Latent Diffusion Model
results = model.predict("ldm_synthetic_dataset_sample.jpg")

# Display the bounding box results to verify object fidelity
results[0].show()

Link to this sectionБудущие разработки в области латентных архитектур#

По мере развития сферы Artificial Intelligence механизмы работы LDM адаптируются для более сложных модальностей. Исследователи из групп вроде Anthropic и OpenAI изучают латентную диффузию для генерации видео высокой четкости и синтеза 3D-сред.

В то же время достижения в основных тензорных операциях, поддерживаемые такими библиотеками, как PyTorch и TensorFlow, продолжают ускорять работу этих моделей. Для специалистов по ИИ, желающих интегрировать эти embeddings и синтетические наборы данных в рабочие процессы, Ultralytics Platform предоставляет бесшовную среду для model deployment, позволяя командам плавно переходить от сгенерированных данных к полноценному внедренному решению в области компьютерного зрения.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения