Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

Diffusion Forcing

Исследуй Diffusion Forcing — парадигму генеративного моделирования, которая сочетает авторегрессионное прогнозирование с диффузией последовательностей для согласованной генерации временных данных.

Diffusion Forcing — это передовая парадигма генеративного моделирования, представленная в 2024 году, которая объединяет сильные стороны авторегрессионного предсказания следующего токена и полнопоследовательной диффузии. Применяя независимые и переменные уровни шума к разным шагам внутри последовательности, этот метод позволяет моделям machine learning генерировать высокосогласованные временные данные. В отличие от традиционных методов, которые либо предсказывают дискретные токены по одному, либо проводят денойзинг всей последовательности одновременно, Diffusion Forcing обучает модели выступать в роли надежных планировщиков и генераторов последовательностей, работая с непрерывными состояниями со сложными долгосрочными зависимостями.

Link to this sectionКак работает Diffusion Forcing#

По своей сути Diffusion Forcing черпает вдохновение из классического teacher forcing, используемого в рекуррентных нейронных сетях. Однако вместо подачи дискретных токенов «истинных значений» (ground-truth) для предсказания следующего шага, модель подает частично зашумленные непрерывные истории в причинно-следственный Transformer. Модель учится проводить денойзинг текущего состояния, обусловленного прошлым. Это позволяет сети динамически настраивать уровень шума для каждого кадра, обеспечивая гибкую структуру для задач, требующих как локализованной точности, так и широкого временного охвата.

Этот подход чрезвычайно полезен при создании интеллектуальных AI agents, которые должны реагировать на непредсказуемую среду, придерживаясь долгосрочного плана, и обходить проблемы накопления ошибок, часто встречающиеся в стандартных авторегрессионных моделях.

Link to this sectionРеальные приложения#

Diffusion Forcing стремительно набирает популярность в нескольких сложных областях artificial intelligence:

  • Robotics and Visuo-Motor Control: Автономные робоманипуляторы и системы самоуправления используют Diffusion Forcing для создания плавных и непрерывных планов траекторий. Предсказывая последовательности непрерывных команд управления двигателями, роботы могут адаптироваться к динамическим препятствиям, сохраняя при этом стабильный путь к своей цели.
  • Video Generation and Forecasting: В продвинутых пайплайнах computer vision модели используют эту технику для предсказания будущих видеокадров со строгой временной согласованностью, избегая артефактов мерцания, часто встречающихся в более ранних генеративных подходах.

Link to this sectionDiffusion Forcing против стандартных Diffusion Models#

Хотя они разделяют фундаментальный механизм денойзинга, Diffusion Forcing существенно отличается от стандартных Diffusion Models. Традиционные диффузионные модели, например, используемые для генерации text-to-image, обычно проводят денойзинг всех пикселей или скрытых переменных одного статического вывода одновременно. В отличие от них, Diffusion Forcing явно моделирует временной ряд, заставляя сеть соблюдать причинно-следственный порядок последовательности. Это делает ее гораздо более подходящей для таких временных задач, как прогнозирование траектории и action recognition.

Link to this sectionПрактическое внедрение обработки последовательностей#

Хотя Diffusion Forcing в основном применяется к генеративным задачам последовательностей, интерпретация временных последовательностей не менее важна в современных пайплайнах компьютерного зрения. Например, ты можешь эффективно отслеживать объекты в последовательных видеокадрах, используя Ultralytics YOLO26, которая нативно поддерживает временную согласованность в процессе object tracking.

from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model for high-speed inference
model = YOLO("yolo26n.pt")

# Process a temporal sequence (video) to maintain consistent object identities
results = model.track(source="path/to/video.mp4", stream=True)

# Iterate through the sequence of frames
for frame_result in results:
    # Access temporal tracking IDs for objects in the current state
    print(f"Tracked {len(frame_result.boxes)} objects in the current frame.")

Для команд, стремящихся масштабировать сбор данных последовательностей и обучать продвинутые модели компьютерного зрения, Ultralytics Platform предоставляет мощные облачные инструменты для управления сложными наборами данных, отслеживания экспериментов и развертывания моделей непосредственно на границе сети (edge). Независимо от того, экспериментируешь ли ты с современными причинно-следственными transformers в PyTorch или развертываешь системы отслеживания в реальном времени, овладение пересечением пространственных и временных данных необходимо для будущего AI.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения