Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

Flow Matching

Исследуй согласование потоков (flow matching) — фреймворк генеративного моделирования, который превращает шум в данные. Узнай, как он превосходит диффузионные модели благодаря более быстрому и качественному выводу.

Flow matching — это фреймворк генеративного моделирования, который учится преобразовывать простые распределения шума в сложные распределения данных путем непосредственного моделирования непрерывного потока точек данных во времени. В отличие от традиционных методов, опирающихся на сложные многоэтапные процессы удаления шума, flow matching определяет более простой и прямой путь — зачастую прямую линию — между исходным распределением (шумом) и целевым распределением (данными). Такой подход значительно оптимизирует обучение моделей generative AI, что приводит к более быстрой сходимости, улучшенной стабильности и более высокому качеству результатов. Обучая векторное поле, которое перемещает плотность вероятности из исходного состояния в желаемое состояние данных, метод предлагает надежную альтернативу стандартным diffusion models.

Link to this sectionОсновные концепции и механизмы#

По своей сути flow matching упрощает процесс генерации, фокусируясь на скорости преобразования данных, а не только на маргинальных вероятностях. Этот метод черпает вдохновение из непрерывных нормализующих потоков (continuous normalizing flows), но позволяет избежать высоких вычислительных затрат на вычисление точных правдоподобий.

  • Vector Fields: Центральным компонентом flow matching является нейронная сеть, предсказывающая вектор скорости для любой заданной точки в пространстве и времени. Этот вектор указывает точке данных направление движения для превращения в реалистичный образец.
  • Optimal Transport: Flow matching часто стремится найти наиболее эффективный путь для переноса массы из одного распределения в другое. Минимизируя пройденное расстояние, модели могут достигать более быстрого времени вывода. Техники, подобные optimal transport, помогают определить эти прямые пути, гарантируя, что шум отображается в данные геометрически согласованным образом.
  • Conditional Generation: Подобно тому как Ultralytics YOLO26 обуславливает обнаружение входными изображениями, flow matching может обуславливать генерацию метками классов или текстовыми промптами. Это обеспечивает точный контроль над генерируемым контентом — ключевую функцию современных пайплайнов text-to-image и text-to-video.

Link to this sectionFlow Matching против diffusion models#

Хотя как flow matching, так и diffusion models служат целям генеративного моделирования, они различаются по своей математической формулировке и эффективности обучения.

  • Diffusion Models: Эти модели, как правило, опираются на стохастическое дифференциальное уравнение (SDE), которое постепенно добавляет шум к данным, а затем учится обращать этот процесс. Обратный путь часто бывает криволинейным и требует множества дискретных шагов во время inference, что может замедлить генерацию.
  • Flow Matching: Этот подход по существу «выпрямляет» траекторию между шумом и данными. Обучая детерминированное обыкновенное дифференциальное уравнение (ODE) с более прямыми путями, flow matching допускает использование больших размеров шага при сэмплировании. Это напрямую трансформируется в более высокую скорость генерации без потери качества, устраняя серьезное узкое место в сценариях real-time inference.

Link to this sectionРеальные приложения#

Эффективность и высокая точность flow matching привели к его быстрому внедрению в различных передовых областях ИИ.

  • High-Resolution Image Synthesis: Flow matching все чаще используется для работы самых современных генераторов изображений. Обеспечивая более прямые траектории, эти модели могут создавать фотореалистичные изображения с меньшим количеством шагов сэмплирования по сравнению с предыдущими архитектурами, такими как Stable Diffusion. Эта эффективность критически важна для развертывания генеративных инструментов на потребительском оборудовании или внутри Ultralytics Platform для аугментации данных.
  • Generative Voice and Audio: В сфере speech synthesis flow matching позволяет генерировать высоконатуралистичную человеческую речь. Он способен моделировать непрерывные изменения высоты тона и интонации более эффективно, чем авторегрессионные модели, что приводит к созданию более плавных и выразительных систем text-to-speech.
  • 3D Point Cloud Generation: Генерация 3D-ассетов требует моделирования сложных пространственных отношений. Flow matching эффективно масштабируется до более высоких размерностей, что делает его подходящим для создания детализированных наборов данных 3d object detection или ассетов для виртуальных сред.

Link to this sectionРеализация концепций Flow Matching#

Хотя flow matching включает в себя сложные циклы обучения, концепцию преобразования шума можно визуализировать с помощью базовых операций над тензорами. Следующий пример демонстрирует упрощенную концепцию перемещения точек из распределения шума к цели с использованием вектора направления, что аналогично тому, как векторное поле flow matching направляло бы данные.

import torch

# Simulate 'noise' data (source distribution)
noise = torch.randn(5, 2)

# Simulate 'target' data means (destination distribution)
target_means = torch.tensor([[2.0, 2.0], [-2.0, -2.0], [2.0, -2.0], [-2.0, 2.0], [0.0, 0.0]])

# Calculate a simple linear path (velocity) from noise to target
# In a real Flow Matching model, a neural network predicts this velocity
time_step = 0.5  # Move halfway
velocity = target_means - noise
next_state = noise + velocity * time_step

print(f"Start:\n{noise}\nNext State (t={time_step}):\n{next_state}")

Link to this sectionБудущие направления и исследования#

По состоянию на 2025 год flow matching продолжает развиваться, и исследования фокусируются на масштабировании этих моделей до еще более крупных наборов данных и более сложных модальностей. Исследователи изучают способы объединения flow matching с large language models для улучшения семантического понимания в задачах генерации. Более того, интеграция flow matching в пайплайны генерации видео прокладывает путь к большей временной согласованности, устраняя «мерцание», часто наблюдаемое в видео, сгенерированных ИИ. Это соответствует общим отраслевым тенденциям к созданию унифицированных foundation models, способных беспрепятственно решать мультимодальные задачи.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения