Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Quay lại Bảng thuật ngữ Ultralytics

Flow Matching

Khám phá flow matching, một khung mô hình tạo sinh chuyển đổi nhiễu thành dữ liệu. Tìm hiểu cách nó vượt trội hơn các diffusion models với suy luận nhanh hơn, chất lượng cao hơn.

Flow matching là một framework mô hình hóa tạo sinh (generative modeling) học cách chuyển đổi các phân phối nhiễu đơn giản thành các phân phối dữ liệu phức tạp bằng cách mô hình hóa trực tiếp luồng dữ liệu liên tục theo thời gian. Khác với các phương pháp truyền thống dựa vào quy trình khử nhiễu đa bước phức tạp, flow matching xác định một con đường đơn giản và trực tiếp hơn—thường là một đường thẳng—giữa phân phối nguồn (nhiễu) và phân phối đích (dữ liệu). Phương pháp này giúp tinh giản đáng kể quá trình huấn luyện các mô hình generative AI, dẫn đến tốc độ hội tụ nhanh hơn, độ ổn định cải thiện và đầu ra có chất lượng cao hơn. Bằng cách học một trường vector đẩy mật độ xác suất từ trạng thái tiên nghiệm (prior) sang trạng thái dữ liệu mong muốn, nó cung cấp một giải pháp thay thế mạnh mẽ cho các diffusion models tiêu chuẩn.

Link to this sectionCác khái niệm và cơ chế cốt lõi#

Về cốt lõi, flow matching đơn giản hóa quy trình tạo sinh bằng cách tập trung vào vận tốc của quá trình chuyển đổi dữ liệu thay vì chỉ tập trung vào các xác suất biên. Phương pháp này lấy cảm hứng từ các luồng chuẩn hóa liên tục (continuous normalizing flows) nhưng tránh được chi phí tính toán cao khi phải tính toán các likelihood chính xác.

  • Vector Fields: Thành phần trung tâm của flow matching là một mạng thần kinh dự đoán vector vận tốc cho bất kỳ điểm nào trong không gian và thời gian. Vector này cho điểm dữ liệu biết hướng di chuyển để trở thành một mẫu thực tế.
  • Optimal Transport: Flow matching thường hướng tới việc tìm ra con đường hiệu quả nhất để vận chuyển khối lượng (mass) từ phân phối này sang phân phối khác. Bằng cách giảm thiểu khoảng cách di chuyển, các mô hình có thể đạt được thời gian inference nhanh hơn. Các kỹ thuật như optimal transport giúp xác định các con đường thẳng này, đảm bảo rằng nhiễu được ánh xạ sang dữ liệu theo cách nhất quán về mặt hình học.
  • Conditional Generation: Tương tự như cách Ultralytics YOLO26 điều kiện hóa việc phát hiện trên hình ảnh đầu vào, flow matching có thể điều kiện hóa việc tạo sinh dựa trên các nhãn lớp hoặc câu lệnh (text prompts). Điều này cho phép kiểm soát chính xác nội dung được tạo, một tính năng then chốt trong các pipeline text-to-imagetext-to-video hiện đại.

Link to this sectionSo sánh Flow Matching và Diffusion Models#

Mặc dù cả flow matching và diffusion models đều phục vụ mục đích mô hình hóa tạo sinh, chúng khác nhau về công thức toán học và hiệu quả huấn luyện.

  • Diffusion Models: Các mô hình này thường dựa vào phương trình vi phân ngẫu nhiên (SDE) giúp bổ sung nhiễu dần dần vào dữ liệu và sau đó học cách đảo ngược quy trình này. Con đường đảo ngược thường bị cong và đòi hỏi nhiều bước rời rạc trong quá trình inference, điều này có thể làm chậm quá trình tạo sinh.
  • Flow Matching: Cách tiếp cận này về cơ bản "làm thẳng" quỹ đạo giữa nhiễu và dữ liệu. Bằng cách học một phương trình vi phân thường (ODE) với các con đường thẳng hơn, flow matching cho phép kích thước bước lớn hơn trong quá trình lấy mẫu (sampling). Điều này trực tiếp giúp tăng tốc độ tạo sinh mà không làm giảm chất lượng, giải quyết một nút thắt lớn trong các kịch bản real-time inference.

Link to this sectionCác ứng dụng trong thực tế#

Sự hiệu quả và độ trung thực cao của flow matching đã dẫn đến việc áp dụng nhanh chóng trong nhiều lĩnh vực AI tiên tiến.

  • Tổng hợp hình ảnh độ phân giải cao: Flow matching ngày càng được sử dụng để cung cấp sức mạnh cho các trình tạo ảnh hiện đại nhất. Bằng cách cho phép các quỹ đạo thẳng hơn, các mô hình này có thể tạo ra những hình ảnh chân thực với ít bước lấy mẫu hơn so với các kiến trúc trước đây như Stable Diffusion. Sự hiệu quả này rất quan trọng để triển khai các công cụ tạo sinh trên phần cứng tiêu dùng hoặc trong Ultralytics Platform phục vụ tăng cường dữ liệu.
  • Tạo giọng nói và âm thanh: Trong lĩnh vực speech synthesis, flow matching cho phép tạo ra giọng nói con người tự nhiên ở mức độ cao. Nó có thể mô hình hóa các biến đổi liên tục về cao độ và tông giọng hiệu quả hơn các mô hình tự hồi quy (autoregressive), dẫn đến các hệ thống text-to-speech mượt mà và biểu cảm hơn.
  • Tạo Point Cloud 3D: Việc tạo các tài sản 3D đòi hỏi phải mô hình hóa các mối quan hệ không gian phức tạp. Flow matching mở rộng hiệu quả sang các chiều không gian cao hơn, giúp nó phù hợp để tạo các bộ dữ liệu 3D object detection chi tiết hoặc các tài sản cho môi trường ảo.

Link to this sectionTriển khai các khái niệm Flow Matching#

Mặc dù flow matching liên quan đến các vòng lặp huấn luyện phức tạp, khái niệm chuyển đổi nhiễu có thể được hình dung bằng cách sử dụng các thao tác tensor cơ bản. Ví dụ sau đây minh họa một khái niệm đơn giản hóa về việc di chuyển các điểm từ phân phối nhiễu về phía mục tiêu bằng cách sử dụng một vector hướng, tương tự như cách một trường vector flow matching sẽ dẫn dắt dữ liệu.

import torch

# Simulate 'noise' data (source distribution)
noise = torch.randn(5, 2)

# Simulate 'target' data means (destination distribution)
target_means = torch.tensor([[2.0, 2.0], [-2.0, -2.0], [2.0, -2.0], [-2.0, 2.0], [0.0, 0.0]])

# Calculate a simple linear path (velocity) from noise to target
# In a real Flow Matching model, a neural network predicts this velocity
time_step = 0.5  # Move halfway
velocity = target_means - noise
next_state = noise + velocity * time_step

print(f"Start:\n{noise}\nNext State (t={time_step}):\n{next_state}")

Link to this sectionCác hướng đi tương lai và nghiên cứu#

Tính đến năm 2025, flow matching tiếp tục phát triển với nghiên cứu tập trung vào việc mở rộng các mô hình này cho các bộ dữ liệu lớn hơn và các phương thức (modalities) phức tạp hơn. Các nhà nghiên cứu đang điều tra cách kết hợp flow matching với large language models để cải thiện sự hiểu biết ngữ nghĩa trong các tác vụ tạo sinh. Hơn nữa, việc tích hợp flow matching vào các pipeline tạo video đang mở đường cho tính nhất quán về thời gian tốt hơn, giải quyết vấn đề "nhấp nháy" thường thấy trong các video do AI tạo ra. Điều này phù hợp với các xu hướng công nghiệp rộng lớn hơn hướng tới các foundation models thống nhất có khả năng xử lý các tác vụ đa phương thức một cách liền mạch.

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning