Rectified Flow
Khám phá Rectified Flow, một kỹ thuật mô hình hóa tạo sinh hiệu quả để tạo dữ liệu độ trung thực cao. Tìm hiểu cách sử dụng dữ liệu tổng hợp với các model Ultralytics YOLO26.
Rectified Flow là một kỹ thuật generative modeling tiên tiến, học cách ánh xạ một phân phối nhiễu đơn giản, dễ lấy mẫu sang một phân phối dữ liệu phức tạp bằng các quỹ đạo đường thẳng. Xuất hiện như một giải pháp thay thế hiệu quả cao cho các framework tạo sinh truyền thống, Rectified Flow hoạt động bằng cách giải các phương trình vi phân thường (ODE) để chuyển các điểm dữ liệu từ nhiễu thuần túy trực tiếp thành hình ảnh, âm thanh hoặc video mục tiêu. Vì các đường dẫn này được huấn luyện để thẳng nhất có thể, mô hình yêu cầu ít bước hơn đáng kể để tạo ra các đầu ra chất lượng cao, từ đó giảm đáng kể chi phí tính toán trong quá trình suy luận (inference).
Link to this sectionRectified Flow so với Diffusion Models#
Mặc dù cả hai kỹ thuật đều thuộc họ AI tạo sinh rộng lớn hơn, Rectified Flow giải quyết một số điểm thiếu hiệu quả cốt lõi trong các Diffusion Models tiêu chuẩn. Các mô hình khuếch tán thường xây dựng một đường dẫn cong, đầy nhiễu giữa phân phối nhiễu và dữ liệu cuối cùng, đòi hỏi hàng chục hoặc thậm chí hàng trăm bước khử nhiễu lặp đi lặp lại để tạo ra đầu ra rõ nét. Ngược lại, Rectified Flow tối ưu hóa rõ ràng các đường dẫn truyền dẫn để trở nên thẳng. Việc "làm thẳng" này cho phép mô hình thực hiện các bước lớn hơn nhiều mà không làm mất độ chính xác, cho phép tạo ra độ trung thực cao chỉ trong vài lần lặp.
Link to this sectionCác ứng dụng thực tế#
Hiệu suất và sự ổn định của Rectified Flow đã biến nó thành nền tảng của các quy trình computer vision và tạo phương tiện truyền thông hiện đại.
- High-Fidelity Synthetic Data Generation: Các tổ chức sử dụng các mô hình Rectified Flow để nhanh chóng tạo ra các computer vision datasets khổng lồ và đa dạng. Dữ liệu tổng hợp này có thể mô phỏng các trường hợp biên hiếm gặp, điều rất quan trọng để huấn luyện các object detection architectures mạnh mẽ mà không tốn kém chi phí thu thập dữ liệu thủ công.
- Advanced Text-to-Image Systems: Các tổ chức nghiên cứu AI hàng đầu, bao gồm Google DeepMind và OpenAI, đang ngày càng khám phá các kỹ thuật tạo sinh theo đường thẳng. Các mô hình này cung cấp sức mạnh cho các công cụ tạo hình ảnh và video nhanh chóng, hướng tới người dùng, nơi inference latency thấp là yếu tố quan trọng cho trải nghiệm người dùng mượt mà.
Link to this sectionNâng cao quy trình làm việc Computer Vision#
Trong thực tế, các hình ảnh tổng hợp chất lượng cao do các mô hình Rectified Flow tạo ra thường được sử dụng để tiền huấn luyện hoặc tinh chỉnh (fine-tune) các mô hình thị giác ở hạ nguồn. Ví dụ, các nhà phát triển có thể tạo ra các hình ảnh mục tiêu về lỗi sản xuất và sử dụng Ultralytics Platform để chú thích dữ liệu mới này trên đám mây một cách dễ dàng. Sau khi được chú thích, tập dữ liệu có thể được sử dụng để huấn luyện mô hình Ultralytics YOLO26 cho các tác vụ object detection thời gian thực với độ chính xác cao.
Dưới đây là một ví dụ ngắn gọn minh họa cách huấn luyện mô hình YOLO26 trên tập dữ liệu tùy chỉnh (có thể bao gồm dữ liệu tổng hợp được tạo qua Rectified Flow) bằng cách sử dụng gói ultralytics:
from ultralytics import YOLO
# Load the latest state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")
# Train the model on your synthetic/real dataset mix
results = model.train(data="custom_synthetic_data.yaml", epochs=50, imgsz=640)
# Export the trained model to ONNX for fast deployment
model.export(format="onnx")Bằng cách thu hẹp khoảng cách giữa các mô hình tạo sinh hiệu quả và các công cụ phân loại mạnh mẽ như YOLO26, các chuyên gia máy học có thể xây dựng các hệ thống AI có khả năng phục hồi cao. Cho dù đánh giá model performance metrics hay xuất sang các thiết bị biên (edge devices) thông qua TensorRT, sự kết hợp giữa dữ liệu tổng hợp và kỹ thuật phát hiện hiện đại giúp tăng tốc steps of a CV project, đảm bảo rằng các mô hình vừa có độ chính xác cao vừa có tốc độ cực nhanh.






