Rectified Flow

Khám phá Rectified Flow, một kỹ thuật mô hình hóa tạo sinh hiệu quả để tạo dữ liệu có độ trung thực cao. Tìm hiểu cách sử dụng dữ liệu tổng hợp với các mô hình Ultralytics YOLO26.

Rectified Flow là một kỹ thuật generative modeling tiên tiến, học cách ánh xạ một phân phối nhiễu đơn giản, dễ lấy mẫu sang một phân phối dữ liệu phức tạp bằng cách sử dụng các quỹ đạo đường thẳng. Nổi lên như một giải pháp thay thế hiệu quả cao cho các khung mô hình tạo truyền thống, Rectified Flow hoạt động bằng cách giải các phương trình vi phân thường (ODEs) để truyền tải các điểm dữ liệu từ nhiễu thuần túy trực tiếp đến hình ảnh, âm thanh hoặc video mục tiêu. Vì các đường dẫn này được huấn luyện để thẳng nhất có thể, mô hình yêu cầu ít bước hơn đáng kể để tạo ra các đầu ra chất lượng cao, giúp giảm đáng kể chi phí tính toán trong quá trình inference.

Link to this sectionRectified Flow so với các Diffusion Models#

Mặc dù cả hai kỹ thuật đều thuộc họ AI tạo rộng lớn hơn, Rectified Flow giải quyết một số điểm thiếu hiệu quả cốt lõi được tìm thấy trong các Diffusion Models tiêu chuẩn. Các Diffusion models thường xây dựng một đường dẫn cong, đầy nhiễu giữa phân phối nhiễu và dữ liệu cuối cùng, đòi hỏi hàng chục hoặc thậm chí hàng trăm bước khử nhiễu lặp đi lặp lại để tạo ra đầu ra rõ nét. Ngược lại, Rectified Flow tối ưu hóa rõ ràng các đường dẫn truyền tải để trở nên thẳng. Việc "làm thẳng" này cho phép mô hình thực hiện các bước lớn hơn nhiều mà không làm giảm độ chính xác, cho phép tạo ra kết quả có độ trung thực cao chỉ trong vài lần lặp.

Link to this sectionCác ứng dụng trong thực tế#

Hiệu suất và tính ổn định của Rectified Flow đã biến nó thành nền tảng của các quy trình tạo phương tiện và computer vision hiện đại.

High-Fidelity Synthetic Data Generation: Các tổ chức sử dụng các mô hình Rectified Flow để nhanh chóng tạo ra các computer vision datasets khổng lồ và đa dạng. Dữ liệu tổng hợp này có thể mô phỏng các trường hợp biên hiếm gặp, điều này rất quan trọng để huấn luyện các object detection architectures mạnh mẽ mà không tốn chi phí thu thập dữ liệu thủ công đắt đỏ.
Advanced Text-to-Image Systems: Các tổ chức nghiên cứu AI hàng đầu, bao gồm Google DeepMind và OpenAI, đang ngày càng khám phá các kỹ thuật tạo đường dẫn thẳng. Những mô hình này vận hành các công cụ tạo hình ảnh và video nhanh chóng hướng đến người tiêu dùng, nơi inference latency thấp là yếu tố then chốt cho trải nghiệm người dùng mượt mà.

Link to this sectionTăng cường các quy trình làm việc Computer Vision#

Trong thực tế, các hình ảnh tổng hợp chất lượng cao do các mô hình Rectified Flow tạo ra thường được sử dụng để pre-train hoặc fine-tune các mô hình thị giác ở hạ nguồn. Ví dụ, các nhà phát triển có thể tạo ra các hình ảnh mục tiêu về lỗi sản xuất và sử dụng Ultralytics Platform để gán nhãn dữ liệu mới này một cách dễ dàng trên đám mây. Sau khi được gán nhãn, tập dữ liệu có thể được sử dụng để huấn luyện mô hình Ultralytics YOLO26 nhằm đạt được object detection thời gian thực với độ chính xác cao.

Dưới đây là một ví dụ ngắn gọn minh họa cách huấn luyện mô hình YOLO26 trên tập dữ liệu tùy chỉnh (có thể bao gồm dữ liệu tổng hợp được tạo qua Rectified Flow) bằng cách sử dụng gói ultralytics:

from ultralytics import YOLO

# Load the latest state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")

# Train the model on your synthetic/real dataset mix
results = model.train(data="custom_synthetic_data.yaml", epochs=50, imgsz=640)

# Export the trained model to ONNX for fast deployment
model.export(format="onnx")

Bằng cách thu hẹp khoảng cách giữa các mô hình tạo hiệu quả và các công cụ phân loại mạnh mẽ như YOLO26, các học viên machine learning có thể xây dựng các hệ thống AI có khả năng phục hồi cao. Cho dù đang đánh giá model performance metrics hay xuất sang các thiết bị biên thông qua TensorRT, sự kết hợp giữa dữ liệu tổng hợp và khả năng phát hiện tiên tiến nhất sẽ đẩy nhanh các steps of a CV project, đảm bảo rằng các mô hình vừa có độ chính xác cao vừa cực kỳ nhanh chóng.

Explore solutions

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Rectified Flow

Link to this sectionRectified Flow so với các Diffusion Models#

Link to this sectionCác ứng dụng trong thực tế#

Link to this sectionTăng cường các quy trình làm việc Computer Vision#

Explore solutions

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

Hãy cùng nhau xây dựng tương lai của AI!