Rectified Flow
استكشف Rectified Flow، وهي تقنية نمذجة توليدية فعالة لإنشاء بيانات عالية الدقة. تعلم كيفية استخدام البيانات الاصطناعية مع نماذج Ultralytics YOLO26.
Rectified Flow هي تقنية متقدمة في النمذجة التوليدية تتعلم تعيين توزيع ضوضاء بسيط وسهل أخذ العينات منه إلى توزيع بيانات معقد باستخدام مسارات خطية مستقيمة. تبرز هذه التقنية كبديل فعال للغاية لأطر العمل التوليدية التقليدية، حيث تعمل عن طريق حل المعادلات التفاضلية العادية (ODEs) التي تنقل نقاط البيانات من الضوضاء البحتة مباشرة إلى صور أو صوت أو فيديو مستهدف. ونظراً لأن هذه المسارات يتم تدريبها لتكون مستقيمة قدر الإمكان، فإن النموذج يتطلب خطوات أقل بكثير لإنشاء مخرجات عالية الجودة، مما يقلل بشكل كبير من العبء الحسابي أثناء الاستنتاج.
Link to this sectionRectified Flow مقابل نماذج الانتشار (Diffusion Models)#
على الرغم من أن كلتا التقنيتين تنتميان إلى عائلة أوسع من الذكاء الاصطناعي التوليدي، إلا أن Rectified Flow تعالج بعض أوجه القصور الأساسية الموجودة في نماذج الانتشار القياسية. تقوم نماذج الانتشار عادةً بإنشاء مسار منحني ومليء بالضوضاء بين توزيع الضوضاء والبيانات النهائية، مما يتطلب عشرات أو حتى مئات الخطوات التكرارية لإزالة الضوضاء لإنتاج مخرجات واضحة. على النقيض من ذلك، تعمل Rectified Flow بشكل صريح على تحسين مسارات النقل لتكون مستقيمة. هذا "الاستقامة" تسمح للنموذج باتخاذ خطوات أكبر بكثير دون فقدان الدقة، مما يتيح توليد بيانات عالية الدقة في بضع تكرارات فقط.
Link to this sectionالتطبيقات الواقعية#
لقد جعلت كفاءة واستقرار Rectified Flow منها حجر الزاوية في رؤية الحاسوب الحديثة وخطوط معالجة توليد الوسائط.
- توليد البيانات الاصطناعية عالية الدقة: تستخدم المؤسسات نماذج Rectified Flow لتوليد مجموعات بيانات رؤية حاسوبية ضخمة ومتنوعة بسرعة. يمكن لهذه البيانات الاصطناعية محاكاة حالات نادرة، وهو أمر بالغ الأهمية لتدريب بنيات كشف الكائنات القوية دون التكلفة الباهظة لجمع البيانات يدوياً.
- أنظمة تحويل النص إلى صورة المتقدمة: تستكشف مؤسسات أبحاث الذكاء الاصطناعي الرائدة، بما في ذلك Google DeepMind وOpenAI، بشكل متزايد تقنيات التوليد ذات المسار المستقيم. تعمل هذه النماذج على تشغيل أدوات توليد الصور والفيديو السريعة الموجهة للمستهلكين، حيث يعد انخفاض زمن انتقال الاستنتاج أمراً بالغ الأهمية للحصول على تجربة مستخدم سلسة.
Link to this sectionتعزيز سير عمل رؤية الحاسوب#
من الناحية العملية، غالباً ما تُستخدم الصور الاصطناعية عالية الجودة التي تنتجها نماذج Rectified Flow للتدريب المسبق أو الضبط الدقيق لنماذج الرؤية اللاحقة. على سبيل المثال، يمكن للمطورين إنشاء صور مستهدفة لعيوب التصنيع واستخدام منصة Ultralytics لتعليق هذه البيانات الجديدة بسهولة في السحابة. بمجرد تعليقها، يمكن استخدام مجموعة البيانات لتدريب نموذج Ultralytics YOLO26 لإجراء كشف كائنات بدقة عالية وفي الوقت الفعلي.
فيما يلي مثال موجز يوضح كيفية تدريب نموذج YOLO26 على مجموعة بيانات مخصصة (والتي يمكن أن تتضمن بيانات اصطناعية تم إنشاؤها عبر Rectified Flow) باستخدام حزمة ultralytics:
from ultralytics import YOLO
# Load the latest state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")
# Train the model on your synthetic/real dataset mix
results = model.train(data="custom_synthetic_data.yaml", epochs=50, imgsz=640)
# Export the trained model to ONNX for fast deployment
model.export(format="onnx")من خلال سد الفجوة بين النماذج التوليدية الفعالة وأدوات التمييز القوية مثل YOLO26، يمكن لممارسي تعلم الآلة بناء أنظمة ذكاء اصطناعي مرنة للغاية. سواء كان ذلك عند تقييم مقاييس أداء النموذج أو التصدير إلى أجهزة الحافة عبر TensorRT، فإن الجمع بين البيانات الاصطناعية والكشف المتطور يسرع من خطوات مشروع رؤية الحاسوب، مما يضمن أن النماذج دقيقة للغاية وسريعة بشكل لا يصدق.






