تعرف على YOLO26: جيل جديد من ذكاء الرؤية الاصطناعي.
Ultralytics
العودة إلى قاموس مصطلحات Ultralytics

Diffusion Transformer (DiT)

اكتشف كيف تدمج محولات الانتشار (DiT) بين المحولات (transformers) ونماذج الانتشار للحصول على تركيب عالي الدقة. تعرف على القياس (scaling)، وSora، وUltralytics YOLO26.

يعد محول الانتشار (DiT) معمارية توليدية متقدمة تدمج بين قدرات المعالجة التسلسلية لـ Transformers وقدرات تصنيع الصور عالية الدقة لـ نماذج الانتشار. تقليدياً، اعتمدت أنظمة الانتشار بشكل كبير على معماريات U-Net الالتفافية لإزالة الضجيج من المدخلات وتوليد الصور بشكل تكراري. تستبدل نماذج DiT هيكلية U-Net بمعمارية محول قابلة للتوسع، حيث تعالج البيانات المرئية كسلسلة من الرقع، على غرار كيفية تحليل محول الرؤية (ViT) للصور. يتيح هذا التحول النموذجي للنماذج التوسع بشكل أكثر قابلية للتنبؤ، مع الاستفادة من الموارد الحسابية المتزايدة لإنتاج مخرجات أكثر واقعية وتماسكاً.

Link to this sectionالتمييز بين DiT ونماذج الانتشار التقليدية#

بينما تعتبر نماذج الانتشار التقليدية حجر الأساس لـ الذكاء الاصطناعي التوليدي الحديث، غالباً ما تواجه معماريات U-Net الخاصة بها اختناقات عند التوسع لعدد هائل من المعلمات. في المقابل، ترث محولات الانتشار بشكل طبيعي قوانين التوسع الملحوظة في نماذج اللغات الكبيرة (LLMs). من خلال القضاء على تحيزات التصغير المكاني واستخدام آليات الانتباه الذاتي العالمي، تتعلم نماذج DiT علاقات مكانية معقدة عبر الصورة أو إطار الفيديو بالكامل. للتعمق في أصول سلوك التوسع هذا، يمكنك مراجعة ورقة بحث DiT الأصلية المنشورة على arXiv والتي وضعت معايير الكفاءة هذه.

Link to this sectionتطبيقات العالم الحقيقي#

أدت مرونة وقابلية التوسع لمحولات الانتشار إلى إحداث طفرات كبيرة عبر قطاعات مختلفة في الرؤية الحاسوبية:

  1. توليد الفيديو عالي الدقة: يوجد أبرز تطبيق لمعمارية DiT في نماذج تحويل النص إلى فيديو، مثل نموذج Sora من OpenAI. من خلال فهم الاتساق الزمني والمساحة ثلاثية الأبعاد، يمكن لنماذج DiT تصنيع مقاطع فيديو واقعية للغاية تصل مدتها إلى دقيقة، مع الحفاظ على المنطق الفيزيائي لكل إطار، مما يُحدث ثورة في إنشاء المحتوى الرقمي والمؤثرات البصرية.

  2. توليد الصور المتقدم: في التصميم التجاري وتوليد الفن بـ الذكاء الاصطناعي، توفر نماذج DiT دقة غير مسبوقة في تحويل النص إلى صورة. وتستخدمها الوكالات الإبداعية لإنشاء أصول تسويقية دقيقة للغاية، حيث تقوم بعرض مطالبات معقدة مع طباعة دقيقة وواقعية تكوينية كان من الصعب على نماذج U-Net السابقة تحقيقها.

Link to this sectionتنفيذ مفاهيم المحولات#

بينما تُستخدم نماذج DiT بشكل أساسي للمهام التوليدية الثقيلة، يمكنك استكشاف آليات الانتباه الذاتي الأساسية التي تعتمد عليها باستخدام مكتبات التعلم العميق القياسية. يستخدم مقتطف Python التالي PyTorch لتوضيح كيفية معالجة رقع الصور المسطحة من خلال طبقة محول، وهي عملية أساسية داخل شبكة DiT.

import torch
import torch.nn as nn

# Define a standard Transformer layer acting as a DiT building block
transformer_layer = nn.TransformerEncoderLayer(d_model=256, nhead=8)

# Simulate flattened latent image patches (Sequence Length, Batch Size, Features)
latent_patches = torch.rand(196, 1, 256)

# Apply self-attention to process and relate patches globally
output_features = transformer_layer(latent_patches)
print(f"Processed feature shape: {output_features.shape}")

للحصول على تفاصيل تقنية شاملة حول طبقات الانتباه، توفر وثائق PyTorch الخاصة بوحدات Transformer نقطة بداية ممتازة.

Link to this sectionسد الفجوة بين التوليد والكشف#

تمثل محولات الانتشار قمة الابتكار في توليد المحتوى، لكن العديد من سير العمل في المؤسسات تتطلب تحليلاً مرئياً في الوقت الفعلي بدلاً من التوليد. للمهام التي تتطلب استدلالاً عالي السرعة، مثل اكتشاف الأشياء وتجزئة الصور، تظل النماذج خفيفة الوزن والمُحسنة للحافة هي المعيار الصناعي.

تم تصميم Ultralytics YOLO26 بدقة لهذه مهام الرؤية الحاسوبية التحليلية. فهو يوفر سرعة ودقة لا مثيل لهما بشكل أصلي وجاهز للاستخدام، مما يجنب المستخدم العبء الحسابي الثقيل الذي تتطلبه المحولات التوليدية الضخمة. وللانتقال بسهولة من إنشاء مجموعات البيانات إلى النشر على مستوى المؤسسات، يعتمد المطورون على منصة Ultralytics، وهي حل شامل لإدارة خطوط أنابيب الذكاء الاصطناعي المرئي القوية. للحصول على منظور أوسع حول كيفية مقارنة النماذج التوليدية بالنماذج التحليلية، يقدم دورة التعلم الآلي المكثفة من Google سياقاً أساسياً ممتازاً.

Explore solutions

Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ارتقِ بالرؤية الحاسوبية (Vision AI) في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة لتحقيق إنتاجية أعلى وأكثر ذكاءً.

اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في السيارات

طبق الرؤية الحاسوبية في السيارات باستخدام نماذج Ultralytics YOLO. ترتقي الرؤية الحاسوبية (Vision AI) بسلامة الطرق ومساعدة السائق وأتمتة المركبات من أجل طرق أكثر ذكاءً.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

ابنِ حلول رعاية صحية باستخدام نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي للرؤية في الرعاية الصحية على تعزيز تصوير طبي أسرع، وتشخيصات أكثر ذكاءً، ومراقبة المرضى.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور البيع بالتجزئة باستخدام نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي للرؤية على تعزيز تتبع المخزون، ومراقبة الرفوف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي الرؤيوي في الروبوتات التنقل المستقل، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن التصنيع باستخدام نماذج Ultralytics YOLO. يقود الذكاء الاصطناعي الرؤيوي مراقبة الجودة، وكشف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط الخدمات اللوجستية مع نماذج Ultralytics YOLO. تمكّن رؤية الذكاء الاصطناعي من فحص الطرود، والفرز، وتتبع المركبات، ومراقبة سلامة المستودعات في الوقت الفعلي.

اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ارتقِ بالرؤية الحاسوبية (Vision AI) في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة لتحقيق إنتاجية أعلى وأكثر ذكاءً.

اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في السيارات

طبق الرؤية الحاسوبية في السيارات باستخدام نماذج Ultralytics YOLO. ترتقي الرؤية الحاسوبية (Vision AI) بسلامة الطرق ومساعدة السائق وأتمتة المركبات من أجل طرق أكثر ذكاءً.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

ابنِ حلول رعاية صحية باستخدام نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي للرؤية في الرعاية الصحية على تعزيز تصوير طبي أسرع، وتشخيصات أكثر ذكاءً، ومراقبة المرضى.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور البيع بالتجزئة باستخدام نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي للرؤية على تعزيز تتبع المخزون، ومراقبة الرفوف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي الرؤيوي في الروبوتات التنقل المستقل، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن التصنيع باستخدام نماذج Ultralytics YOLO. يقود الذكاء الاصطناعي الرؤيوي مراقبة الجودة، وكشف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط الخدمات اللوجستية مع نماذج Ultralytics YOLO. تمكّن رؤية الذكاء الاصطناعي من فحص الطرود، والفرز، وتتبع المركبات، ومراقبة سلامة المستودعات في الوقت الفعلي.

اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ارتقِ بالرؤية الحاسوبية (Vision AI) في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة لتحقيق إنتاجية أعلى وأكثر ذكاءً.

اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في السيارات

طبق الرؤية الحاسوبية في السيارات باستخدام نماذج Ultralytics YOLO. ترتقي الرؤية الحاسوبية (Vision AI) بسلامة الطرق ومساعدة السائق وأتمتة المركبات من أجل طرق أكثر ذكاءً.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

ابنِ حلول رعاية صحية باستخدام نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي للرؤية في الرعاية الصحية على تعزيز تصوير طبي أسرع، وتشخيصات أكثر ذكاءً، ومراقبة المرضى.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور البيع بالتجزئة باستخدام نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي للرؤية على تعزيز تتبع المخزون، ومراقبة الرفوف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي الرؤيوي في الروبوتات التنقل المستقل، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن التصنيع باستخدام نماذج Ultralytics YOLO. يقود الذكاء الاصطناعي الرؤيوي مراقبة الجودة، وكشف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط الخدمات اللوجستية مع نماذج Ultralytics YOLO. تمكّن رؤية الذكاء الاصطناعي من فحص الطرود، والفرز، وتتبع المركبات، ومراقبة سلامة المستودعات في الوقت الفعلي.

اعرف المزيد

لنبنِ مستقبل الذكاء الاصطناعي معاً!

ابدأ رحلتك مع مستقبل تعلم الآلة