قابلية التوسع
اكتشف أهمية قابلية التوسع في مجال الذكاء الاصطناعي. تعرف على كيفية تمكين Ultralytics Ultralytics من نشر نماذج فعالة وعالية الأداء.
تشير قابلية التوسع إلى قدرة نظام أو شبكة أو عملية على التعامل مع كمية متزايدة من العمل عن طريق إضافة
موارد. في سياق
الذكاء الاصطناعي (AI) و
التعلم الآلي (ML)، تصف قابلية التوسع
قدرة النموذج أو البنية التحتية على الحفاظ على مستويات الأداء مع زيادة الطلب. عادةً ما يتجلى هذا الطلب
في شكل مجموعات بيانات أكبر أثناء التدريب، أو حركة مرور أعلى للمستخدمين أثناء الاستدلال، أو زيادة التعقيد في
المهام الحسابية. تسمح البنية القابلة للتوسع بالتوسع السلس — سواء كان ذلك من خلال نشر
نموذج رؤية حاسوبية على جهاز مدمج واحد
أو تلبية ملايين طلبات واجهة برمجة التطبيقات عبر مجموعات السحابة — مما يضمن
بقاء زمن الاستدلال منخفضًا حتى في ظل الحمل الثقيل
.
أهمية قابلية التوسع في الذكاء الاصطناعي
يعد التصميم من أجل قابلية التوسع عنصراً حاسماً في نجاح
عمليات التعلم الآلي (MLOps). فقد يفشل النموذج الذي يعمل بشكل مثالي في بيئة بحثية خاضعة للرقابة عند تعرضه لتيارات البيانات عالية السرعة
الموجودة في الإنتاج. تتطلب الإدارة الفعالة
للبيانات الضخمة أنظمة قابلة للتوسع أفقياً
(إضافة المزيد من الأجهزة إلى المجموعة) أو رأسياً (إضافة المزيد من القوة، مثل ذاكرة الوصول العشوائي أو وحدات معالجة الرسومات، إلى الأجهزة الموجودة).
تشمل المزايا الرئيسية لأنظمة الذكاء الاصطناعي القابلة للتطوير ما يلي:
-
الموثوقية: تضمن الأنظمة القابلة للتوسع وقت تشغيل متسق للخدمة أثناء الزيادات غير المتوقعة في حركة المرور،
مما يمنع تعطل التطبيقات الهامة.
-
الكفاءة من حيث التكلفة: يتيح التوسع الديناميكي تقليص الموارد خلال فترات الاستخدام المنخفض، وهي ميزة
غالبًا ما تديرها منصات الحوسبة السحابية مثل
AWS أو Google .
-
الاستعداد للمستقبل: تستوعب البنية التحتية القابلة للتطوير خوارزميات أحدث وأكثر تعقيدًا، مثل
محولات الرؤية (ViT)، دون
الحاجة إلى إجراء إصلاح شامل لنظام الأجهزة.
استراتيجيات تحقيق قابلية التوسع
يتضمن إنشاء حلول ذكاء اصطناعي قابلة للتطوير تحسين كل من بنية النموذج والبنية التحتية للنشر.
-
التدريب الموزع: عندما تصبح مجموعات بيانات التدريب كبيرة جدًا بحيث لا يستطيع معالج واحد معالجتها،
يقوم التدريب الموزع بتقسيم عبء العمل
على عدة
وحدات معالجة رسومات (GPU).
تسمح أطر PyTorch مثل PyTorch
للمطورين بإجراء الحسابات بشكل متوازٍ، مما يقلل بشكل كبير من الوقت اللازم لتدريب النماذج الأساسية. تعمل أدوات
مثل Ultralytics على تبسيط هذه العملية من خلال إدارة موارد التدريب السحابية
تلقائيًا.
-
بنى نماذج فعالة: اختيار بنية النموذج المناسبة أمر بالغ الأهمية لتحقيق الإنتاجية.
تم تصميم أحدث إصدار Ultralytics ليكون أصغر حجماً
وأسرع من سابقيه، مما يجعله قابلاً للتطوير بشكل أساسي عبر أجهزة متنوعة، من
أجهزة الذكاء الاصطناعي المتطورة إلى مزارع الخوادم الضخمة.
-
التعبئة والتدبير: تضمن تعبئة التطبيقات باستخدام
Docker تشغيلها بشكل متسق عبر بيئات مختلفة
. لإدارة مجموعات كبيرة من الحاويات، يقوم Kubernetes بأتمتة
نشر وتوسيع وإدارة التطبيقات المعبأة في حاويات.
-
تحسين النموذج: تقنيات مثل
تكمية النموذج وتقليصه
تقلل من حجم الذاكرة والتكلفة الحسابية
للنموذج. أدوات مثل NVIDIA TensorRT يمكنها زيادة
تسريع سرعات الاستدلال، مما يتيح إنتاجية أعلى على الأجهزة الحالية.
مثال على الكود: استدلال دفعي قابل للتوسع
إحدى الطرق الفعالة لتحسين قابلية التوسع أثناء الاستدلال هي معالجة المدخلات على دفعات بدلاً من معالجتها بالتسلسل.
وهذا يزيد من GPU إلى أقصى حد ويزيد من الإنتاجية الإجمالية.
from ultralytics import YOLO
# Load a scalable YOLO26 model (smaller 'n' version for speed)
model = YOLO("yolo26n.pt")
# Define a batch of images (URLs or local paths)
# Processing multiple images at once leverages parallel computation
batch_images = ["https://ultralytics.com/images/bus.jpg", "https://ultralytics.com/images/zidane.jpg"]
# Run inference on the batch
results = model(batch_images)
# Print the number of detections for the first image
print(f"Detected {len(results[0].boxes)} objects in the first image.")
تطبيقات واقعية
تتيح قابلية التوسع لتقنيات الذكاء الاصطناعي الانتقال من البحث النظري إلى الأدوات الصناعية العالمية.
-
التصنيع الذكي: في مجال
الذكاء الاصطناعي في التصنيع، يجب أن تقوم أنظمة الفحص الآلي
بتحليل آلاف المكونات في الساعة على خطوط التجميع عالية السرعة. يضمن نظام الكشف عن الأجسام القابل للتطوير
أنه مع
زيادة سرعة الإنتاج، تحافظ عملية مراقبة الجودة على دقة عالية
دون أن تصبح عنق زجاجة.
-
محركات التوصيات للبيع بالتجزئة: تستخدم منصات التجارة الإلكترونية الكبرى
أنظمة التوصيات لتقديم ملايين
الاقتراحات المخصصة للمنتجات على الفور. تسمح البنية التحتية القابلة للتطوير لهذه المنصات بالتعامل مع الأحداث الضخمة
مثل يوم الجمعة السوداء، حيث يمكن أن يرتفع عدد الزيارات بمقدار 100 ضعف، من خلال توفير عقد خادم إضافية ديناميكيًا عبر
Microsoft أو مزودي خدمات مماثلين.
قابلية التوسع مقابل المفاهيم ذات الصلة
على الرغم من استخدامهما بشكل متبادل في كثير من الأحيان، فإن قابلية التوسع تختلف عن الأداء والكفاءة.
-
القابلية للتوسع مقابل الأداء:
يشير الأداء عادةً إلى مدى سرعة
أو دقة النظام في لحظة معينة (على سبيل المثال، الإطارات في الثانية). تصف القابلية للتوسع قدرة النظام
على الحفاظ على هذا الأداء مع زيادة حجم العمل.
-
القابلية للتوسع مقابل الكفاءة: تقيس الكفاءة الموارد المستخدمة لإنجاز مهمة معينة
(على سبيل المثال، استهلاك الطاقة لكل استدلال). يمكن أن يكون النظام فعالاً ولكن غير قابل للتوسع (إذا كان لا يستطيع التعامل مع المهام المتوازية
)، أو قابلاً للتوسع ولكن غير فعال (إذا كان يستخدم موارد مفرطة للتعامل مع النمو).
-
القابلية للتوسع مقابل المرونة: تسمح المرونة للنظام بمعالجة أنواع مختلفة من
المهام، مثل YOLO11 معالجة الكشف والتجزئة
وتقدير الوضع. تركز قابلية التوسع بشكل خاص على معالجة المزيد من المهام المماثلة.