اكتشف كيف تُحدث وحدات معالجة الرسومات ثورة في الذكاء الاصطناعي والتعلم الآلي من خلال تسريع التعلم العميق وتحسين سير العمل وتمكين التطبيقات الواقعية.
وحدة معالجة الرسوماتGPU هي دائرة إلكترونية متخصصة مصممة في البداية لتسريع عملية إنشاء وعرض وعرض رسومات الكمبيوتر والصور. في حين أن تكمن أصولها في الألعاب وعرض الفيديو، فقد تطورت GPU لتصبح مكونًا أساسيًا في الحوسبة الحديثة بسبب بنيتها الفريدة. على عكس المعالج القياسي الذي يتعامل مع المهام بالتتابع، تتكون GPU من آلاف من نوى أصغر وفعالة قادرة على معالجة كتل ضخمة من البيانات في وقت واحد. هذه البنية المتوازية جعلت وحدات معالجة الرسومات لا غنى عنها في مجالات الذكاء الاصطناعي (AI) و والتعلُّم الآلي (ML)، حيث تعمل على الوقت اللازم لتدريب الخوارزميات المعقدة.
تكمن الميزة الأساسية GPU في الحوسبة المتوازية. أعباء عمل الذكاء الاصطناعي الحديثة، خاصةً تلك التي تتضمن التعلم العميق (DL) و والشبكات العصبية (NN)، تعتمد بشكل كبير على عمليات المصفوفة التي تتطلب الكثير من العمليات الحسابية المكثفة والمتكررة. يمكن GPU تقسيم هذه المهام على آلاف النوى النوى الخاصة بها، وتنفيذها كلها في وقت واحد.
وقد تم تسليط الضوء على هذه القدرة من خلال نجاح بنية بنية AlexNet، والتي أثبتت أن وحدات معالجة الرسومات يمكنها تدريب الشبكات العصبية التلافيفية (CNNs) بشكل أسرع بكثير من المعالجات التقليدية. اليوم، يسمح هذا التسريع للباحثين بإجراء تدريب النماذج في ساعات بدلاً من أسابيع. غالبًا ما تُقاس غالبًا ما تقاس الإنتاجية الحسابية لهذه الأجهزة بوحدة FLOPS (عمليات النقطة العائمة في الثانية)، وهو مقياس قياسي قياسي للحوسبة عالية الأداء.
لفهم موقع وحدات معالجة الرسومات في مشهد الأجهزة، من المفيد مقارنتها مع المعالجات الشائعة الأخرى:
أدى تطبيق تسريع GPU إلى تعزيز الابتكارات في مختلف الصناعات:
عند استخدام ultralytics يمكن أن يؤدي استخدام GPU إلى تسريع عملية التدريب بشكل كبير. تدعم مكتبة
تدعم المكتبة الاكتشاف التلقائي للأجهزة، لكن يمكن للمستخدمين أيضًا تحديد الجهاز يدويًا لضمان استخدام GPU
مستخدمة.
يوضح المثال التالي كيفية تدريب نموذج YOLO11 على أول GPU متاحة:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt") # Load a pretrained YOLO11 model
# Train the model using the GPU (device=0)
# This command utilizes the parallel processing power of the GPU
results = model.train(data="coco8.yaml", epochs=5, device=0)
بالإضافة إلى التدريب، تلعب وحدات معالجة الرسوميات دورًا حاسمًا في نشر النماذج. بالنسبة للتطبيقات التي تتطلب الاستدلال في الوقت الحقيقي، غالبًا ما تكون النماذج المدرَّبة المحسّنة باستخدام أدوات مثل NVIDIA TensorRT أو ONNX Runtime. تعمل هذه الأدوات على إعادة هيكلة الشبكة العصبية لتعظيم البنية المحددة GPU مما يقلل من زمن الاستجابة. علاوة على ذلك، أدى ظهور أدى ظهور الذكاء الاصطناعي المتطور إلى تطوير وحدات معالجة رسومات مدمجة وحدات معالجة رسومات مدمجة موفرة للطاقة قادرة على تشغيل مهام الرؤية الحاسوبية المعقدة مباشرةً على المحلية، مما يقلل من الاعتماد على الاتصال السحابي.