اكتشف كيف تعمل وحدات معالجة Tensor (TPUs) على تسريع مهام التعلُّم الآلي مثل التدريب والاستدلال واكتشاف الكائنات بكفاءة لا مثيل لها.
وحدة معالجة Tensor TPU) هي عبارة عن دائرة متكاملة مطورة خصيصًا دائرة متكاملة خاصة بالتطبيقات (ASIC) صممتها Google خصيصًا لتسريع أعباء عمل التعلُّم الآلي (ML). على عكس المعالجات ذات الأغراض العامة، صُممت وحدات معالجة المعالجات TPU من الألف إلى الياء للتعامل مع المتطلبات الحسابية الهائلة للشبكات العصبية الشبكات العصبية، خاصةً عمليات المصفوفة المعقدة المعقدة المطلوبة أثناء التدريب والاستدلال. من خلال تحسين الأجهزة لهذه المهام المحددة، توفر وحدات المعالجة العصبية TPUs إنتاجية أعلى بكثير وكفاءة أعلى في استهلاك الطاقة، مما يجعلها حجر الزاوية في مجال الذكاء الاصطناعي الحديث في البيئات السحابية وبيئات الحافة.
تكمن القوة الأساسية TPU في قدرتها على إجراء عملية ضرب المصفوفات، وهي العملية الرياضية الأساسية الأساسية في التعلّم العميق (DL)، بسرعة مذهلة بسرعة مذهلة. في حين أن المعالجات القياسية تنفذ التعليمات بالتتابع أو بالتوازي المحدود، تستخدم وحدات المعالجة الحرارية TPU بنية المصفوفات الانقباضية التي تسمح للبيانات بالتدفق عبر آلاف المضاعفات في وقت واحد. يقلل هذا التصميم من زمن الوصول إلى الذاكرة ويزيد من الكثافة الحسابية إلى أقصى حد.
تم دمج وحدات المعالجة ثلاثية الأبعاد بشكل كبير في نظامGoogle Cloud، مما يوفر موارد قابلة للتطوير لتدريب ضخمة. علاوة على ذلك، تم تحسينها لأطر عمل مثل TensorFlow وبشكل متزايد مدعومة بشكل متزايد من قبل PyTorchمما يسمح للمطورين بالاستفادة من الأجهزة عالية الأداء دون تغيير بيئة الترميز المفضلة لديهم.
يعد فهم التمييز بين وحدات المعالجة المختلفة أمرًا حيويًا لتحسين التدريب على النماذج وسير عمل النشر.
تلعب وحدات المعالجة الحرارية دورًا حاسمًا في كل من التدريب الضخم القائم على السحابة والنشر الفعال على الحافة.
بالنسبة للمطورين الذين يعملون مع الرؤية الحاسوبية (CV)، فإن نشر النماذج على الأجهزة ذات الطاقة المنخفضة غالبًا ما يتطلب تحويل الأوزان القياسية إلى تنسيق متوافق مع وحدات معالجة TPU ذات الحافة. تعمل مكتبة Ultralytics تبسط عملية نشر هذه النماذج من خلال السماح للمستخدمين بتصدير النماذج مباشرةً إلى تنسيق TensorFlow Lite Edge TPU .
تتضمن هذه العملية عادةً تكميم النموذج، مما يقلل من دقة للأرقام (على سبيل المثال، من 32 بت عائم إلى 8 بت عدد صحيح) لتتناسب مع قيود الأجهزة المتخصصة مع الحفاظ على الحفاظ على الدقة.
from ultralytics import YOLO
# Load the official YOLO11 nano model
model = YOLO("yolo11n.pt")
# Export the model to Edge TPU format (int8 quantization)
# This creates a 'yolo11n_edgetpu.tflite' file for use on Coral devices
model.export(format="edgetpu")
بمجرد تصديرها، يمكن نشر هذه النماذج لمهام مثل اكتشاف الأجسام على الأنظمة المدمجة، مما يوفر سرعات استنتاج سريعة مع الحد الأدنى من استهلاك الطاقة. لمزيد من التفاصيل حول سير العمل هذا، راجع الدليل الخاص بـ تكامل Edge TPU .