Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

وحدة معالجةTensor TPU )

اكتشف كيف تعمل وحدات معالجة Tensor (TPUs) على تسريع مهام التعلُّم الآلي مثل التدريب والاستدلال واكتشاف الكائنات بكفاءة لا مثيل لها.

وحدة معالجة Tensor TPU) هي عبارة عن دائرة متكاملة مطورة خصيصًا دائرة متكاملة خاصة بالتطبيقات (ASIC) صممتها Google خصيصًا لتسريع أعباء عمل التعلُّم الآلي (ML). على عكس المعالجات ذات الأغراض العامة، صُممت وحدات معالجة المعالجات TPU من الألف إلى الياء للتعامل مع المتطلبات الحسابية الهائلة للشبكات العصبية الشبكات العصبية، خاصةً عمليات المصفوفة المعقدة المعقدة المطلوبة أثناء التدريب والاستدلال. من خلال تحسين الأجهزة لهذه المهام المحددة، توفر وحدات المعالجة العصبية TPUs إنتاجية أعلى بكثير وكفاءة أعلى في استهلاك الطاقة، مما يجعلها حجر الزاوية في مجال الذكاء الاصطناعي الحديث في البيئات السحابية وبيئات الحافة.

البنية والوظائف

تكمن القوة الأساسية TPU في قدرتها على إجراء عملية ضرب المصفوفات، وهي العملية الرياضية الأساسية الأساسية في التعلّم العميق (DL)، بسرعة مذهلة بسرعة مذهلة. في حين أن المعالجات القياسية تنفذ التعليمات بالتتابع أو بالتوازي المحدود، تستخدم وحدات المعالجة الحرارية TPU بنية المصفوفات الانقباضية التي تسمح للبيانات بالتدفق عبر آلاف المضاعفات في وقت واحد. يقلل هذا التصميم من زمن الوصول إلى الذاكرة ويزيد من الكثافة الحسابية إلى أقصى حد.

تم دمج وحدات المعالجة ثلاثية الأبعاد بشكل كبير في نظامGoogle Cloud، مما يوفر موارد قابلة للتطوير لتدريب ضخمة. علاوة على ذلك، تم تحسينها لأطر عمل مثل TensorFlow وبشكل متزايد مدعومة بشكل متزايد من قبل PyTorchمما يسمح للمطورين بالاستفادة من الأجهزة عالية الأداء دون تغيير بيئة الترميز المفضلة لديهم.

مقارنة وحدات المعالجة: CPU GPU ووحدة TPU الرسومات TPU

يعد فهم التمييز بين وحدات المعالجة المختلفة أمرًا حيويًا لتحسين التدريب على النماذج وسير عمل النشر.

  • وحدة المعالجة المركزية (CPU ): وحدة المعالجة المركزية "دماغ" الكمبيوتر، مصممة لتعدد الاستخدامات. تتفوق وحدات المعالجة المركزية في المعالجة المتسلسلة والمنطق المعقد ولكنها أبطأ بشكل عام في العمليات الحسابية المتوازية الضخمة المطلوبة في الذكاء الاصطناعي.
  • وحدة معالجة الرسومات (GPU ): صُممت وحدات معالجة الرسومات في الأصل لعرض الصور، وتتميز وحدات معالجة الرسومات بآلاف النوى التي تجعلها فعالة للغاية في المهام المتوازية. إنها معيار الصناعة لتدريب النماذج متعددة الاستخدامات مثل Ultralytics YOLO11 نظرًا لمرونتها وقوة دعم البرامج القوية مثل NVIDIA CUDA.
  • TPU: مُسرِّع متخصص يستبدل المرونة بالأداء الخام في رياضيات المصفوفات. في حين أن وحدة معالجة الرسومات GPU رائعة لمجموعة واسعة من المهام، فإن TPU GPU مصممة خصيصًا لزيادة التكرارات (عمليات الفاصلة العائمة في الثانية) خصيصًا لحسابات tensor على وجه التحديد، وغالبًا ما تقدم أداءً أفضل لكل واط للذكاء الاصطناعي واسع النطاق.

تطبيقات واقعية

تلعب وحدات المعالجة الحرارية دورًا حاسمًا في كل من التدريب الضخم القائم على السحابة والنشر الفعال على الحافة.

  1. نماذج اللغات الكبيرة (LLMs): تستخدم Google مجموعات ضخمة من وحدات المعالجة ثلاثية الأبعاد، المعروفة باسم TPU Pods، لتدريب هائلة ضخمة من النماذج اللغوية الكبيرة (LLMs) مثل PaLM وGemini. تتيح القدرة على الربط البيني لآلاف الرقائق لهذه الأنظمة معالجة بيتابايت من من بيانات التدريب في جزء صغير من الوقت الذي تتطلبه المجموعات التقليدية.
  2. حافة الذكاء الاصطناعي وإنترنت الأشياء: على نطاق أصغر، فإن TPU Edge TPU هي مسرع أجهزة مصمم من أجل للأجهزة منخفضة الطاقة. وهو يتيح الاستدلال في الوقت الحقيقي على أجهزة مثل مثل لوحة كورال ديف بورد، مما يسمح باكتشاف الأجسام بسرعة وتجزئة الصور وتجزئة الصور على الحافة دون الاعتماد على الاتصال المستمر بالإنترنت.

نشر نماذج Ultralytics على TPUورة

بالنسبة للمطورين الذين يعملون مع الرؤية الحاسوبية (CV)، فإن نشر النماذج على الأجهزة ذات الطاقة المنخفضة غالبًا ما يتطلب تحويل الأوزان القياسية إلى تنسيق متوافق مع وحدات معالجة TPU ذات الحافة. تعمل مكتبة Ultralytics تبسط عملية نشر هذه النماذج من خلال السماح للمستخدمين بتصدير النماذج مباشرةً إلى تنسيق TensorFlow Lite Edge TPU .

تتضمن هذه العملية عادةً تكميم النموذج، مما يقلل من دقة للأرقام (على سبيل المثال، من 32 بت عائم إلى 8 بت عدد صحيح) لتتناسب مع قيود الأجهزة المتخصصة مع الحفاظ على الحفاظ على الدقة.

from ultralytics import YOLO

# Load the official YOLO11 nano model
model = YOLO("yolo11n.pt")

# Export the model to Edge TPU format (int8 quantization)
# This creates a 'yolo11n_edgetpu.tflite' file for use on Coral devices
model.export(format="edgetpu")

بمجرد تصديرها، يمكن نشر هذه النماذج لمهام مثل اكتشاف الأجسام على الأنظمة المدمجة، مما يوفر سرعات استنتاج سريعة مع الحد الأدنى من استهلاك الطاقة. لمزيد من التفاصيل حول سير العمل هذا، راجع الدليل الخاص بـ تكامل Edge TPU .

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن