Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

وحدة معالجةTensor TPU )

اكتشف كيف تعمل وحدات Tensor (TPU) على تسريع التعلم الآلي. تعلم كيفية تحسين Ultralytics لوحدات TPU Edge والتدريب السحابي للحصول على أقصى سرعة.

وحدة Tensor (TPU) هي دائرة متكاملة مخصصة للتطبيقات (ASIC) صممتها Google خصيصًا لتسريع أعباء عمل التعلم الآلي (ML). على عكس المعالجات العامة التي تتعامل مع مجموعة واسعة من مهام الحوسبة، تم تصميم وحدات TPU من الألف إلى الياء لتحسين عمليات المصفوفات الضخمة الأساسية للشبكات العصبية. هذا التركيز المحدد يسمح لها بتحقيق إنتاجية وكفاءة طاقة عالية بشكل استثنائي، مما يجعلها حجر الزاوية في البنية التحتية الحديثة للذكاء الاصطناعي (AI) ، خاصةً داخل نظامGoogle البيئي. وهي تلعب دورًا حيويًا في تقليل الوقت اللازم لتدريب النماذج المعقدة وتشغيل الاستدلال في الوقت الفعلي على نطاق واسع.

البنية والوظائف

TPU بنية وحدة TPU بشكل كبير عن المعالجات التقليدية. في حين أن وحدة المعالجة المركزيةCPU ) القياسية تتفوق في المهام المتسلسلة والمنطق المعقد ، وتستخدم وحدة معالجة الرسوماتGPU ) نوى متوازية للرسومات والحوسبة العامة، TPU بنية مصفوفة انقباضية. يتيح هذا التصميم تدفق البيانات عبر آلاف المضاعفات في وقت واحد دون الوصول إلى الذاكرة لكل عملية. من خلال تعظيم الكثافة الحسابية وتقليل زمن الاستجابة، تعد وحدات TPU مناسبة بشكل فريد للعمليات الحسابية الخطية الثقيلة الموجودة في تطبيقات التعلم العميق (DL).

تم تحسين هذه الأجهزة المتخصصة بشكل كبير لتلائم أطر عمل مثل TensorFlow ويحظى بدعم متزايد من PyTorch، مما يسمح للمطورين بتدريب نماذج أساسية ضخمة أو نشر حلول حافة فعالة دون إعادة كتابة قواعد البرمجة الخاصة بهم بالكامل.

وحدات المعالجة المميزة

فهم بيئة الأجهزة أمر بالغ الأهمية لتحسين عمليات التعلم الآلي (MLOps).

  • CPU: "دماغ" الكمبيوتر متعدد الأغراض، مثالي للمعالجة التسلسلية، والمعالجة المسبقة للبيانات، ومعالجة المنطق المعقد. غالبًا ما يستخدم في خطوط أنابيب زيادة البيانات، ولكنه أبطأ في حسابات المصفوفات الثقيلة.
  • GPU: تم تصميم وحدات معالجة الرسومات (GPU) في الأصل لعرض الصور، وهي تعتبر المعيار الصناعي لتدريب النماذج نظرًا لتعدد استخداماتها وقدرتها على التوازي الهائل. وهي ممتازة لتدريب النماذج المرنة مثل Ultralytics .
  • TPU: مسرع مصمم خصيصًا يضحي بالمرونة مقابل السرعة الخام في tensor . وهو مصمم لتعظيم FLOPS (عمليات النقطة العائمة في الثانية) خصيصًا لحسابات الشبكات العصبية، وغالبًا ما يوفر أداءً فائقًا لكل واط لأحمال عمل محددة واسعة النطاق.

تطبيقات واقعية

يتم نشر وحدات TPU في بيئات مختلفة، من مجموعات السحابة الضخمة إلى الأجهزة الطرفية الصغيرة.

  1. تدريب نماذج اللغة الكبيرة: Google مجموعات مترابطة ضخمة، تُعرف باسم TPU لتدريب نماذج لغة كبيرة ضخمة مثل PaLM و Gemini. يمكن لهذه الأنظمة معالجة بيتابايت من بيانات التدريب في جزء صغير من الوقت الذي تستغرقه الأجهزة التقليدية، مما يسرع من التقدم في الذكاء الاصطناعي التوليدي.
  2. الذكاء الاصطناعي الحوافي وإنترنت الأشياء: توفر TPU من Coral Edge هذه التسريع للأجهزة منخفضة الطاقة. وهي تتيح تطبيقات رؤية حاسوبية (CV) فعالة، مثل تشغيل خاصية الكشف عن الأجسام على خط الإنتاج لتحديد العيوب محليًا. وهذا يسمح باتخاذ قرارات فورية دون الاعتماد على الاتصال بالسحابة، مما يحافظ على النطاق الترددي والخصوصية.

استخدام وحدات معالجة الترانزستور (TPU) مع Ultralytics

يمكن للمطورين الاستفادة من TPU Ultralytics خاصة عند استخدام Ultralytics للتدريب السحابي أو تصدير النماذج للنشر على الحافة . على سبيل المثال، تتطلب Edge TPU أن تكون النماذج محددة ومجمعة خصيصًا لهيكلها .

يوضح المثال التالي كيفية تصدير نموذج YOLO26 إلى TFLite وهي خطوة أساسية قبل التجميع لـ Edge TPU:

from ultralytics import YOLO

# Load the latest lightweight YOLO26 nano model
model = YOLO("yolo26n.pt")

# Export the model to TFLite format
# This creates a '.tflite' file suitable for mobile and edge deployment
# Set int8=True for quantization, which is often required for Edge TPU performance
model.export(format="tflite", int8=True)

بمجرد تصدير النموذج، يمكن تجميعه بشكل أكبر لـ Edge TPU TPU Edge TPU TPU يسمح له بالعمل بكفاءة على أجهزة مثل Raspberry Pi مع مسرع USB Coral. لمزيد من التفاصيل حول النشر، قد يكون استكشاف وثائق TFLite مفيدًا للغاية .

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن