اكتشف كيف تعمل وحدات Tensor (TPU) على تسريع التعلم الآلي. تعلم كيفية تحسين Ultralytics لوحدات TPU Edge والتدريب السحابي للحصول على أقصى سرعة.
وحدة Tensor (TPU) هي دائرة متكاملة مخصصة للتطبيقات (ASIC) صممتها Google خصيصًا لتسريع أعباء عمل التعلم الآلي (ML). على عكس المعالجات العامة التي تتعامل مع مجموعة واسعة من مهام الحوسبة، تم تصميم وحدات TPU من الألف إلى الياء لتحسين عمليات المصفوفات الضخمة الأساسية للشبكات العصبية. هذا التركيز المحدد يسمح لها بتحقيق إنتاجية وكفاءة طاقة عالية بشكل استثنائي، مما يجعلها حجر الزاوية في البنية التحتية الحديثة للذكاء الاصطناعي (AI) ، خاصةً داخل نظامGoogle البيئي. وهي تلعب دورًا حيويًا في تقليل الوقت اللازم لتدريب النماذج المعقدة وتشغيل الاستدلال في الوقت الفعلي على نطاق واسع.
TPU بنية وحدة TPU بشكل كبير عن المعالجات التقليدية. في حين أن وحدة المعالجة المركزيةCPU ) القياسية تتفوق في المهام المتسلسلة والمنطق المعقد ، وتستخدم وحدة معالجة الرسوماتGPU ) نوى متوازية للرسومات والحوسبة العامة، TPU بنية مصفوفة انقباضية. يتيح هذا التصميم تدفق البيانات عبر آلاف المضاعفات في وقت واحد دون الوصول إلى الذاكرة لكل عملية. من خلال تعظيم الكثافة الحسابية وتقليل زمن الاستجابة، تعد وحدات TPU مناسبة بشكل فريد للعمليات الحسابية الخطية الثقيلة الموجودة في تطبيقات التعلم العميق (DL).
تم تحسين هذه الأجهزة المتخصصة بشكل كبير لتلائم أطر عمل مثل TensorFlow ويحظى بدعم متزايد من PyTorch، مما يسمح للمطورين بتدريب نماذج أساسية ضخمة أو نشر حلول حافة فعالة دون إعادة كتابة قواعد البرمجة الخاصة بهم بالكامل.
فهم بيئة الأجهزة أمر بالغ الأهمية لتحسين عمليات التعلم الآلي (MLOps).
يتم نشر وحدات TPU في بيئات مختلفة، من مجموعات السحابة الضخمة إلى الأجهزة الطرفية الصغيرة.
يمكن للمطورين الاستفادة من TPU Ultralytics خاصة عند استخدام Ultralytics للتدريب السحابي أو تصدير النماذج للنشر على الحافة . على سبيل المثال، تتطلب Edge TPU أن تكون النماذج محددة ومجمعة خصيصًا لهيكلها .
يوضح المثال التالي كيفية تصدير نموذج YOLO26 إلى TFLite وهي خطوة أساسية قبل التجميع لـ Edge TPU:
from ultralytics import YOLO
# Load the latest lightweight YOLO26 nano model
model = YOLO("yolo26n.pt")
# Export the model to TFLite format
# This creates a '.tflite' file suitable for mobile and edge deployment
# Set int8=True for quantization, which is often required for Edge TPU performance
model.export(format="tflite", int8=True)
بمجرد تصدير النموذج، يمكن تجميعه بشكل أكبر لـ Edge TPU TPU Edge TPU TPU يسمح له بالعمل بكفاءة على أجهزة مثل Raspberry Pi مع مسرع USB Coral. لمزيد من التفاصيل حول النشر، قد يكون استكشاف وثائق TFLite مفيدًا للغاية .