Neural Processing Unit (NPU)
تعرف على كيفية تسريع الذكاء الاصطناعي باستخدام وحدة المعالجة العصبية (NPU). اكتشف كيفية نشر Ultralytics YOLO26 على وحدات NPU للحوسبة والاستدلال الفعالة منخفضة الطاقة على الحافة.
وحدة المعالجة العصبية (NPU) هي دائرة أجهزة متخصصة صُممت خصيصًا لتسريع تنفيذ خوارزميات الذكاء الاصطناعي وتعلم الآلة. على عكس المعالجات للأغراض العامة، تم تصميم NPUs ببنية تتعامل أصليًا مع عمليات المصفوفات المعقدة والمتوازية التي تعتبر جوهر نماذج التعلم العميق. ومن خلال تنفيذ هذه الحسابات بكفاءة فائقة، تقلل NPU بشكل كبير من استهلاك الطاقة بينما تعمل على تحسين زمن انتقال الاستدلال بشكل ملحوظ. وهذا يجعلها مكونًا أساسيًا للهواتف المحمولة الحديثة، والحواسيب المحمولة، وأجهزة إنترنت الأشياء (IoT) المتخصصة حيث يكون نشر النماذج المعقدة بكفاءة دون استنزاف سريع للبطارية أمرًا بالغ الأهمية.
Link to this sectionNPU مقابل المعالجات الأخرى#
لفهم قيمة NPU، من المفيد تمييزها عن مسرعات الأجهزة الشائعة الأخرى في مشهد الذكاء الاصطناعي:
- وحدة المعالجة المركزية (CPU): "عقل" الحاسوب للأغراض العامة. على الرغم من قدرتها على تشغيل كود تعلم الآلة، إلا أن CPUs تعالج المهام بشكل تسلسلي، مما يجعلها بطيئة وغير فعالة لعمليات ضرب المصفوفات الثقيلة المطلوبة بواسطة نماذج الرؤية الحديثة.
- وحدة معالجة الرسومات (GPU): صُممت للمعالجة المتوازية، وتعد GPUs استثنائية في التعامل مع أحمال عمل التعلم العميق الضخمة. ومع ذلك، فهي تستهلك طاقة كبيرة وتولد حرارة كبيرة، مما يجعلها أكثر ملاءمة للتدريب السحابي مقارنة بـ حوسبة الحافة التي تعمل بالبطارية.
- وحدة معالجة التنسور (TPU): دائرة متكاملة خاصة بالتطبيقات طورتها جوجل لتعلم الآلة. على الرغم من تشابهها في المفهوم مع NPU، ترتبط TPUs عمومًا بخوادم الحوسبة السحابية الضخمة، بينما يتم دمج NPUs عادةً مباشرة في أنظمة الرقاقة (SoCs) الاستهلاكية.
Link to this sectionالتطبيقات الواقعية لـ NPUs#
أدى صعود NPU إلى فتح القدرة على تشغيل الذكاء الاصطناعي (AI) مباشرة على أجهزة المستخدمين دون الاعتماد على اتصال سحابي مستمر.
- الهواتف الذكية ورؤية الهاتف المحمول: تعتمد الأجهزة المحمولة الحديثة بشكل كبير على NPUs الداخلية، مثل Apple Neural Engine أو Qualcomm Hexagon NPU، لتشغيل التصوير الحسابي، والتعرف على الوجوه في الوقت الفعلي، والترجمة المحلية للنصوص. من خلال معالجة بيانات الصور على الجهاز نفسه، فإنها تحافظ على عمر البطارية وتضمن خصوصية البيانات.
- الحواسيب المحمولة المدعومة بالذكاء الاصطناعي: تحتوي معالجات الحواسيب الشخصية المتقدمة الآن على NPUs مدمجة لإدارة مهام الخلفية مثل طمس الخلفية وتصحيح اتجاه النظر أثناء مؤتمرات الفيديو دون تحميل وحدة المعالجة المركزية (CPU) الرئيسية، مما يسمح للمستخدمين بتنفيذ مهام متعددة بسلاسة.
- نشر ذكاء الحافة الاصطناعي: تستخدم كاميرات المراقبة الذكية والروبوتات NPUs متخصصة، مثل Google Coral Edge TPU أو أجهزة Intel المدمجة، لإجراء اكتشاف الأشياء بشكل فوري مباشرة عند المصدر. وهذا يلغي اختناقات النطاق الترددي ويتيح اتخاذ القرارات في أجزاء من الثانية.
Link to this sectionاستخدام NPUs مع Ultralytics YOLO#
بالنسبة للمطورين الذين يتطلعون إلى الاستفادة من NPUs، أصبح نشر نماذج رؤية الحاسوب بسيطًا للغاية. باستخدام نموذج Ultralytics YOLO26 القوي، يمكنك تصدير شبكتك المدربة إلى تنسيقات مُحسنة لمختلف مسرعات الأجهزة. ولتبسيط دورة الحياة هذه بالكامل، توفر منصة Ultralytics أدوات قوية لإدارة مجموعات البيانات السحابية، والتعليق التوضيحي الآلي، ونشر النماذج المُحسنة إلى أي بيئة نشر نماذج تقريبًا.
When working locally, you can use framework integrations like ONNX Runtime, PyTorch ExecuTorch, or TensorFlow Lite to target the NPU. Below is a quick Python example demonstrating how to export a YOLO model to the OpenVINO format, which seamlessly delegates computing workloads to Intel NPUs for accelerated real-time inference.
from ultralytics import YOLO
# Load the highly recommended Ultralytics YOLO26 Nano model
model = YOLO("yolo26n.pt")
# Export to OpenVINO with int8 quantization for optimal NPU performance
model.export(format="openvino", int8=True)
# Run highly efficient, accelerated inference on the edge device
results = model("path/to/environment_image.jpg")





