Vector Quantization
استكشف تكميم المتجهات لضغط البيانات وتمييزها في تعلم الآلة. تعرّف على كيفية تحسين VQ-VAEs، والبحث عن المتجهات، وعمليات نشر Ultralytics YOLO26.
تكميم المتجهات هو أسلوب قوي لضغط البيانات وتقسيمها إلى فئات، يُستخدم على نطاق واسع في تعلم الآلة (ML) الحديث ومعالجة الإشارات الرقمية. في جوهره، يعمل عن طريق تقسيم مجموعة كبيرة من النقاط المستمرة أو المتجهات إلى مجموعات وتمثيل كل مجموعة بمتجه "نموذجي" واحد، لتشكل مجتمعة هيكلاً يُعرف بـ "كتاب الرموز" (codebook). من خلال ربط المتجهات المستمرة عالية الأبعاد بمدخلات كتاب الرموز المنفصلة هذه، يمكن للأنظمة تقليل استخدام الذاكرة بشكل كبير مع الحفاظ على الخصائص الدلالية الأساسية للبيانات من أجل تقليل الأبعاد بشكل فعال.
Link to this sectionدور التكميم في التعلم العميق#
في التعلم العميق (DL) المعاصر، اشتهر هذا المفهوم بفضل مُشفر تلقائي متغير ومكمم المتجهات (VQ-VAE). على عكس المُشفرات التلقائية القياسية التي تتعلم مساحة كامنة مستمرة لإجراء استخراج الميزات، تتعلم نماذج VQ-VAE تمثيلاً منفصلاً. وهذا يسمح للنماذج التوليدية بمعاملة الصور أو الصوت أو الفيديو كسلسلة من الرموز المنفصلة، على غرار كيفية معالجة نماذج اللغات الكبيرة (LLMs) لمدخلات النص. يمكنك استكشاف الأبحاث الأساسية حول تعلم التمثيل المنفصل لمعرفة كيف مهدت التنفيذات المبكرة الطريق لأنظمة الرؤية الحديثة القائمة على الرموز.
Link to this sectionتطبيقات العالم الحقيقي#
يلعب تكميم المتجهات دوراً حاسماً في العديد من تطبيقات الذكاء الاصطناعي في العالم الحقيقي حيث تعتبر الكفاءة في الأداء والذاكرة أمراً بالغ الأهمية:
- الذكاء الاصطناعي التوليدي وضغط الوسائط: من خلال ضغط البيانات المرئية المعقدة إلى رموز كامنة منفصلة، يتيح تكميم المتجهات توليد صور وفيديوهات بكفاءة عالية. النماذج التي تربط البكسلات المستمرة برموز منفصلة تقلل بشكل كبير من العبء الحسابي، مما يساعد البنى المتقدمة مثل نماذج الانتشار الكامن.
- استرجاع المتجهات عالي السرعة: لإجراء بحث التشابه السريع، يجب على الأنظمة الحديثة الاستعلام عن ملايين التضمينات. يقوم تكميم المتجهات بضغط مجموعات البيانات الضخمة هذه، مما يسمح لمحركات الاسترجاع بتنفيذ عمليات بحث تقريبية سريعة عن أقرب الجيران (ANN)، وهو أمر مفيد للغاية لـ الذكاء الاصطناعي في قطاع التجزئة وأنظمة توصية المنتجات. اطلع على دليل OpenAI حول التضمينات لمزيد من السياق حول التعامل مع البيانات عالية الأبعاد.
Link to this sectionالتمييز بين المفاهيم ذات الصلة#
يساعد فهم الفروق الدقيقة بين تكميم المتجهات والمصطلحات المماثلة عند تصميم بنية فعالة لـ رؤية الحاسوب (CV):
- تكميم المتجهات مقابل تكميم النموذج: يشير تكميم النموذج عموماً إلى تقليل الدقة العددية لأوزان الشبكة العصبية (على سبيل المثال، من 32-بت فاصلة عائمة إلى 8-بت عدد صحيح) لتسريع الاستدلال لنشر نماذج مثل Ultralytics YOLO26 على الأجهزة. أما تكميم المتجهات، فيقوم بتجميع متجهات البيانات في مفردات ثابتة من النماذج المنفصلة.
- تكميم المتجهات مقابل قاعدة بيانات المتجهات: قاعدة بيانات المتجهات هي البنية التحتية الفعلية التي تخزن البيانات عالية الأبعاد. وتكميم المتجهات هو تقنية خوارزمية أساسية غالباً ما تستخدمها قواعد البيانات هذه لتقليل بصمة الذاكرة الخاصة بها، كما هو موضح في شرح Qdrant لمعالجة المتجهات.
- تكميم المتجهات مقابل البحث عن المتجهات: البحث عن المتجهات هو العملية النشطة لإيجاد عناصر متشابهة بناءً على تقارب المتجهات. يعمل التكميم كطبقة تحسين هيكلية لجعل هذا البحث ممكناً حسابياً على نطاق واسع.
Link to this sectionمثال تنفيذي أساسي#
لمعرفة كيف يربط تكميم المتجهات المدخلات المستمرة برموز منفصلة في الممارسة العملية، يمكنك استخدام PyTorch لحساب المسافات الإقليدية والعثور على أقرب نموذج في كتاب رموز محدد مسبقاً:
import torch
# Define a continuous input batch and a discrete codebook vocabulary
inputs = torch.randn(4, 128) # 4 input vectors of dimension 128
codebook = torch.randn(10, 128) # 10 discrete prototype vectors
# Compute distances and find the nearest codebook index for each input
distances = torch.cdist(inputs, codebook)
quantized_indices = torch.argmin(distances, dim=1)
# Retrieve the discrete quantized vectors corresponding to the inputs
quantized_vectors = codebook[quantized_indices]للحصول على نظرة متعمقة حول حساب مسافات التنسور (tensor) محلياً وتحسين هذه العمليات، راجع توثيق PyTorch cdist الرسمي.
Link to this sectionتعزيز سير العمل باستخدام منصة Ultralytics#
يتطلب دمج التضمينات المحسنة في خط المعالجة الخاص بك أدوات قوية. توفر منصة Ultralytics بيئة متكاملة لتنظيم بيانات التدريب وتدريب نماذج الرؤية المتطورة. من خلال تبسيط إدارة البيانات وتسهيل نشر النماذج، يمكن للمطورين إنشاء ميزات مرئية عالية الجودة بسهولة ومناسبة لتكميم المتجهات، مما يؤدي إلى تسريع اكتشاف الكائنات وتطبيقات استرجاع الوسائط واسعة النطاق.






