Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

تكمية المتجهات

اكتشف تقنية تكمية المتجهات (VQ) في ضغط البيانات وتجزئتها في مجال التعلم الآلي. تعرف على كيفية تحسينها لعمليات نشر VQ-VAEs والبحث المتجه و Ultralytics .

تعد تكمية المتجهات تقنية قوية لضغط البيانات وتجزئتها، وتستخدم على نطاق واسع في مجالات التعلم الآلي (ML) و معالجة الإشارات الرقمية. في جوهرها، تعمل هذه التقنية عن طريق تقسيم مجموعة كبيرة من النقاط أو المتجهات المستمرة إلى مجموعات وتمثيل كل مجموعة بمتجه "نموذجي" واحد، لتشكل مجتمعةً بنيةً تُعرف باسم دفتر الترميز. من خلال ربط المتجهات المستمرة عالية الأبعاد بمدخلات دفتر الترميز المنفصلة هذه، يمكن للأنظمة تقليل استخدام الذاكرة بشكل كبير مع الحفاظ على الخصائص الدلالية الأساسية للبيانات من أجل تقليل الأبعاد بشكل فعال.

دور التقطيع في التعلم العميق

في مجال التعلم العميق (DL) المعاصر، اشتهر هذا المفهوم بفضل «المشفّر الذاتي التبايني المُكمّل المتجهي» (VQ-VAE). وعلى عكس المشفّرات الذاتية القياسية التي تتعلم فضاءً كامنًا متصلاً من أجل استخراج الميزات، فإن VQ-VAE تتعلم تمثيلاً متقطعًا. وهذا يسمح للنماذج التوليدية بمعالجة الصور أو الصوت أو الفيديو كسلسلة من الرموز المنفصلة، على غرار الطريقة التي تعالج بها نماذج اللغة الكبيرة (LLMs) مدخلات النص . يمكنك استكشاف الأبحاث الأساسية حول تعلم التمثيل المنفصل لترى كيف مهدت التطبيقات المبكرة الطريق لأنظمة الرؤية الحديثة القائمة على الرموز.

تطبيقات واقعية

يلعب تكمية المتجهات دورًا حاسمًا في العديد من تطبيقات الذكاء الاصطناعي العملية التي يُعد فيها الأداء وكفاءة استخدام الذاكرة أمرين بالغي الأهمية:

التمييز بين المفاهيم ذات الصلة

إن فهم الفروق الدقيقة بين «تكمية المتجهات» والمصطلحات المماثلة أمر مفيد عند تصميم بنية فعالة للرؤية الحاسوبية (CV):

  • تكمية المتجهات مقابل تكمية النماذج: يشير تكمية النموذج عمومًا إلى تقليل الدقة العددية لأوزان الشبكة العصبية (على سبيل المثال، من 32 بت عائمة إلى 8 بت صحيحة) لتسريع الاستدلال في عمليات نشر النماذج على الأجهزة مثل Ultralytics . أما تكمية المتجهات، فتقوم بتجميع متجهات البيانات في مفردات ثابتة من النماذج الأولية المنفصلة.
  • التكمية المتجهة مقابل قاعدة البيانات المتجهة: قاعدة البيانات المتجهة هي البنية التحتية الفعلية التي تخزن البيانات عالية الأبعاد. التكمية المتجهة هي تقنية خوارزمية أساسية غالبًا ما تستخدمها قواعد البيانات هذه لتقليل حجم الذاكرة التي تشغلها، كما هو موضح بالتفصيل في شرح Qdrant لمعالجة المتجهات.
  • تكمية المتجهات مقابل البحث المتجهي: البحث المتجه هو عملية نشطة للعثور على عناصر متشابهة بناءً على قرب المتجهات. يعمل التكمية كطبقة تحسين هيكلي لجعل هذا البحث قابلاً للتنفيذ حسابياً على نطاق واسع.

مثال أساسي على التنفيذ

لمعرفة كيف تعمل التكمية المتجهة عمليًا على تحويل المدخلات المستمرة إلى رموز منفصلة، يمكنك استخدام PyTorch المسافات الإقليدية وتحديد النموذج الأقرب في دليل الترميز المحدد مسبقًا:

import torch

# Define a continuous input batch and a discrete codebook vocabulary
inputs = torch.randn(4, 128)  # 4 input vectors of dimension 128
codebook = torch.randn(10, 128)  # 10 discrete prototype vectors

# Compute distances and find the nearest codebook index for each input
distances = torch.cdist(inputs, codebook)
quantized_indices = torch.argmin(distances, dim=1)

# Retrieve the discrete quantized vectors corresponding to the inputs
quantized_vectors = codebook[quantized_indices]

للحصول على نظرة متعمقة حول حساب tensor بشكل أصلي وتحسين هذه العمليات، يرجى الرجوع إلى الوثائق الرسمية PyTorch .

تحسين سير العمل باستخدام Ultralytics

يتطلب دمج التضمينات المُحسَّنة في مسار العمل الخاص بك أدوات قوية. توفر Ultralytics بيئة شاملة لتنظيم بيانات التدريب وتدريب نماذج الرؤية المتطورة. ومن خلال تبسيط إدارة البيانات وتسهيل نشر النماذج، يمكن للمطورين بسهولة إنشاء ميزات بصرية عالية الجودة مناسبة للتكمية المتجهة، مما يؤدي إلى تسريع عمليات الكشف عن الكائنات وتطبيقات استرجاع الوسائط على نطاق واسع.

لنبني مستقبل الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة