اكتشف تقنية تكمية المتجهات (VQ) في ضغط البيانات وتجزئتها في مجال التعلم الآلي. تعرف على كيفية تحسينها لعمليات نشر VQ-VAEs والبحث المتجه و Ultralytics .
تعد تكمية المتجهات تقنية قوية لضغط البيانات وتجزئتها، وتستخدم على نطاق واسع في مجالات التعلم الآلي (ML) و معالجة الإشارات الرقمية. في جوهرها، تعمل هذه التقنية عن طريق تقسيم مجموعة كبيرة من النقاط أو المتجهات المستمرة إلى مجموعات وتمثيل كل مجموعة بمتجه "نموذجي" واحد، لتشكل مجتمعةً بنيةً تُعرف باسم دفتر الترميز. من خلال ربط المتجهات المستمرة عالية الأبعاد بمدخلات دفتر الترميز المنفصلة هذه، يمكن للأنظمة تقليل استخدام الذاكرة بشكل كبير مع الحفاظ على الخصائص الدلالية الأساسية للبيانات من أجل تقليل الأبعاد بشكل فعال.
في مجال التعلم العميق (DL) المعاصر، اشتهر هذا المفهوم بفضل «المشفّر الذاتي التبايني المُكمّل المتجهي» (VQ-VAE). وعلى عكس المشفّرات الذاتية القياسية التي تتعلم فضاءً كامنًا متصلاً من أجل استخراج الميزات، فإن VQ-VAE تتعلم تمثيلاً متقطعًا. وهذا يسمح للنماذج التوليدية بمعالجة الصور أو الصوت أو الفيديو كسلسلة من الرموز المنفصلة، على غرار الطريقة التي تعالج بها نماذج اللغة الكبيرة (LLMs) مدخلات النص . يمكنك استكشاف الأبحاث الأساسية حول تعلم التمثيل المنفصل لترى كيف مهدت التطبيقات المبكرة الطريق لأنظمة الرؤية الحديثة القائمة على الرموز.
يلعب تكمية المتجهات دورًا حاسمًا في العديد من تطبيقات الذكاء الاصطناعي العملية التي يُعد فيها الأداء وكفاءة استخدام الذاكرة أمرين بالغي الأهمية:
إن فهم الفروق الدقيقة بين «تكمية المتجهات» والمصطلحات المماثلة أمر مفيد عند تصميم بنية فعالة للرؤية الحاسوبية (CV):
لمعرفة كيف تعمل التكمية المتجهة عمليًا على تحويل المدخلات المستمرة إلى رموز منفصلة، يمكنك استخدام PyTorch المسافات الإقليدية وتحديد النموذج الأقرب في دليل الترميز المحدد مسبقًا:
import torch
# Define a continuous input batch and a discrete codebook vocabulary
inputs = torch.randn(4, 128) # 4 input vectors of dimension 128
codebook = torch.randn(10, 128) # 10 discrete prototype vectors
# Compute distances and find the nearest codebook index for each input
distances = torch.cdist(inputs, codebook)
quantized_indices = torch.argmin(distances, dim=1)
# Retrieve the discrete quantized vectors corresponding to the inputs
quantized_vectors = codebook[quantized_indices]
للحصول على نظرة متعمقة حول حساب tensor بشكل أصلي وتحسين هذه العمليات، يرجى الرجوع إلى الوثائق الرسمية PyTorch .
يتطلب دمج التضمينات المُحسَّنة في مسار العمل الخاص بك أدوات قوية. توفر Ultralytics بيئة شاملة لتنظيم بيانات التدريب وتدريب نماذج الرؤية المتطورة. ومن خلال تبسيط إدارة البيانات وتسهيل نشر النماذج، يمكن للمطورين بسهولة إنشاء ميزات بصرية عالية الجودة مناسبة للتكمية المتجهة، مما يؤدي إلى تسريع عمليات الكشف عن الكائنات وتطبيقات استرجاع الوسائط على نطاق واسع.

ابدأ رحلتك مع مستقبل تعلم الآلة