Vector Search
استكشف كيف يستخدم البحث عن المتجهات التضمينات للعثور على بيانات متشابهة. تعرّف على كيفية إنشاء متجهات عالية الجودة باستخدام Ultralytics YOLO26 لاسترجاع المعلومات بدقة.
البحث المتجهي (Vector search) هو أسلوب متطور لاسترجاع المعلومات يحدد العناصر المتشابهة داخل مجموعة بيانات بناءً على خصائصها الرياضية بدلاً من مطابقة الكلمات الرئيسية الدقيقة. على عكس البحث بالكلمات الرئيسية التقليدي، الذي يعتمد على العثور على سلاسل نصية محددة، يحلل البحث المتجهي المعنى الدلالي الأساسي للبيانات. تعد هذه التقنية أساسية لتطبيقات الذكاء الاصطناعي (AI) الحديثة لأنها تتيح لأجهزة الكمبيوتر فهم العلاقات بين المفاهيم المجردة، ومعالجة البيانات غير المهيكلة مثل الصور، وملفات الصوت، والنصوص باللغة الطبيعية بدقة ملحوظة.
Link to this sectionكيف يعمل البحث المتجهي#
يتضمن جوهر البحث المتجهي تحويل البيانات الأولية إلى متجهات رقمية عالية الأبعاد تُعرف باسم التضمينات (embeddings). تقوم هذه العملية بتعيين العناصر إلى نقاط في فضاء متعدد الأبعاد حيث تقع العناصر المتشابهة مفاهيميًا بالقرب من بعضها البعض.
-
تحويل المتجهات (Vectorization): يقوم نموذج التعلم العميق (DL) بمعالجة بيانات الإدخال—على سبيل المثال، صورة لكلب—ويُخرج متجه ميزات. غالبًا ما تُستخدم نماذج متقدمة مثل YOLO26 لإنشاء تمثيلات الميزات الغنية هذه بكفاءة.
-
الفهرسة (Indexing): لإجراء عمليات البحث بسرعة، يتم تنظيم هذه المتجهات باستخدام خوارزميات متخصصة، وغالبًا ما يتم تخزينها في قاعدة بيانات متجهية مخصصة.
-
حساب التشابه (Similarity Calculation): عندما يُرسل المستخدم استعلامًا، يقوم النظام بتحويل هذا الاستعلام إلى متجه ويقيس المسافة إلى المتجهات المخزنة باستخدام مقاييس مثل تشابه جيب التمام (cosine similarity) أو المسافة الإقليدية (Euclidean distance).
-
الاسترجاع (Retrieval): يُرجع النظام "أقرب الجيران"، والتي تمثل النتائج الأكثر صلة من الناحية السياقية.
Link to this sectionمثال بلغة Python: إنشاء التضمينات#
لتنفيذ البحث المتجهي، يجب عليك أولاً تحويل بياناتك إلى متجهات. يوضح مقتطف الكود التالي كيفية إنشاء خرائط ميزات وتضمينات من صورة باستخدام حزمة ultralytics ونموذج YOLO26 مُدرب مسبقًا.
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Generate feature embeddings for an image URL
# The 'embed' method returns the high-dimensional vector representation
results = model.embed("https://ultralytics.com/images/bus.jpg")
# Print the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")Link to this sectionتطبيقات العالم الحقيقي#
يُعد البحث المتجهي المحرك وراء العديد من الميزات البديهية في النظام البيئي للبرمجيات اليوم، مما يسد الفجوة بين رؤية الحاسوب (CV) وقصد المستخدم.
- أنظمة التوصية البصرية: في قطاع الذكاء الاصطناعي في التجزئة، يدعم البحث المتجهي ميزات "تسوق المظهر". إذا أعجبت العميل حقيبة يد معينة، يعثر النظام على عناصر ذات متجهات بصرية متشابهة—مطابقة للشكل، والملمس، والنمط—مما ينشئ نظام توصية مخصصًا.
- التوليد المعزز بالاسترجاع (RAG): لتعزيز نماذج اللغة الكبيرة (LLMs)، يستخدم المطورون البحث المتجهي لاسترجاع المستندات ذات الصلة من قاعدة معرفية. يوفر هذا سياقًا للذكاء الاصطناعي، مما يقلل من الهلوسة ويحسن الدقة في تفاعلات روبوتات الدردشة.
- كشف الشذوذ: من خلال تجميع متجهات العمليات "الطبيعية"، يمكن للأنظمة تحديد القيم المتطرفة التي تبتعد كثيرًا عن التجمع. يعد هذا أمرًا بالغ الأهمية لـ كشف الشذوذ في مراقبة جودة التصنيع وأمن البيانات.
Link to this sectionالتمييز بين المفاهيم ذات الصلة#
من المفيد التمييز بين البحث المتجهي والمصطلحات المشابهة لفهم خط أنابيب التعلم الآلي (ML) بالكامل.
- البحث المتجهي مقابل البحث الدلالي: البحث الدلالي هو التطبيق الأوسع لفهم قصد المستخدم ("ماذا"). البحث المتجهي هو الطريقة الخوارزمية المحددة المستخدمة لتحقيق ذلك من خلال حساب تقارب المتجهات ("كيف").
- البحث المتجهي مقابل قاعدة البيانات المتجهية: قاعدة البيانات المتجهية هي البنية التحتية المصممة لتخزين وإدارة التضمينات على نطاق واسع. البحث المتجهي هو عملية الاستعلام عن تلك القاعدة لاسترجاع المعلومات.
- البحث المتجهي مقابل البحث بالكلمات الرئيسية: يطابق البحث بالكلمات الرئيسية سلاسل نصية دقيقة (على سبيل المثال، "تفاحة" تطابق "تفاحة"). يطابق البحث المتجهي المعنى، لذا قد تطابق "تفاحة" كلمة "فاكهة" أو "حمراء"، حتى لو اختلفت الكلمات.
Link to this sectionالتكامل مع منصة Ultralytics#
بالنسبة للفرق التي تبني أنظمة بحث التشابه، تعد إدارة مجموعات البيانات وتدريب نماذج التضمين خطوة أولى حاسمة. تعمل منصة Ultralytics على تبسيط سير العمل هذا من خلال توفير أدوات لإدارة البيانات، والتدريب السحابي، ونشر النماذج. من خلال ضمان أن نماذجك الأساسية—سواء كانت لـ كشف الأجسام أو التصنيف—عالية الأداء، فإنك تضمن أن المتجهات الناتجة توفر نتائج بحث دقيقة وذات مغزى.






