Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

البحث المتجهي

اكتشف كيف يستخدم البحث المتجه التضمينات للعثور على بيانات مشابهة. تعلم كيفية إنشاء متجهات عالية الجودة باستخدام Ultralytics لاسترجاع المعلومات بدقة.

البحث المتجه هو طريقة متطورة لاسترجاع المعلومات تحدد العناصر المتشابهة داخل مجموعة بيانات بناءً على خصائصها الرياضية بدلاً من مطابقة الكلمات المفتاحية بالضبط. على عكس البحث التقليدي عن الكلمات الرئيسية، الذي يعتمد على العثور على سلاسل أحرف محددة ، يحلل البحث المتجه المعنى الدلالي الأساسي للبيانات. هذه التقنية أساسية لتطبيقات الذكاء الاصطناعي (AI) الحديثة لأنها تسمح لأجهزة الكمبيوتر بفهم العلاقات بين المفاهيم المجردة، ومعالجة البيانات غير المنظمة مثل الصور والملفات الصوتية والنصوص باللغة الطبيعية بدقة ملحوظة.

كيفية عمل البحث في المتجهات

يتمثل جوهر البحث المتجه في تحويل البيانات الأولية إلى متجهات رقمية عالية الأبعاد تُعرف باسم التضمينات. تعمل هذه العملية على تعيين العناصر إلى نقاط في مساحة متعددة الأبعاد حيث توجد العناصر المتشابهة من الناحية النظرية بالقرب من بعضها البعض.

  1. التحويل إلى متجهات: يعالج نموذج التعلم العميق (DL) البيانات المدخلة — على سبيل المثال، صورة كلب — ويخرج متجهًا مميزًا. غالبًا ما تُستخدم النماذج المتقدمة مثل YOLO26 لتوليد هذه التمثيلات الغنية بالميزات بكفاءة.
  2. الفهرسة: لإجراء عمليات البحث بسرعة، يتم تنظيم هذه المتجهات باستخدام خوارزميات متخصصة، غالبًا ما يتم تخزينها في قاعدة بيانات متجهة مخصصة.
  3. حساب التشابه: عندما يرسل المستخدم استعلامًا، يقوم النظام بتحويل هذا الاستعلام إلى متجه ويقيس المسافة إلى المتجهات المخزنة باستخدام مقاييس مثل تشابه جيب التمام أو المسافة الأوقليدية.
  4. الاسترجاع: يعرض النظام "أقرب النتائج" التي تمثل النتائج الأكثر صلة بالسياق.

مثال على Python : توليد التضمينات

لتنفيذ البحث المتجه، يجب أولاً تحويل البيانات إلى متجهات. يوضح مقتطف الشفرة التالي كيفية إنشاء خرائط الميزات والتضمينات من صورة باستخدام ultralytics حزمة ونموذج YOLO26 مدرب مسبقًا.

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Generate feature embeddings for an image URL
# The 'embed' method returns the high-dimensional vector representation
results = model.embed("https://ultralytics.com/images/bus.jpg")

# Print the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")

تطبيقات واقعية

البحث المتجه هو المحرك وراء العديد من الميزات البديهية في نظام البرمجيات الحالي، حيث يسد الفجوة بين الرؤية الحاسوبية (CV) ونية المستخدم.

  • أنظمة التوصيات المرئية: في قطاع الذكاء الاصطناعي في مجال البيع بالتجزئة، يعمل البحث المتجه على تشغيل ميزات "تسوق المظهر". إذا أعجب العميل بحقيبة يد معينة، يبحث النظام عن عناصر ذات متجهات مرئية مشابهة —تتطابق في الشكل والملمس والأسلوب—مما يخلق نظام توصيات مخصصًا .
  • الاسترجاع المعزز بالتوليد (RAG): لتعزيز نماذج اللغة الكبيرة (LLMs)، يستخدم المطورون البحث المتجه لاسترجاع المستندات ذات الصلة من قاعدة المعرفة. وهذا يوفر سياقًا للذكاء الاصطناعي، مما يقلل من الهلوسة ويحسن الدقة في تفاعلات روبوتات الدردشة.
  • الكشف عن الحالات الشاذة: من خلال تجميع متجهات العمليات "العادية"، يمكن للأنظمة تحديد القيم المتطرفة التي تبتعد كثيرًا عن المجموعة. وهذا أمر بالغ الأهمية للكشف عن الحالات الشاذة في مراقبة جودة التصنيع وأمن البيانات.

التمييز بين المفاهيم ذات الصلة

من المفيد التمييز بين البحث المتجه والمصطلحات المماثلة لفهم مسار التعلم الآلي (ML) بالكامل.

  • البحث المتجه مقابل البحث الدلالي: البحث الدلالي هو التطبيق الأوسع لفهم نية المستخدم (الـ"ماذا"). البحث المتجه هو الطريقة الحسابية المحددة المستخدمة لتحقيق ذلك عن طريق حساب قرب المتجه (الـ"كيف").
  • البحث المتجه مقابل قاعدة البيانات المتجهة: قاعدة البيانات المتجهة هي البنية التحتية المصممة لتخزين وإدارة التضمينات على نطاق واسع. البحث المتجه هو عملية الاستعلام عن قاعدة البيانات لاسترداد المعلومات.
  • البحث المتجه مقابل البحث عن الكلمات الرئيسية: يطابق البحث عن الكلمات الرئيسية سلاسل نصية دقيقة (على سبيل المثال، "تفاحة" تطابق "تفاحة"). يطابق البحث المتجه المعنى، لذا قد تطابق "تفاحة" "فاكهة" أو "أحمر"، حتى لو اختلفت الكلمات.

التكامل مع Ultralytics

بالنسبة للفرق التي تعمل على إنشاء أنظمة بحث عن التشابه، تعد إدارة مجموعات البيانات وتدريب نماذج التضمين خطوة أولى حاسمة. Ultralytics تبسيط سير العمل هذا من خلال توفير أدوات لإدارة البيانات والتدريب السحابي ونشر النماذج. من خلال ضمان أن تكون نماذجك الأساسية — سواء كانت للكشف عن الكائنات أو تصنيفها — عالية الأداء، فإنك تضمن أن المتجهات الناتجة توفر نتائج بحث دقيقة وذات مغزى.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن