البحث المتجهي
اكتشف كيف تُحدث خاصية البحث المتجهي (vector search) ثورة في الذكاء الاصطناعي من خلال تمكين التشابه الدلالي في استرجاع البيانات لمعالجة اللغات الطبيعية (NLP)، والبحث المرئي، وأنظمة التوصية، والمزيد!
البحث المتجهي هو طريقة للعثور على عناصر متشابهة في مجموعة بيانات كبيرة عن طريق تمثيل البيانات كمتجهات رقمية، تُعرف باسم التضمينات. بدلاً من مطابقة الكلمات الرئيسية الدقيقة، فإنه يحدد العناصر المتشابهة دلاليًا أو سياقيًا. هذا النهج أساسي لأنظمة الذكاء الاصطناعي (AI) الحديثة، مما يتيح استرجاع معلومات أكثر سهولة ودقة لأنواع البيانات المعقدة مثل الصور والنصوص والصوت. إنه يتجاوز الاستعلامات الحرفية لفهم المعنى أو النية الكامنة، مما يجعله أداة قوية لبناء محركات بحث وتوصية متطورة.
كيف يعمل البحث المتجهي؟
تتضمن عملية البحث المتجهي عدة خطوات رئيسية تحول البيانات الأولية إلى تنسيق قابل للبحث بناءً على المعنى. وهي مدعومة بنماذج التعلم العميق وخوارزميات فعالة.
- إنشاء تضمينات: أولاً، يقوم نموذج تعلم آلي، مثل محول أو شبكة عصبية التفافية (CNN)، بتحويل عناصر البيانات (مثل الجمل والصور وملفات تعريف المستخدم) إلى متجهات رقمية عالية الأبعاد تسمى التضمينات. يلتقط كل متجه الجوهر الدلالي للعنصر.
- الفهرسة: يتم تخزين هذه المتجهات المولدة وفهرستها في قاعدة بيانات متجهات متخصصة. تم تحسين هذه القواعد، مثل Pinecone أو Milvus، لإدارة واستعلام كميات هائلة من بيانات المتجهات بكفاءة.
- الاستعلام: عندما يرسل المستخدم استعلامًا (مثل عبارة نصية أو صورة)، يتم تحويله إلى متجه باستخدام نفس النموذج.
- حساب التشابه: يستخدم النظام بعد ذلك خوارزميات للعثور على المتجهات في قاعدة البيانات الأقرب إلى متجه الاستعلام. غالبًا ما يتم ذلك باستخدام مقاييس المسافة مثل تشابه جيب التمام أو مسافة إقليدس. للتعامل مع مجموعات البيانات الضخمة، تستخدم الأنظمة عادةً خوارزميات أقرب جار تقريبي (ANN) مثل ScaNN أو Faiss للبحث السريع والقابل للتطوير الذي يجد تطابقات ذات صلة كبيرة، إن لم تكن دقيقة.
تطبيقات واقعية
البحث المتجهي هو التقنية الكامنة وراء العديد من ميزات الذكاء الاصطناعي المتقدمة. فهو يمكّن الأنظمة من تجاوز المطابقة البسيطة وتقديم نتائج واعية بالسياق عبر مختلف الصناعات.
- البحث الدلالي عن الصور: بدلاً من الاعتماد على العلامات اليدوية أو أسماء الملفات، يمكن للمستخدمين البحث عن الصور باستخدام عبارات لغة طبيعية وصفية. على سبيل المثال، يمكن للمستخدم البحث عن "سيارة تسير على طريق جبلي عند غروب الشمس"، وسيقوم النظام باسترجاع صور مشابهة بصريًا، وفهم مفاهيم "سيارة" و "جبل" و "غروب الشمس" في السياق. يمكنك استكشاف كيفية عمل ذلك باستخدام دليل البحث عن التشابه الخاص بـ Ultralytics.
- أنظمة التوصية (Recommendation Systems): تستخدم منصات التجارة الإلكترونية والتدفق البحث المتجه للتوصية بالمنتجات أو المحتوى. إذا شاهدت فيلم خيال علمي، فيمكن للخدمة العثور على أفلام أخرى مماثلة في النوع والنبرة والحبكة واقتراحها من خلال مقارنة تضميناتها المتجهة. هذه وظيفة أساسية في الذكاء الاصطناعي في البيع بالتجزئة لتحسين تجربة المستخدم والمشاركة.
البحث المتجهي مقابل المفاهيم ذات الصلة
من المفيد تمييز البحث المتجهي عن المصطلحات الأخرى ذات الصلة لفهم دوره المحدد في النظام البيئي للذكاء الاصطناعي.
- البحث عن الكلمات الرئيسية: يعتمد البحث التقليدي عن الكلمات الرئيسية على مطابقة الكلمات أو العبارات الدقيقة. إنه يعاني من المرادفات والسياق والفروق اللغوية الدقيقة. في المقابل، يفهم البحث المتجهي العلاقات الدلالية، مما يسمح له بالعثور على نتائج ذات صلة حتى لو لم تتطابق الكلمات الرئيسية تمامًا.
- البحث الدلالي: البحث الدلالي هو المفهوم الواسع لفهم نية الاستعلام والمعنى السياقي. البحث المتجه هو طريقة أساسية تستخدم لتنفيذ البحث الدلالي. في حين أن البحث الدلالي هو "ماذا" (فهم المعنى)، فإن البحث المتجه هو "كيف" (آلية الاسترجاع القائمة على قرب المتجهات).
- التضمينات: التضمينات هي تمثيلات متجهية للبيانات. البحث المتجهي هو عملية الاستعلام عن مجموعة من التضمينات للعثور على التضمينات الأكثر تشابهًا. التضمينات هي البيانات، في حين أن البحث المتجهي هو الإجراء الذي يتم تنفيذه على تلك البيانات.
- قاعدة بيانات المتجهات: قاعدة بيانات المتجهات هي البنية التحتية المتخصصة لتخزين وفهرسة والاستعلام بكفاءة عن التضمينات. تساعد منصات مثل Ultralytics HUB في إدارة مجموعات البيانات والنماذج التي تنتج هذه التضمينات لاستخدامها في أنظمة البحث المتجهة.
من خلال الاستفادة من قوة التضمينات وخوارزميات البحث المتطورة، يسد البحث المتجه الفجوة بين النية البشرية والبيانات الرقمية، مما يجعله مكونًا أساسيًا للعديد من التطبيقات الذكية، من معالجة اللغة الطبيعية (NLP) إلى مهام رؤية الكمبيوتر المتقدمة.