البحث عن المتجهات
اكتشف كيف يُحدِث البحث المتجه ثورة في الذكاء الاصطناعي من خلال تمكين التشابه الدلالي في استرجاع البيانات في مجال البرمجة اللغوية العصبية والبحث المرئي وأنظمة التوصيات وغيرها!
البحث في المتجهات هو طريقة للعثور على عناصر متشابهة في مجموعة بيانات كبيرة من خلال تمثيل البيانات كمتجهات رقمية، والمعروفة باسم التضمينات. فبدلاً من مطابقة الكلمات المفتاحية الدقيقة، فإنه يحدد العناصر المتشابهة دلاليًا أو سياقيًا. هذا النهج أساسي لأنظمة الذكاء الاصطناعي الحديثة، مما يتيح استرجاع معلومات أكثر سهولة ودقة لأنواع البيانات المعقدة مثل الصور والنصوص والصوت. وهو يتجاوز الاستعلامات الحرفية لفهم المعنى أو القصد الأساسي، مما يجعله أداة قوية لبناء محركات بحث وتوصيات متطورة.
كيف يعمل البحث في المتجهات؟
تنطوي عملية البحث المتجه على عدة خطوات رئيسية تحوّل البيانات الأولية إلى تنسيق قابل للبحث بناءً على المعنى. وهي مدعومة بنماذج التعلم العميق والخوارزميات الفعالة.
- توليد التضمينات: أولاً، يقوم نموذج التعلم الآلي، مثل المحول أو الشبكة العصبية التلافيفية (CNN)، بتحويل عناصر البيانات (مثل الجمل والصور وملفات تعريف المستخدمين) إلى متجهات رقمية عالية الأبعاد تسمى التضمينات. يلتقط كل متجه الجوهر الدلالي للعنصر.
- الفهرسة: يتم تخزين هذه المتجهات التي تم إنشاؤها وفهرستها في قاعدة بيانات متجهات متخصصة. يتم تحسين قواعد البيانات هذه، مثل Pinecone أو Milvus، لإدارة كميات هائلة من بيانات المتجهات والاستعلام عنها بكفاءة.
- الاستعلام: عندما يقوم المستخدم بإرسال استعلام (مثل عبارة نصية أو صورة)، يتم تحويله إلى متجه باستخدام نفس النموذج.
- حساب التشابه: يستخدم النظام بعد ذلك خوارزميات للعثور على المتجهات في قاعدة البيانات "الأقرب" إلى متجه الاستعلام. وغالبًا ما يتم ذلك باستخدام مقاييس المسافة مثل تشابه جيب التمام أو المسافة الإقليدية. وللتعامل مع مجموعات البيانات الضخمة، تستخدم الأنظمة عادةً خوارزميات أقرب جار تقريبي (ANN) مثل ScaNN أو Faiss للبحث السريع والقابل للتطوير الذي يعثر على تطابقات ذات صلة كبيرة، إن لم تكن مطابقة تمامًا.
التطبيقات الواقعية
البحث المتجه هو التقنية الكامنة وراء العديد من ميزات الذكاء الاصطناعي المتقدمة. فهي تُمكِّن الأنظمة من تجاوز المطابقة البسيطة وتقديم نتائج مدركة للسياق في مختلف المجالات.
- البحث الدلالي عن الصور: بدلًا من الاعتماد على العلامات اليدوية أو أسماء الملفات، يمكن للمستخدمين البحث عن الصور باستخدام عبارات وصفية بلغة طبيعية. على سبيل المثال، يمكن للمستخدم البحث عن "سيارة تسير على طريق جبلي عند غروب الشمس"، وسيقوم النظام باسترداد الصور المتشابهة بصريًا، مع فهم مفاهيم "سيارة" و"جبل" و"غروب الشمس" في السياق. يمكنك استكشاف كيفية عمل ذلك من خلال دليل البحث عن التشابه في Ultralytics.
- أنظمة التوصية: تستخدم منصات التجارة الإلكترونية والبث المباشر البحث المتجه للتوصية بالمنتجات أو المحتوى. إذا كنت تشاهد فيلم خيال علمي، يمكن للخدمة العثور على أفلام أخرى متشابهة في النوع والنغمة والحبكة واقتراحها من خلال مقارنة متجهات التضمين الخاصة بها. هذه وظيفة أساسية في الذكاء الاصطناعي في البيع بالتجزئة لتعزيز تجربة المستخدم ومشاركته.
البحث في المتجهات مقابل المفاهيم ذات الصلة
من المفيد التمييز بين البحث المتجه والمصطلحات الأخرى ذات الصلة لفهم دوره المحدد في منظومة الذكاء الاصطناعي.
- البحث بالكلمات المفتاحية: يعتمد البحث التقليدي عن الكلمات المفتاحية التقليدية على مطابقة الكلمات أو العبارات الدقيقة. فهو يعاني من المترادفات والسياق والفوارق اللغوية الدقيقة. في المقابل، يفهم البحث المتجه العلاقات الدلالية، مما يسمح له بالعثور على نتائج ذات صلة حتى لو لم تتطابق الكلمات المفتاحية تماماً.
- البحث الدلالي: البحث الدلالي هو المفهوم الواسع لفهم مقصد الاستعلام ومعناه السياقي. البحث المتجه هو الطريقة الأساسية المستخدمة لتنفيذ البحث الدلالي. في حين أن البحث الدلالي هو "ماذا" (فهم المعنى)، فإن البحث المتجه هو "كيف" (آلية الاسترجاع القائمة على القرب المتجه).
- التضمينات: التضمينات هي التمثيلات المتجهة للبيانات. البحث المتجه هو عملية الاستعلام عن مجموعة من التضمينات للعثور على أكثرها تشابهًا. التضمينات هي البيانات، بينما البحث المتجه هو الإجراء الذي يتم إجراؤه على تلك البيانات.
- قاعدة بيانات المتجهات: قاعدة بيانات المتجهات هي البنية التحتية المتخصصة لتخزين وفهرسة واستعلام التضمينات بكفاءة. وتساعد منصات مثل Ultralytics HUB في إدارة مجموعات البيانات والنماذج التي تنتج هذه التضمينات لاستخدامها في أنظمة البحث المتجهية.
من خلال الاستفادة من قوة التضمينات وخوارزميات البحث المتطورة، يعمل البحث المتجه على سد الفجوة بين النية البشرية والبيانات الرقمية، مما يجعله مكونًا أساسيًا للعديد من التطبيقات الذكية، بدءًا من معالجة اللغة الطبيعية (NLP) إلى مهام الرؤية الحاسوبية المتقدمة.