اكتشف كيف تُحدِث قواعد البيانات المتجهة ثورة في الذكاء الاصطناعي من خلال تمكين عمليات البحث الفعالة عن التشابه، والبحث الدلالي، واكتشاف الشذوذ للأنظمة الذكية.
قاعدة بيانات المتجهات هي نوع متخصص من قواعد البيانات المصممة لتخزين البيانات عالية الأبعاد المعروفة باسم تضمينات المتجهات وإدارتها والبحث فيها. على عكس قواعد البيانات العلائقية التقليدية التي تم تحسينها للبيانات المهيكلة والمطابقات التامة، تتفوق قواعد البيانات المتجهة في العثور على العناصر بناءً على تشابهها. هذه القدرة أساسية لمجموعة واسعة من تطبيقات الذكاء الاصطناعي الحديثة، من محركات التوصيات إلى البحث المرئي، مما يجعلها مكونًا أساسيًا في البنية التحتية للتعلم الآلي. وهي بمثابة ذاكرة طويلة الأجل لنماذج الذكاء الاصطناعي، مما يسمح لها بالاستفادة من الأنماط المعقدة التي تم تعلمها أثناء التدريب.
تتمثل الوظيفة الأساسية لقاعدة البيانات المتجهة في تنفيذ بحث متجه بكفاءة. وتبدأ العملية عندما يتم تمرير البيانات غير المهيكلة - مثل صورة أو كتلة نصية أو مقطع صوتي - من خلال نموذج تعلّم عميق لإنشاء تمثيل رقمي يسمى تضمين المتجهات. تلتقط هذه التضمينات المعنى الدلالي للبيانات الأصلية.
ثم تقوم قاعدة البيانات المتجهة بتخزين هذه التضمينات وفهرستها باستخدام خوارزميات متخصصة. عند إجراء استعلام (مثل البحث باستخدام صورة)، يتم تحويل بيانات الاستعلام أيضًا إلى متجه. ثم تقارن قاعدة البيانات بعد ذلك متجه الاستعلام هذا بالمتجهات المخزنة باستخدام مقاييس التشابه مثل تشابه جيب التمام أو المسافة الإقليدية للعثور على "أقرب" أو أكثر العناصر تشابهًا. ولإجراء ذلك على نطاق واسع مع ملايين أو مليارات المتجهات، غالبًا ما يعتمدون على خوارزميات " أقرب جار تقريبي" (ANN) عالية الكفاءة.
تعمل قواعد بيانات المتجهات على تشغيل العديد من الميزات الذكية التي يتفاعل معها المستخدمون يومياً.
من المفيد التفريق بين قواعد البيانات المتجهة والمصطلحات وثيقة الصلة:
وتُدار هذه المكونات كجزء من سير عمل MLOps الكامل، وغالباً ما يتم تسهيل ذلك من خلال منصات مثل Ultralytics HUB لإدارة النماذج ومجموعات البيانات من البداية إلى النهاية.
تتوفر العديد من قواعد البيانات المتجهة مفتوحة المصدر والتجارية، ولكل منها نقاط قوة مختلفة فيما يتعلق بقابلية التوسع والنشر والميزات. ومن أكثرها استخداماً ما يلي: