اكتشف كيف تُحدث قواعد بيانات المتجهات ثورة في الذكاء الاصطناعي من خلال تمكين عمليات البحث الفعالة عن التشابه، والبحث الدلالي، واكتشاف الحالات الشاذة للأنظمة الذكية.
قاعدة بيانات المتجهات هي نوع متخصص من قواعد البيانات المصممة لتخزين وإدارة والبحث في البيانات عالية الأبعاد المعروفة باسم تضمينات المتجهات (vector embeddings). على عكس قواعد البيانات العلائقية التقليدية المحسّنة للبيانات المنظمة والمطابقات التامة، تتفوق قواعد بيانات المتجهات في العثور على العناصر بناءً على تشابهها. هذه القدرة أساسية لمجموعة واسعة من تطبيقات الذكاء الاصطناعي (AI) الحديثة، من محركات التوصية إلى البحث المرئي، مما يجعلها مكونًا مهمًا في البنية التحتية للتعلم الآلي (machine learning). إنها بمثابة ذاكرة طويلة الأجل لنماذج الذكاء الاصطناعي، مما يسمح لها بالاستفادة من الأنماط المعقدة التي تم تعلمها أثناء التدريب.
الوظيفة الأساسية لقاعدة بيانات المتجهات هي تنفيذ بحث المتجهات بكفاءة. تبدأ العملية عندما يتم تمرير بيانات غير منظمة - مثل صورة أو كتلة نصية أو مقطع صوتي - عبر نموذج التعلم العميق لإنشاء تمثيل رقمي يسمى تضمين متجهي. تلتقط هذه التضمينات المعنى الدلالي للبيانات الأصلية.
ثم تقوم قاعدة بيانات المتجهات بتخزين هذه التضمينات وفهرستها باستخدام خوارزميات متخصصة. عند إجراء استعلام (على سبيل المثال، البحث باستخدام صورة)، يتم أيضًا تحويل بيانات الاستعلام إلى متجه. ثم تقارن قاعدة البيانات متجه الاستعلام هذا بالمتجهات المخزنة باستخدام مقاييس التشابه مثل تشابه جيب التمام أو مسافة إقليدية للعثور على العناصر "الأقرب" أو الأكثر تشابهًا. لإجراء ذلك على نطاق واسع مع ملايين أو مليارات المتجهات، فإنها غالبًا ما تعتمد على خوارزميات الجيران الأقرب التقريبي (ANN) عالية الكفاءة.
تعمل قواعد بيانات المتجهات على تشغيل العديد من الميزات الذكية التي يتفاعل معها المستخدمون يوميًا.
من المفيد التمييز بين قواعد بيانات المتجهات والمصطلحات وثيقة الصلة:
تتم إدارة هذه المكونات كجزء من سير عمل MLOps كامل، غالبًا ما يتم تسهيله بواسطة منصات مثل Ultralytics HUB للإدارة الشاملة للنماذج ومجموعات البيانات.
تتوفر العديد من قواعد بيانات المتجهات مفتوحة المصدر والتجارية، ولكل منها نقاط قوة مختلفة فيما يتعلق بقابلية التوسع والنشر والميزات. بعض من الأكثر استخدامًا تشمل: