مسرد المصطلحات

قاعدة بيانات المتجهات

اكتشف كيف تُحدِث قواعد البيانات المتجهة ثورة في الذكاء الاصطناعي من خلال تمكين عمليات البحث الفعالة عن التشابه، والبحث الدلالي، واكتشاف الشذوذ للأنظمة الذكية.

قاعدة بيانات المتجهات هي نوع متخصص من قواعد البيانات المصممة لتخزين البيانات عالية الأبعاد المعروفة باسم تضمينات المتجهات وإدارتها والبحث فيها. على عكس قواعد البيانات العلائقية التقليدية التي تم تحسينها للبيانات المهيكلة والمطابقات التامة، تتفوق قواعد البيانات المتجهة في العثور على العناصر بناءً على تشابهها. هذه القدرة أساسية لمجموعة واسعة من تطبيقات الذكاء الاصطناعي الحديثة، من محركات التوصيات إلى البحث المرئي، مما يجعلها مكونًا أساسيًا في البنية التحتية للتعلم الآلي. وهي بمثابة ذاكرة طويلة الأجل لنماذج الذكاء الاصطناعي، مما يسمح لها بالاستفادة من الأنماط المعقدة التي تم تعلمها أثناء التدريب.

كيفية عمل قواعد البيانات المتجهة

تتمثل الوظيفة الأساسية لقاعدة البيانات المتجهة في تنفيذ بحث متجه بكفاءة. وتبدأ العملية عندما يتم تمرير البيانات غير المهيكلة - مثل صورة أو كتلة نصية أو مقطع صوتي - من خلال نموذج تعلّم عميق لإنشاء تمثيل رقمي يسمى تضمين المتجهات. تلتقط هذه التضمينات المعنى الدلالي للبيانات الأصلية.

ثم تقوم قاعدة البيانات المتجهة بتخزين هذه التضمينات وفهرستها باستخدام خوارزميات متخصصة. عند إجراء استعلام (مثل البحث باستخدام صورة)، يتم تحويل بيانات الاستعلام أيضًا إلى متجه. ثم تقارن قاعدة البيانات بعد ذلك متجه الاستعلام هذا بالمتجهات المخزنة باستخدام مقاييس التشابه مثل تشابه جيب التمام أو المسافة الإقليدية للعثور على "أقرب" أو أكثر العناصر تشابهًا. ولإجراء ذلك على نطاق واسع مع ملايين أو مليارات المتجهات، غالبًا ما يعتمدون على خوارزميات " أقرب جار تقريبي" (ANN) عالية الكفاءة.

التطبيقات الواقعية

تعمل قواعد بيانات المتجهات على تشغيل العديد من الميزات الذكية التي يتفاعل معها المستخدمون يومياً.

  1. البحث المرئي في التجارة الإلكترونية: يمكن للمستخدم تحميل صورة لمنتج أعجبه. يقوم نموذج رؤية حاسوبية، مثل نموذج Ultralytics YOLO11، بإنشاء تضمين للصورة. يتم استخدام هذا التضمين للاستعلام عن قاعدة بيانات متجهات موقع التجارة الإلكترونية، والتي تحتوي على تضمينات لكتالوج المنتجات بالكامل. تقوم قاعدة البيانات بإرجاع المتجهات الأكثر تشابهًا، مما يسمح للموقع بإظهار المنتجات المتطابقة بصريًا أو المترابطة من حيث الأسلوب، وهي ميزة أساسية في الذكاء الاصطناعي للبيع بالتجزئة.
  2. البحث الدلالي عن المستندات: يمكن للشركة إنشاء تضمينات لجميع مستنداتها الداخلية، مثل التقارير وتذاكر الدعم. يمكن للموظف بعد ذلك البحث باستخدام سؤال بلغة طبيعية مثل "ماذا كانت أرباحنا في الربع الأخير؟ يقوم نموذج معالجة اللغة الطبيعية (NLP) بتحويل هذا الاستعلام إلى تضمينات، وتقوم قاعدة البيانات المتجهة بالعثور على المستندات التي تكون تضميناتها الأقرب دلاليًا، مما يوفر معلومات ذات صلة حتى لو لم تتطابق الصياغة الدقيقة. هذا هو المكون الأساسي لأنظمة التوليد المعزز للاسترجاع (RAG).

قواعد البيانات المتجهة مقابل المفاهيم ذات الصلة

من المفيد التفريق بين قواعد البيانات المتجهة والمصطلحات وثيقة الصلة:

  • التضمينات: التضمينات هي التمثيلات المتجهة للبيانات. قاعدة بيانات المتجهات هي النظام المتخصص المصمم لتخزين هذه التضمينات وفهرستها والاستعلام عنها بكفاءة. فكر في التضمينات على أنها الكتب وقاعدة البيانات المتجهة على أنها المكتبة الذكية التي تنظمها.
  • البحث عن المتجهات: البحث عن المتجهات هو عملية إيجاد المتجهات الأكثر تشابهًا في مجموعة بيانات. وقاعدة بيانات المتجهات هي التقنية الأساسية التي تجعل هذه العملية سريعة وقابلة للتطوير، خاصةً للاستدلال في الوقت الحقيقي.

وتُدار هذه المكونات كجزء من سير عمل MLOps الكامل، وغالباً ما يتم تسهيل ذلك من خلال منصات مثل Ultralytics HUB لإدارة النماذج ومجموعات البيانات من البداية إلى النهاية.

قواعد بيانات المتجهات الشائعة

تتوفر العديد من قواعد البيانات المتجهة مفتوحة المصدر والتجارية، ولكل منها نقاط قوة مختلفة فيما يتعلق بقابلية التوسع والنشر والميزات. ومن أكثرها استخداماً ما يلي:

  • بينيكون: خدمة قاعدة بيانات متجهات شائعة ومدارة بالكامل.
  • Milvus: قاعدة بيانات متجهة مفتوحة المصدر مصممة لتحقيق أداء عالٍ وقابلية للتطوير.
  • Weaviate: قاعدة بيانات مفتوحة المصدر، وقاعدة بيانات مفتوحة المصدر، وقاعدة بيانات للذكاء الاصطناعي مع إمكانات الرسم البياني.
  • Chroma DB: قاعدة بيانات تضمين مفتوحة المصدر تركز على البساطة وتجربة المطورين.
  • Qdrant: قاعدة بيانات متجهية مفتوحة المصدر ومحرك بحث عن التشابه مكتوب بلغة Rust للأداء والأمان.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون ونمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة