اكتشف كيف تُحدث قواعد بيانات المتجهات ثورة في الذكاء الاصطناعي من خلال تمكين عمليات البحث الفعالة عن التشابه، والبحث الدلالي، واكتشاف الحالات الشاذة للأنظمة الذكية.
قاعدة البيانات المتجهة هي نظام تخزين متخصص مصمم لإدارة البيانات المتجهة عالية الأبعاد وفهرستها والاستعلام عنها, غالبًا ما يشار إليها باسم التضمينات. على عكس قواعد البيانات قواعد البيانات العلائقية التقليدية التي تخزن البيانات المهيكلة في صفوف وأعمدة لمطابقة الكلمات الرئيسية بالضبط، فإن قواعد البيانات المتجهة مُحسّنة للعثور على العناصر بناءً على تشابهها الدلالي. هذه القدرة تجعلها حجر الزاوية في الذكاء الاصطناعي الحديث حيث تسمح للأنظمة بمعالجة البيانات غير المهيكلة - مثل الصور والصوت والنصوص - من خلال فهم العلاقات السياقية بينها. وهي بمثابة ذاكرة طويلة الأجل لتطبيقات لتطبيقات التعلم الآلي، مما يتيح الاسترجاع الفعّال للمعلومات المترابطة مفاهيميًا وليس المتطابقة.
تعتمد الوظيفة الأساسية لقاعدة البيانات المتجهة على تحويل البيانات الأولية إلى متجهات رياضية من خلال عملية عملية تعرف باسم استخراج الميزة. A نموذج التعلم العميق، مثل محول الرؤية (ViT) أو أو الشبكة العصبية التلافيفية (CNN)، يحلل البيانات ويخرج متجهًا - قائمة طويلة من الأرقام التي تمثل ميزات البيانات.
بمجرد إنشاء هذه المتجهات، تقوم قاعدة البيانات بفهرستها باستخدام خوارزميات متخصصة مثل أقرب جار تقريبي (ANN). عندما يقوم المستخدم بإجراء استعلام، يقوم النظام بتحويل مصطلح البحث (صورة أو نص) إلى متجه ويحسب قربه من المتجهات المخزنة باستخدام مقاييس المسافة مثل تشابه جيب التمام أو المسافة الإقليدية. هذا يسمح لقاعدة البيانات بسرعة تحديد الجيران "الأقرب"، والتي تمثل النتائج الأكثر صلة.
يوضح مقتطف الكود التالي كيفية توليد التضمينات باستخدام نموذج نموذجYOLO11 وهي الخطوة الأولى قبل تخزين البيانات في قاعدة بيانات متجهة.
from ultralytics import YOLO
# Load a pre-trained YOLO11 classification model
model = YOLO("yolo11n-cls.pt")
# Generate feature embeddings for an image file
# This converts the visual content into a numerical vector
results = model.embed("bus.jpg")
# Output the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")
قواعد البيانات المتجهة هي المحرك وراء العديد من الميزات الذكية في البرامج التجارية والمؤسسية.
لفهم النظام البيئي، من المفيد التمييز بين قاعدة بيانات المتجهات والمصطلحات ذات الصلة:
يوفر السوق العديد من الخيارات القوية لتنفيذ التخزين المتجه، بدءًا من الأدوات مفتوحة المصدر إلى الخدمات المُدارة المُدارة:
من خلال دمج هذه الأدوات في سير عمل MLOps، يمكن للمطورين بناء أنظمة "تفهم" حقًا محتوى البيانات، مما يتيح قدرات متقدمة مثل البحث الدلالي واكتشاف الشذوذ، وتسليم المحتوى المخصص.