Semantic Search
استكشف كيف يستخدم البحث الدلالي (semantic search) الذكاء الاصطناعي والتضمينات لفهم نية المستخدم. تعلم بناء أنظمة بحث بصري باستخدام Ultralytics YOLO26 ومنصتنا.
البحث الدلالي هو تقنية متطورة لاسترجاع المعلومات تهدف إلى فهم القصد والمعنى السياقي لاستعلام المستخدم بدلاً من مجرد مطابقة كلمات محددة. من خلال الاستفادة من التطورات في معالجة اللغات الطبيعية (NLP) والتعلم الآلي (ML)، تمكن هذه التقنية الأنظمة من تفسير اللغة البشرية بمزيد من الدقة. وهي حجر الزاوية في تطبيقات الذكاء الاصطناعي (AI) الحديثة، حيث تتيح تفاعلات أكثر بديهية بين البشر والآلات من خلال سد الفجوة بين استعلامات المستخدم الغامضة والبيانات ذات الصلة.
Link to this sectionكيف يعمل البحث الدلالي#
في جوهره، يتجاوز البحث الدلالي المطابقة الحرفية للأحرف لتحليل العلاقة بين المفاهيم. قد تفشل محركات البحث التقليدية إذا بحث المستخدم عن "سنوري" بينما تحتوي المستندات فقط على كلمة "قطة". يحل البحث الدلالي هذه المشكلة عن طريق تحويل البيانات غير المهيكلة — مثل النصوص أو الصور أو الصوت — إلى تمثيلات رياضية تسمى التضمينات (embeddings).
هذه التضمينات هي متجهات عالية الأبعاد توضع في "مساحة دلالية". في هذه المساحة، يتم وضع العناصر ذات المعاني المتشابهة بالقرب من بعضها البعض. على سبيل المثال، سيكون متجه "سيارة" أقرب رياضياً إلى "مركبة" و"طريق" منه إلى "موزة". عندما يرسل المستخدم استعلاماً، يقوم النظام بتحويل ذلك الاستعلام إلى متجه ويجد أقرب نقاط بيانات في قاعدة بيانات المتجهات. تعتمد هذه العملية على نماذج التعلم العميق (deep learning) لإجراء استخراج الميزات، وتحديد الخصائص الأساسية للبيانات.
يوضح كود Python التالي كيفية إنشاء هذه التضمينات باستخدام نموذج Ultralytics YOLO26، وهو الخطوة التأسيسية لتمكين البحث الدلالي المرئي.
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Generate feature embeddings for an image
# This converts the visual content into a numerical vector
results = model.embed("https://ultralytics.com/images/bus.jpg")
# Output the shape of the embedding vector (e.g., length 1280)
print(f"Embedding vector shape: {results[0].shape}")Link to this sectionتطبيقات العالم الحقيقي#
لقد أحدث البحث الدلالي ثورة في كيفية اكتشاف المستخدمين للمعلومات عبر مختلف القطاعات، مما جعل الأنظمة أكثر ذكاءً وكفاءة.
- التجارة الإلكترونية والاكتشاف المرئي: في عالم الذكاء الاصطناعي في البيع بالتجزئة، يدعم البحث الدلالي ميزات "تسوق الإطلالة". قد يقوم العميل بتحميل صورة لحذاء رياضي أو البحث عن "أجواء صيفية كلاسيكية". يستخدم النظام الرؤية الحاسوبية (computer vision) لفهم النمط المرئي واسترجاع المنتجات التي تطابق الجمالية، حتى لو كانت أوصاف المنتج لا تحتوي على تلك الكلمات المفتاحية بالضبط. غالباً ما يتضمن ذلك نماذج متعددة الوسائط (Multi-Modal Models) يمكنها فهم مدخلات النص والصورة معاً.
- إدارة المعرفة و RAG: تستخدم المؤسسات الكبيرة البحث الدلالي لمساعدة الموظفين في العثور على المستندات الداخلية. بدلاً من تذكر أسماء الملفات الدقيقة، يمكن للموظف طرح سؤال مثل "كيف أقوم بإعادة ضبط الخادم؟". يستخدم النظام التوليد المعزز بالاسترجاع (RAG) للعثور على مستندات السياسة الأكثر صلة بناءً على المعنى وتغذيتها في نموذج لغوي كبير (LLM) لتوليد إجابة دقيقة.
- توصية المحتوى: تستخدم منصات البث الفهم الدلالي لتحسين نظام التوصية الخاص بها. من خلال تحليل ملخصات الحبكة وخرائط الميزات المرئية للأفلام التي يستمتع بها المستخدم، يمكن للمنصة اقتراح عناوين أخرى تشترك في موضوعات أو أمزجة مماثلة، مما يبقي المستخدمين متفاعلين لفترة أطول.
Link to this sectionالبحث الدلالي مقابل المفاهيم ذات الصلة#
لفهم فائدة البحث الدلالي تماماً، من المفيد تمييزه عن المصطلحات ذات الصلة في مشهد علوم البيانات.
- البحث بالمتجهات (Vector Search): على الرغم من استخدامهما بالتبادل في كثير من الأحيان، إلا أن هناك تمييزاً تقنياً. البحث بالمتجهات هو الطريقة الرياضية لحساب المسافة بين المتجهات (غالباً باستخدام تشابه جيب التمام). البحث الدلالي هو التطبيق الأوسع الذي يستخدم البحث بالمتجهات لتحقيق هدف فهم قصد المستخدم.
- البحث بالكلمات المفتاحية: هذه هي الطريقة التقليدية التي تعتمد على مطابقة السلاسل النصية بدقة. إنها أقل تكلفة من الناحية الحسابية ولكنها هشة؛ حيث تعاني مع المرادفات وتعدد المعاني (الكلمات ذات المعاني المتعددة). يتطلب البحث الدلالي قوة حوسبة أكبر ولكنه يقدم صلة أعلى بكثير.
- التعلم بلقطة واحدة (Zero-Shot Learning): يشير هذا إلى قدرة النموذج على تصنيف البيانات التي لم يرها من قبل أثناء التدريب. غالباً ما تُظهر محركات البحث الدلالي قدرات التعلم بلقطة واحدة لأنها تستطيع تعيين استعلام جديد وغير مرئي إلى مجموعات موجودة من المفاهيم المعروفة داخل مساحة التضمين دون إعادة تدريب.
يتطلب تنفيذ البحث الدلالي عادةً خط أنابيب قوياً لإدارة مجموعات البيانات وتدريب النماذج. تعمل منصة Ultralytics على تبسيط ذلك من خلال توفير أدوات لتصنيف البيانات وتدريب النماذج ونشرها بكفاءة. بالنسبة للمطورين الذين يتطلعون إلى بناء هذه الأنظمة، يوفر استكشاف دليل البحث عن التشابه من Ultralytics خطوات عملية لدمج هذه القدرات القوية في التطبيقات.






