Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

البحث الدلالي (Semantic Search)

اكتشف كيف يستخدم البحث الدلالي الذكاء الاصطناعي والتضمينات لفهم نية المستخدم. تعلم كيفية إنشاء أنظمة بحث مرئية باستخدام Ultralytics ومنصتنا.

البحث الدلالي هو تقنية متطورة لاسترجاع المعلومات تهدف إلى فهم المقصود والمعنى السياقي لاستعلام المستخدم بدلاً من مجرد مطابقة كلمات محددة. من خلال الاستفادة من التطورات في معالجة اللغة الطبيعية (NLP) والتعلم الآلي (ML)، تتيح هذه التقنية للأنظمة تفسير اللغة البشرية بدرجة أكبر من الدقة. وهي حجر الزاوية في تطبيقات الذكاء الاصطناعي (AI) الحديثة، حيث تتيح تفاعلات أكثر بديهية بين البشر والآلات من خلال سد الفجوة بين استفسارات المستخدمين الغامضة والبيانات ذات الصلة.

كيفية عمل البحث الدلالي

في جوهره، يتجاوز البحث الدلالي مطابقة الأحرف الحرفية ليحلل العلاقة بين المفاهيم. قد تفشل محركات البحث التقليدية إذا بحث المستخدم عن "feline" (قط) ولكن الوثائق تحتوي فقط على كلمة "cat" (قطة). يحل البحث الدلالي هذه المشكلة عن طريق تحويل البيانات غير المنظمة— مثل النصوص أو الصور أو الصوت — إلى تمثيلات رياضية تسمى التضمينات.

هذه التضمينات هي متجهات عالية الأبعاد موضوعة في "مساحة دلالية". في هذه المساحة، يتم وضع العناصر ذات المعاني المتشابهة بالقرب من بعضها البعض. على سبيل المثال، سيكون المتجه الخاص بكلمة "سيارة" أقرب من الناحية الحسابية إلى كلمتي "سيارة" و"طريق" منه إلى كلمة "موزة". عندما يرسل المستخدم استعلامًا، يقوم النظام بتحويل هذا الاستعلام إلى متجه ويبحث عن أقرب نقاط البيانات في قاعدة بيانات المتجهات. تعتمد هذه العملية على نماذج التعلم العميق لأداء استخراج الميزات، وتحديد الخصائص الأساسية للبيانات.

يوضح Python التالي كيفية إنشاء هذه التضمينات باستخدام نموذج Ultralytics وهو الخطوة الأساسية لتمكين البحث الدلالي البصري.

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Generate feature embeddings for an image
# This converts the visual content into a numerical vector
results = model.embed("https://ultralytics.com/images/bus.jpg")

# Output the shape of the embedding vector (e.g., length 1280)
print(f"Embedding vector shape: {results[0].shape}")

تطبيقات واقعية

أحدث البحث الدلالي ثورة في كيفية اكتشاف المستخدمين للمعلومات في مختلف القطاعات، مما جعل الأنظمة أكثر ذكاءً و كفاءة.

  • التجارة الإلكترونية والاكتشاف البصري: في عالم الذكاء الاصطناعي في مجال البيع بالتجزئة، يعمل البحث الدلالي على تشغيل ميزات "تسوق المظهر". قد يقوم العميل بتحميل صورة لحذاء رياضي أو البحث عن "أجواء صيفية كلاسيكية". يستخدم النظام الرؤية الحاسوبية لفهم النمط البصري ويسترجع المنتجات التي تتطابق مع الذوق الجمالي، حتى لو لم تحتوي أوصاف المنتج على تلك الكلمات المفتاحية بالضبط. وغالبًا ما يتضمن ذلك نماذج متعددة الوسائط يمكنها فهم كل من مدخلات النص والصورة.
  • إدارة المعرفة و RAG: تستخدم المؤسسات الكبيرة البحث الدلالي لمساعدة الموظفين في العثور على الوثائق الداخلية. بدلاً من تذكر أسماء الملفات بالضبط، يمكن للموظف طرح سؤال مثل "كيف يمكنني إعادة ضبط الخادم؟" يستخدم النظام توليد معزز بالاسترجاع (RAG) للعثور على المستندات الأكثر صلة بالسياسة بناءً على المعنى ويقوم بإدخالها في نموذج لغوي كبير (LLM) لتوليد إجابة دقيقة.
  • توصية المحتوى: تستخدم منصات البث المباشر الفهم الدلالي لتحسين نظام التوصيات الخاص بها. من خلال تحليل ملخصات الحبكة والخرائط المرئية للأفلام التي يستمتع بها المستخدم، يمكن للمنصة اقتراح عناوين أخرى تشترك في موضوعات أو أجواء مماثلة، مما يحافظ على تفاعل المستخدمين لفترة أطول.

البحث الدلالي مقابل المفاهيم ذات الصلة

لفهم فائدة البحث الدلالي بشكل كامل، من المفيد تمييزه عن المصطلحات ذات الصلة في مجال علم البيانات.

  • البحث المتجه: على الرغم من استخدامهما بشكل متبادل في كثير من الأحيان ، إلا أن هناك فرقًا تقنيًا بينهما. البحث المتجه هو طريقة رياضية لحساب المسافة بين المتجهات (غالبًا باستخدام تشابه جيب التمام). البحث الدلالي هو تطبيق أوسع نطاقًا يستخدم البحث المتجه لتحقيق هدف فهم نية المستخدم.
  • البحث عن الكلمات المفتاحية: هذه هي الطريقة التقليدية التي تعتمد على مطابقة السلسلة الحرفية. وهي أقل تكلفة من الناحية الحسابية ولكنها هشة؛ فهي تواجه صعوبة في التعامل مع المرادفات والكلمات متعددة المعاني (الكلمات التي لها معانٍ متعددة). يتطلب البحث الدلالي قدرة حسابية أكبر ولكنه يوفر دقة أعلى بكثير.
  • التعلم بدون تدريب (Zero-Shot Learning): يشير هذا إلى قدرة النموذج على classify لم يسبق له رؤيتها أثناء التدريب. غالبًا ما تُظهر محركات البحث الدلالية قدرات بدون تدريب لأنها يمكنها ربط استعلام جديد لم يسبق رؤيته بمجموعات موجودة من المفاهيم المعروفة داخل مساحة التضمين دون الحاجة إلى إعادة التدريب.

يتطلب تنفيذ البحث الدلالي عادةً وجود خط أنابيب قوي لإدارة مجموعات البيانات وتدريب النماذج. Ultralytics على تبسيط ذلك من خلال توفير أدوات لتعليق البيانات وتدريب النماذج ونشرها بكفاءة. بالنسبة للمطورين الذين يتطلعون إلى بناء هذه الأنظمة، يوفر استكشاف دليل البحثUltralytics خطوات عملية لدمج هذه القدرات القوية في التطبيقات.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن