مسرد المصطلحات

البحث الدلالي

اكتشف قوة البحث الدلالي! تعرّف على كيفية تحسين الذكاء الاصطناعي والبرمجة اللغوية العصبية وتعلم الآلة دقة البحث من خلال فهم قصد المستخدم والسياق.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

يمثل البحث الدلالي تقدمًا كبيرًا في مجال استرجاع المعلومات، حيث يتجاوز مجرد مطابقة الكلمات الرئيسية لفهم القصد والمعنى السياقي وراء استعلامات المستخدم. فبدلاً من مجرد البحث عن التكرارات الحرفية للكلمات، يستخدم البحث الدلالي تقنيات الذكاء الاصطناعي، خاصةً من معالجة اللغة الطبيعية، لفهم الفروق الدقيقة في اللغة والعلاقات بين الكلمات والهدف الأساسي للمستخدم. يتيح ذلك لأنظمة البحث تقديم نتائج أكثر صلة ودقة من خلال تفسير ما يعني المستخدم العثور عليه، بدلاً من مجرد المصطلحات المحددة التي كتبها. إنه مكون أساسي في جعل التفاعلات مع أنظمة المعلومات، من البحث على الويب إلى قواعد المعرفة الداخلية، أكثر طبيعية وبديهية، مما يحسن بشكل أساسي من فعالية استرجاع المعلومات.

كيفية عمل البحث الدلالي

ويستفيد البحث الدلالي في جوهره من مفاهيم من البرمجة اللغوية العصبية والتعلم الآلي (ML) لفك رموز المعنى المضمن في النص أو أنواع البيانات الأخرى. وغالباً ما تنطوي العملية على تحويل البيانات (مثل الكلمات أو الجمل أو المستندات أو حتى الصور) إلى تمثيلات رقمية تُسمى التضمينات. وتلتقط هذه التضمينات، وهي عادةً متجهات عالية الأبعاد، الجوهر الدلالي للبيانات. يتم وضع العناصر ذات المعاني أو المفاهيم أو السياقات المتشابهة بالقرب من بعضها البعض في هذا الفضاء المتجه.

عندما يقوم المستخدم بإجراء بحث، يتم أيضًا تحويل استعلامه (الذي يمكن أن يكون نصًا بلغة طبيعية أو صورة أو ما إلى ذلك) إلى تضمين باستخدام نفس نموذج التعلم الآلي. ثم يستخدم النظام تقنيات البحث المتجه، التي غالبًا ما تكون مدعومة بقواعد بيانات متجهة متخصصة مثل Pinecone أو Milvus، للعثور بكفاءة على العناصر الموجودة في فهرسها والتي تكون تضميناتها الأقرب (الأكثر تشابهًا) مع تضمين الاستعلام. يُقاس هذا التشابه عادةً باستخدام مقاييس المسافة مثل تشابه جيب التمام أو المسافة الإقليدية. تُستخدم نماذج التعلم العميق المتقدمة (DL) ، بما في ذلك البنى مثل المحولات (على سبيل المثال، BERT)، بشكل متكرر لإنشاء هذه التضمينات القوية الواعية بالسياق. وقد أدرجت محركات البحث الرئيسية مثل محرك بحثGoogle Search الفهم الدلالي لسنوات لتحسين جودة النتائج بما يتجاوز مجرد تكرار الكلمات المفتاحية.

تطبيقات البحث الدلالي

يعمل البحث الدلالي على تحسين العديد من التطبيقات التي يكون فيها فهم قصد المستخدم أو سياق البيانات أمرًا بالغ الأهمية:

  • بحث الويب المحسّن: تجاوز الكلمات المفتاحية لفهم الموضوع والقصد من وراء البحث (على سبيل المثال، البحث عن "أفضل مكان لرؤية الشفق القطبي الشمالي في الشتاء" ينتج عنه نتائج حول مواقع محددة وأوقات مثالية، وليس فقط الصفحات التي تحتوي على تلك الكلمات بالضبط).
  • اكتشاف منتجات التجارة الإلكترونية: السماح للمستخدمين بالبحث عن المنتجات باستخدام لغة وصفية وطبيعية (على سبيل المثال، العثور على "أحذية مريحة للوقوف طوال اليوم" بدلاً من الحاجة إلى معرفة علامات تجارية أو أسماء منتجات محددة). وغالبًا ما يتكامل ذلك مع أنظمة التوصيات.
  • إدارة المعرفة الداخلية: تمكين الموظفين داخل المؤسسة من العثور على المستندات أو التقارير أو الخبرات ذات الصلة من خلال البحث بناءً على المفاهيم والمعنى، وتحسين الوصول إلى المعلومات داخل أدوات مثل Ultralytics HUB.
  • روبوتات الدردشة الآلية لدعم العملاء: تشغيل روبوتات الدردشة الآلية والمساعدين الافتراضيين لفهم أسئلة المستخدمين بشكل أفضل وتقديم إجابات أكثر دقة أو مقالات مساعدة ذات صلة، وغالباً ما يتم الاستفادة من نماذج اللغة الكبيرة (LLMs).
  • التوصية بالمحتوى: اقتراح مقالات أو مقاطع فيديو أو موسيقى بناءً على التشابه الدلالي مع المحتوى الذي تفاعل معه المستخدم سابقًا. تستخدم منصات مثل Spotify مفاهيم مشابهة.
  • استكشاف البيانات: يمكن لأدوات مثل لوحة بياناتUltralytics Explorer Dashboard الاستفادة من التشابه الدلالي لمساعدة المستخدمين على التنقل وفهم مجموعات البيانات الكبيرة، بما في ذلك مجموعات بيانات الصور المستخدمة في الرؤية الحاسوبية. على سبيل المثال، العثور على صور مشابهة دلاليًا لصورة محددة في مجموعة بيانات مثل COCO.

البحث الدلالي مقابل المفاهيم ذات الصلة

من المفيد التمييز بين البحث الدلالي والمصطلحات ذات الصلة:

  • البحث بالكلمات الرئيسية: يطابق هذا النهج التقليدي الكلمات أو العبارات الحرفية في الاستعلام مع المستندات التي تحتوي على تلك المصطلحات بالضبط. وهو يفتقر إلى فهم المرادفات أو السياق أو قصد المستخدم. يهدف البحث الدلالي إلى التغلب على هذه القيود.
  • البحث عن المتجهات: هذه طريقة تُستخدم للعثور على عناصر متشابهة بناءً على تقارب تضميناتها المتجهة. في حين أن البحث المتجه هو عنصر أساسي في العديد من تطبيقات البحث الدلالي الحديثة (التعامل مع جزء الاسترجاع الفعال)، فإن البحث الدلالي هو المفهوم الأوسع الذي يتضمن فهم معنى وسياق الاستعلام والبيانات في المقام الأول، وغالبًا ما يكون ذلك من خلال نماذج متطورة في البرمجة اللغوية العصبية.
  • الرسم البياني المعرفي: يبني الرسم البياني المعرفي المعلومات ككيانات وعلاقات. في حين أنه يمكن أن يعزز البحث الدلالي بشكل كبير من خلال توفير سياق منظم وتمكين الاستدلال المعقد(استعلامات SPARQL شائعة هنا)، يمكن أن يعمل البحث الدلالي أيضًا بشكل مباشر على البيانات غير المنظمة باستخدام التضمينات دون بنية رسم بياني صريح. إنهما تقنيتان متكاملتان.
  • التعرف على الكيانات المسماة (NER): تحدد NER كيانات محددة (مثل الأسماء والأماكن والمنظمات) في النص. يمكن أن تكون خطوة ضمن خط أنابيب معالجة اللغات الطبيعية التي تغذي البحث الدلالي من خلال استخراج المفاهيم الرئيسية، ولكنها ليست بحثًا دلاليًا بحد ذاتها، والتي تركز على المعنى العام والتشابه.

يلعب البحث الدلالي دورًا حيويًا في إنشاء أنظمة ذكاء اصطناعي أكثر ذكاءً وسهولة في الاستخدام، وسد الفجوة بين اللغة البشرية وفهم الآلة للوصول إلى المعلومات والتفاعل معها بشكل أكثر فعالية في مختلف المجالات، بدءًا من عمليات البحث اليومية على الويب إلى تطبيقات الذكاء الاصطناعي المتخصصة مثل تلك التي تم إنشاؤها باستخدام Ultralytics YOLO للبحث المرئي أو التحليل المرئي داخل Ultralytics HUB.

قراءة الكل