Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

فهم اللغات الطبيعية (NLU)

اكتشف فهم اللغة الطبيعية (NLU) – وهو إنجاز الذكاء الاصطناعي الذي يمكّن الآلات من فهم اللغة البشرية وتفسيرها والاستجابة لها.

إن فهم اللغة الطبيعية (NLU) هو مجال فرعي متخصص في الذكاء الاصطناعي (AI) يركز على فهم القراءة الآلية. في حين أن معالجة النصوص القياسية قد تقوم بعدّ الكلمات، يهدف فهم اللغة الطبيعية إلى فك رموز المعنى والنية والمشاعر الكامنة وراء اللغة البشرية. إنه "الدماغ" الذي يسمح للبرمجيات بما يلي بتفسير النصوص غير المهيكلة - مثل رسائل البريد الإلكتروني أو سجلات الدردشة أو الأوامر المنطوقة - وترجمتها إلى منظمة وقابلة للتنفيذ. هذه الإمكانية أساسية لبناء أنظمة بديهية مثل روبوتات الدردشة و والمساعدين الافتراضيين الذين يمكنهم التفاعل مع المستخدمين بشكل طبيعي.

المكونات الأساسية للفهم الآلي للغة (NLU)

من أجل "فهم" اللغة بشكل فعّال، تقوم أنظمة وحدة معالجة اللغات الطبيعية بتقسيم المدخلات إلى عدة طبقات ذات معنى. هذه العملية تحوّل هذه العملية النص الخام إلى تنسيق منظّم يمكن للخوارزميات العمل عليه.

  • التعرف على النوايا: هذا يحدد هدف المستخدم. على سبيل المثال، إذا كتب المستخدم "أحتاج إلى رحلة إلى طوكيو"، فإن الهدف هو BookFlight. وهذا أمر بالغ الأهمية لوكلاء الذكاء الاصطناعي الموجهين نحو الهدف.
  • التعرف على الكيانات المسماة (NER): هذا يستخرج أجزاء محددة من المعلومات، مثل الأسماء أو التواريخ أو المواقع أو رموز المنتجات. في العبارة "لقاء مع جلين يوم الجمعة"، يُعرّف NER "جلين" على أنه PERSON و "الجمعة" كـ DATE.
  • تحليل المشاعر: هذا يقيّم النبرة العاطفية للنص - إيجابية أو سلبية أو محايدة. يُستخدم على نطاق واسع في دعم العملاء من أجل قياس رضا المستخدم تلقائياً.
  • الاستدلال السياقي: وحدة معالجة اللغات الطبيعية المتقدمة، وغالباً ما تكون مدعومة ب نماذج لغوية كبيرة (LLMs) و المحولات، تبحث في ما وراء الجمل الفردية من أجل فهم الإشارات والغموض (على سبيل المثال، فهم ما تشير إليه كلمة "هو" في المحادثة).

تطبيقات واقعية

تُعد وحدة معالجة اللغات الطبيعية هي المحرك وراء العديد من التقنيات التي نستخدمها يومياً، حيث تعمل على سد الفجوة بين التواصل البشري والآلة والمنطق الآلي.

  1. أتمتة خدمة العملاء: تستخدم الشركات وحدات خدمة العملاء غير المتصلة بالإنترنت لتشغيل وكلاء الدعم الذكي. منصات مثل IBM Watson Natural Language Understanding تحليل تذاكر الدعم الواردة، وتوجيهها إلى القسم الصحيح بناءً على القصد، وحتى اقتراح استجابات بناءً على وصف المشكلة.
  2. البحث الدلالي: على عكس البحث بالكلمات المفتاحية، الذي يطابق الكلمات الدقيقة، فإن محركات البحث التي تعتمد على وحدة المعالجة اللغوية غير الدلالية فهم معنى الاستعلام. يتيح ذلك للمستخدمين طرح أسئلة مثل "من هو الرئيس التنفيذي لشركة Ultralytics " والحصول على إجابة مباشرة بدلاً من قائمة من الروابط التي تحتوي على كلمة "الرئيس التنفيذي".
  3. التحكم المنشط بالصوت: تعتمد الأجهزة على وحدة التحكم غير المنطوقة لتحليل الأوامر المنطوقة. عندما يقول المستخدم "أطفئ أطفئوا أضواء غرفة المعيشة"، يستخدم النظام وحدة التحكم المنطوقة غير المنطوقة لتحديد الإجراء ("أطفئوا") والكيان المستهدف ("أضواء غرفة المعيشة").

وحدة معالجة اللغات الطبيعية في مقابل البرمجة اللغوية العصبية مقابل الرؤية الحاسوبية

من المفيد التمييز بين وحدة معالجة اللغات الطبيعية وتخصصات الذكاء الاصطناعي ذات الصلة:

  • معالجة اللغات الطبيعية (NLP): البرمجة اللغوية العصبية هي المجال الشامل الذي يشمل جميع المهام اللغوية. NLU هو على وجه التحديد مجموعة فرعية للفهم (المدخلات $/إلى $$ المعنى). وهناك مجموعة فرعية أخرى، وهي توليد اللغة الطبيعية (NLG)، تتعامل مع إنشاء النص (المعنى \$ إلى \$ المخرجات).
  • الرؤية الحاسوبية (CV): بينما تعالج تعالج NLU النصوص، فإن السيرة الذاتية تفسر البيانات المرئية. ومع ذلك، فإن النماذج متعددة الوسائط تجمع بين كليهما. على سبيل المثال، نماذج مثل YOLO تستخدم NLU لتفسير لتفسير المطالبات النصية (على سبيل المثال، "حقيبة ظهر زرقاء") ثم استخدام السيرة الذاتية للعثور على تلك الأشياء في الصورة.

الذكاء الاصطناعي للذكاء الاصطناعي في الرؤية: الكشف عن المفردات المفتوحة

يتيح دمج وحدة معالجة اللغات الطبيعية مع الرؤية الحاسوبية إمكانية "الكشف عن الكائنات ذات المفردات المفتوحة". بدلاً من الاقتصار على قائمة ثابتة من الأصناف (مثل الأصناف الثمانين في COCO)، يمكن للنموذج detect الكائنات بناءً على النص الوصفي. إن Ultralytics YOLOWorld نموذج يجسد ذلك باستخدام مشفر نصي مدمج "لفهم" الأصناف التي تريد العثور عليها.

يوضّح المثال التالي كيف يُمكّن نموذج الرؤية من detect كائنات مخصصة محددة بالنص فقط:

from ultralytics import YOLOWorld

# Load a YOLO-World model (incorporates NLU for text-based class definition)
model = YOLOWorld("yolov8s-world.pt")

# Define custom classes using natural language
# The model's NLU component understands these terms without retraining
model.set_classes(["person reading a book", "red coffee mug"])

# Run inference on an image
results = model.predict("library.jpg")

# Display results
results[0].show()

الأدوات والاتجاهات المستقبلية

يتطور مجال وحدة المعالجة اللغوية العصبية اللغوية بشكل سريع، مدفوعًا بأبحاث مجموعات مثل مجموعة ستانفورد للبرمجة اللغوية العصبية و جمعية اللغويات الحاسوبية (ACL). تنتقل التقنيات من مطابقة الكلمات المفتاحية البسيطة إلى الفهم السياقي العميق.

بالنسبة للمطورين، ستعمل منصةUltralytics القادمة (التي سيتم إطلاقها عام 2026) على تبسيط دورة حياة لنماذج الذكاء الاصطناعي، مما يسهل إدارة مجموعات البيانات ونشر الأنظمة المعقدة متعددة الوسائط التي تستفيد من كل من الرؤية و والفهم اللغوي. يمكن التعامل مع أحدث مهام الرؤية الحالية من خلال YOLO11بينما يستمر البحث والتطوير على الجيل التالي من YOLO26، بهدف تحقيق تكامل أكثر إحكامًا بين السرعة والدقة. الخدمات السحابية مثل Google للغة الطبيعية السحابية توفر أيضًا واجهات برمجة تطبيقات قوية ل لإضافة ميزات NLU الخالصة إلى التطبيقات.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن