Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

فهم اللغات الطبيعية (NLU)

استكشف فهم اللغة الطبيعية (NLU) وكيف يمكّن الآلات من تفسير النوايا والمشاعر. تعلم كيفية ربط اللغة البشرية بالرؤية الاصطناعية.

فهم اللغة الطبيعية (NLU) هو مجموعة فرعية متخصصة من الذكاء الاصطناعي (AI) تركز على فهم القراءة وتفسير اللغة البشرية بواسطة الآلات. في حين أن التقنيات الأوسع نطاقًا تسمح لأجهزة الكمبيوتر بمعالجة البيانات النصية، فإن NLU تمكّن الأنظمة على وجه التحديد من فهم المعنى والنية والمشاعر التي تكمن وراء الكلمات، والتغلب على تعقيدات القواعد النحوية واللغة العامية والسياق. من خلال الاستفادة من بنى التعلم العميق (DL) المتقدمة، يحول NLU النص غير المنظم إلى منطق منظم وقابل للقراءة آليًا، ليكون بمثابة جسر بين التواصل البشري و الإجراءات الحسابية.

الآليات الأساسية لـ NLU

لفهم اللغة، تقوم خوارزميات NLU بتقسيم النص إلى أجزاء مكونة وتحليل العلاقات بينها. تتضمن هذه العملية عدة مفاهيم لغوية أساسية:

  • الترميز: الخطوة الأساسية حيث يتم تقسيم النص الخام إلى وحدات أصغر، مثل الكلمات أو الكلمات الفرعية. وهذا يُعد البيانات للتمثيل الرقمي داخل شبكة عصبية.
  • التعرف على الكيانات المسماة (NER): تحدد نماذج NLU كيانات محددة داخل الجملة، مثل الأشخاص أو المواقع أو التواريخ أو المنظمات. على سبيل المثال، في العبارة "احجز رحلة إلى لندن"، يتم استخراج "لندن" ككيان موقع.
  • تصنيف النوايا: وظيفة حاسمة للأنظمة التفاعلية، تحدد هدف المستخدم. يحلل تصنيف النوايا عبارة مثل "إنترنت الخاص بي معطل" لفهم أن المستخدم يبلغ عن مشكلة فنية بدلاً من طرح سؤال عام.
  • التحليل الدلالي: يتجاوز هذا العمل الكلمات المفتاحية البسيطة، ويقوم بتقييم معنى تراكيب الجمل. لطالما كان الباحثون في مجموعة ستانفورد NLP Group رواداً في طرق إزالة الغموض عن الكلمات بناءً على السياق، مما يضمن تفسير كلمة "bank" بشكل صحيح على أنها مؤسسة مالية أو ضفة نهر اعتماداً على النص المحيط بها.

NLU مقابل التخصصات ذات الصلة

من الضروري التمييز بين NLU والمجالات الوثيقة الصلة بها في مجال علوم الكمبيوتر:

  • معالجة اللغة الطبيعية (NLP): NLP هو مصطلح شامل يشمل NLU. بينما تغطي NLP كامل مسار معالجة البيانات اللغوية —بما في ذلك الترجمة والتحليل البسيط— فإن NLU تقتصر على جانب الفهم. وهناك مجموعة فرعية أخرى، توليد اللغة الطبيعية (NLG)، تتولى إنشاء استجابات نصية جديدة.
  • الرؤية الحاسوبية (CV): تقليديًا، تعالج الرؤية الحاسوبيةالبيانات المرئية بينما تعالج NLU النصوص. ومع ذلك، فإن النماذج متعددة الوسائط الحديثة تدمج بين هذين التخصصين. تقوم NLU بتحليل موجه نصي (على سبيل المثال، "ابحث عن السيارة الحمراء")، وتقوم الرؤية الحاسوبية بتنفيذ البحث المرئي بناءً على هذا الفهم.
  • التعرف على الكلام: تُعرف هذه التقنية أيضًا بـ "تحويل الكلام إلى نص"، وهي تقوم بتحويل الإشارات الصوتية إلى كلمات مكتوبة. لا تتولى NLU المهمة إلا بعد تحويل الكلام إلى نص لتفسير ما قيل.

تطبيقات واقعية

تدعم NLU العديد من الأنظمة الذكية التي تعتمد عليها الشركات والمستهلكون يوميًا.

  1. دعم العملاء الذكي: تستخدم روبوتات الدردشة الحديثة تقنية NLU لحل مشكلات الدعم دون تدخل بشري. من خلال استخدام تحليل المشاعر، يمكن لهذه الوكالات detect شاف الإحباط في رسالة العميل وتصعيد المشكلة تلقائيًا إلى مدير بشري.
  2. محركات البحث الدلالي: على عكس البحث التقليدي بالكلمات المفتاحية، تفهم المحركات التي تعمل بنظام NLU سياق الاستعلام. تستخدم المؤسسات البحث الدلالي للسماح للموظفين بالاستعلام عن قواعد البيانات الداخلية باستخدام أسئلة طبيعية مثل "أرني تقارير المبيعات من الربع الرابع الأخير "، مما ينتج عنه وثائق دقيقة بدلاً من قائمة من الملفات ذات الصلة غير المباشرة.
  3. تكامل الرؤية واللغة: في مجال الذكاء الاصطناعي للرؤية، تتيح NLU " الكشف عن الكائنات بمفردات مفتوحة". بدلاً من الاقتصار على فئات ثابتة (مثل 80 فئة في مجموعات البيانات القياسية)، تستخدم نماذج مثل YOLO NLU لفهم المطالبات النصية المخصصة والتعرف على تلك الكائنات في الصور.

مثال على الكود: اكتشاف الكائنات المدفوع بـ NLU

يوضح المثال التالي كيفية دمج مفاهيم NLU في سير عمل الرؤية الحاسوبية باستخدام ultralytics الحزمة. هنا، نستخدم نموذجًا يجمع بين مشفر نصي (NLU) وعمود فقري بصري detect محددة فقط بواسطة أوصاف اللغة الطبيعية.

from ultralytics import YOLOWorld

# Load a model capable of vision-language understanding
# This model uses NLU to interpret text prompts
model = YOLOWorld("yolov8s-world.pt")

# Define custom classes using natural language descriptions
# The NLU component parses "person in red shirt" to guide detection
model.set_classes(["person in red shirt", "blue bus"])

# Run inference on an image
results = model.predict("city_street.jpg")

# Display the results
results[0].show()

الأدوات والاتجاهات المستقبلية

يعتمد تطوير NLU على أطر عمل قوية. مكتبات مثل PyTorch توفر tensor اللازمة لبناء نماذج التعلم العميق، بينما يوفر spaCy أدوات صناعية قوية للمعالجة اللغوية.

وبالنظر إلى المستقبل، تتجه الصناعة نحو أنظمة متعددة الوسائط موحدة. Ultralytics على تبسيط هذه التطورات، حيث توفر بيئة شاملة لإدارة مجموعات البيانات، وتوضيح الصور، وتدريب النماذج التي يمكن نشرها على الحافة. بينما تتعامل النماذج اللغوية الكبيرة (LLMs) مع التفكير المعقد، فإن دمجها مع نماذج الرؤية عالية السرعة مثل YOLO26 يخلق عوامل قوية قادرة على الرؤية والفهم والتفاعل مع العالم في الوقت الفعلي. يمثل هذا التآزر الحدود التالية في تطبيقات التعلم الآلي (ML).

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن