اكتشف مفاهيم معالجة اللغات الطبيعية (NLP) وتقنياتها وتطبيقاتها مثل برامج الدردشة الآلية، وتحليل المشاعر، والترجمة الآلية.
معالجة اللغة الطبيعية (NLP) هي فرع ديناميكي من الذكاء الاصطناعي (AI) يركز على التفاعل بين أجهزة الكمبيوتر واللغة البشرية. من خلال الجمع بين اللغويات الحاسوبية و التعلم الآلي الإحصائي (ML) و التعلم العميق (DL)، تمكّن معالجة اللغة الطبيعية الآلات من فهم اللغة البشرية وتفسيرها وتوليدها بطريقة مفيدة. على عكس المطابقة البسيطة للكلمات المفتاحية، تقوم أنظمة NLP الحديثة بتحليل بناء الجملة ودلالات الكلمات وسياق النص أو الكلام، مما يتيح تطبيقات تتراوح من برامج التدقيق الإملائي البسيطة إلى المساعدين الافتراضيين المعقدين القادرين على إجراء محادثات بطلاقة.
ينطوي الانتقال من النص الخام إلى فهم الآلة على عدة خطوات حاسمة في المعالجة المسبقة والنمذجة. في البداية، تمر البيانات غير المنظمة بعملية الترميز، وهي عملية تقسم النص إلى وحدات أصغر مثل الكلمات أو الكلمات الفرعية. ثم يتم تحويل هذه الرموز إلى متجهات رقمية تعرف باسم التضمينات. التضمينات مهمة للغاية لأنها تربط الكلمات ذات المعاني المتشابهة بنقاط قريبة في فضاء متجه عالي الأبعاد، مما يسمح للنموذج بفهم العلاقات الدلالية .
تعتمد البرمجة اللغوية العصبية الحديثة بشكل كبير على بنية Transformer ، التي تم تقديمها في الورقة البحثية الرائدة التي تحمل عنوان "الانتباه هو كل ما تحتاجه". تستخدم المحولات آلية الانتباه لتقييم أهمية الكلمات المختلفة في الجملة بالنسبة لبعضها البعض، مما يمكّن النموذج من التعامل مع التبعيات طويلة المدى والسياق بشكل أكثر فعالية من الشبكات العصبية المتكررة (RNNs) القديمة.
تكنولوجيا NLP موجودة في كل مكان في البرامج الحديثة، حيث تدعم الأدوات التي تستخدمها الشركات والأفراد يوميًا.
لفهم نطاق NLP، من المفيد التمييز بينه وبين المفاهيم الوثيقة الصلة به في مجال علم البيانات:
يوضح المثال التالي كيفية تفاعل مفاهيم NLP مع الرؤية الحاسوبية. نستخدم
ultralytics حزمة لتحميل نموذج يفهم المطالبات النصية. من خلال تعريف فئات مخصصة باللغة الطبيعية
، نستخدم المفردات الداخلية للنموذج (التضمينات) detect في الصورة.
from ultralytics import YOLOWorld
# Load a model with vision-language capabilities
model = YOLOWorld("yolov8s-world.pt")
# Define NLP-based search terms (classes) for the model to find
# The model uses internal text embeddings to understand these descriptions
model.set_classes(["blue bus", "pedestrian crossing", "traffic light"])
# Run inference to detect objects matching the text descriptions
results = model.predict("city_scene.jpg")
# Show the results
results[0].show()
غالبًا ما يتطلب تطوير تطبيقات NLP مكتبات قوية. يستخدم الباحثون بشكل متكرر PyTorch لبناء بنى عصبية مخصصة، بينما تظل مجموعة أدوات اللغة الطبيعية (NLTK) أساسية لمهام المعالجة المسبقة التعليمية . بالنسبة لمعالجة النصوص على مستوى الإنتاج، يتم اعتماد spaCy على نطاق واسع لفعاليته .
مع تطور الذكاء الاصطناعي، أصبح تقارب الأساليب اتجاهاً رئيسياً. تتجه المنصات نحو سير عمل موحد حيث يتم التعامل مع الرؤية واللغة كتيارات بيانات مترابطة. تعمل Ultralytics على تبسيط دورة الحياة هذه، حيث توفر أدوات لإدارة مجموعات البيانات، وتوضيح الصور، وتدريب أحدث النماذج. بينما يتعامل NLP مع الجانب اللغوي، تضمن نماذج الرؤية عالية الأداء مثل YOLO26 معالجة البيانات المرئية بالسرعة والدقة المطلوبة لتطبيقات الحافة في الوقت الفعلي، مما يخلق تجربة سلسة لأنظمة الذكاء الاصطناعي متعددة الوسائط.