استكشف التعرف على الكيانات المسماة (NER) في معالجة اللغات الطبيعية (NLP). تعلم كيفية تحديد classify كيانات classify مثل الأسماء والتواريخ للحصول على رؤى باستخدام الذكاء الاصطناعي و Ultralytics .
التعرف على الكيانات المسماة (NER) هو مهمة فرعية أساسية من مهام معالجة اللغة الطبيعية (NLP) تتضمن تحديد وتصنيف المعلومات الأساسية داخل النصوص غير المنظمة. في سير العمل النموذجي، يقوم نموذج NER بمسح مستند لتحديد موقع "الكيانات" — وهي كلمات أو عبارات محددة تمثل كائنات في العالم الحقيقي — و تصنيفها إلى فئات محددة مسبقًا مثل أسماء الأشخاص أو المؤسسات أو المواقع أو التواريخ أو الرموز الطبية. هذه العملية ضرورية لتحويل البيانات الأولية غير المنظمة مثل رسائل البريد الإلكتروني ومراجعات العملاء و المقالات الإخبارية إلى تنسيقات منظمة يمكن للأجهزة معالجتها وتحليلها. من خلال الإجابة على "من وماذا وأين" في النص، يتيح NER لأنظمة الذكاء الاصطناعي (AI) استخراج رؤى مفيدة من كميات هائلة من المعلومات تلقائيًا.
تستفيد أنظمة NER الحديثة من النماذج الإحصائية المتقدمة وتقنيات التعلم العميق (DL) لفهم السياق المحيط بالكلمة. تبدأ العملية بـ الترميز، حيث يتم تقسيم الجملة إلى وحدات فردية تسمى الرموز. ثم تقوم البنى المعقدة، مثل Transformer، بتحليل العلاقات بين هذه الرموز لتحديد معناها بناءً على الاستخدام.
على سبيل المثال، يمكن أن تشير كلمة "Apple" إلى فاكهة أو شركة تكنولوجيا حسب الجملة. من خلال آليات مثل الانتباه الذاتي، يميز نموذج NER أن "Apple أطلقت هاتفًا جديدًا" يشير إلى منظمة، بينما "أكلت تفاحة" يشير إلى كائن عام. يعتمد أداء هذه النماذج بشكل كبير على بيانات تدريب عالية الجودة وتعليقات دقيقة على البيانات. في التطبيقات متعددة الوسائط، غالبًا ما يقترن NER بـ التعرف الضوئي على الحروف (OCR) لاستخراج النص من الصور قبل معالجته.
NER هي تقنية أساسية للعديد من أدوات الأتمتة الذكية المستخدمة في مختلف الصناعات.
من المفيد التمييز بين NER ومهام التفسير الأخرى لفهم دورها المحدد في مسار الذكاء الاصطناعي.
يعد التقارب بين النص والرؤية اتجاهاً متنامياً في التعلم متعدد الوسائط. تعمل نماذج مثل YOLO على سد هذه الفجوة باستخدام مطالبات نصية لتوجيه عملية اكتشاف الكائنات. في سير العمل هذا، يعمل مشفر النص بشكل مشابه لنظام NER، حيث يفسر المعنى الدلالي لأسماء الفئات (الكيانات) التي يقدمها المستخدم للعثور على الكائنات المرئية المقابلة.
يوضّح مثال Python التالي كيفية استخدام الأداة ultralytics مكتبة detect بناءً على
أوصاف نصية مخصصة، مما يربط بشكل فعال الكيانات اللغوية الطبيعية بالبيانات المرئية.
from ultralytics import YOLOWorld
# Load a YOLO-World model capable of understanding text-based entities
model = YOLOWorld("yolov8s-world.pt")
# Define custom entities to search for in the image
# The model interprets these text strings to identify visual matches
model.set_classes(["red backpack", "person wearing hat", "dog"])
# Run inference on an image to localize these entities
results = model.predict("park_scene.jpg")
# Display the results with bounding boxes around detected entities
results[0].show()
يمكن للمطورين الوصول إلى نظام بيئي قوي من الأدوات لتنفيذ NER. توفر المكتبات مفتوحة المصدر الشهيرة مثل spaCy و NLTK خطوط إنتاج معدة مسبقًا للاستخدام الفوري. بالنسبة للتطبيقات على نطاق المؤسسات، توفر الخدمات السحابية مثل Google Natural Language واجهات برمجة تطبيقات مُدارة قابلة للتوسع وفقًا للطلب.
تتطلب إدارة دورة حياة نماذج الذكاء الاصطناعي هذه — سواء كانت للنصوص أو الرؤية — عمليات فعالة. Ultralytics على تبسيط عمليات MLOps هذه، حيث توفر بيئة موحدة لإدارة مجموعات البيانات وتدريب النماذج ونشر الحلول. وهذا يضمن بقاء مشاريع الذكاء الاصطناعي قابلة للتطوير وجاهزة للإنتاج، مما يدعم التحسين المستمر لنماذج مثل YOLO26 للحصول على أداء متطور.