Named Entity Recognition (NER)
استكشف التعرف على الكيانات المسماة (NER) في مجال معالجة اللغات الطبيعية (NLP). تعلم كيفية تحديد وتصنيف كيانات النص مثل الأسماء والتواريخ لاكتساب رؤى باستخدام الذكاء الاصطناعي و Ultralytics YOLO26.
يعد التعرف على الكيانات المسماة (NER) مهمة فرعية أساسية في معالجة اللغات الطبيعية (NLP) تتضمن تحديد وتصنيف المعلومات الرئيسية داخل النصوص غير المهيكلة. في سير العمل النموذجي، يقوم نموذج NER بمسح مستند لتحديد "الكيانات"—وهي كلمات أو عبارات محددة تمثل أشياء في العالم الحقيقي—وتعيينها إلى فئات محددة مسبقًا مثل أسماء الأشخاص، أو المنظمات، أو المواقع، أو التواريخ، أو الرموز الطبية. تعد هذه العملية ضرورية لتحويل البيانات غير المهيكلة الخام، مثل رسائل البريد الإلكتروني، وآراء العملاء، والمقالات الإخبارية، إلى تنسيقات مهيكلة يمكن للآلات معالجتها وتحليلها. من خلال الإجابة على أسئلة "من، وماذا، وأين" المتعلقة بالنص، تُمكّن تقنية NER أنظمة الذكاء الاصطناعي (AI) من استخراج رؤى ذات مغزى من كميات هائلة من المعلومات تلقائيًا.
Link to this sectionكيف تعمل تقنية NER#
تستفيد أنظمة NER الحديثة من النماذج الإحصائية المتقدمة وتقنيات التعلم العميق (DL) لفهم السياق المحيط بالكلمة. تبدأ العملية بـ الترميز، حيث يتم تقسيم الجملة إلى وحدات فردية تسمى الرموز (tokens). بعد ذلك، تقوم بنى متطورة، مثل Transformer، بتحليل العلاقات بين هذه الرموز لتحديد معناها بناءً على الاستخدام.
على سبيل المثال، يمكن أن تشير كلمة "Apple" إلى فاكهة أو شركة تكنولوجيا اعتمادًا على الجملة. ومن خلال آليات مثل الانتباه الذاتي، يدرك نموذج NER أن عبارة "أطلقت Apple هاتفًا جديدًا" تشير إلى منظمة، بينما تشير عبارة "أكلت تفاحة" (apple) إلى كائن عام. يعتمد أداء هذه النماذج بشكل كبير على بيانات التدريب عالية الجودة وتوسيم البيانات الدقيق. في التطبيقات متعددة الوسائط، غالبًا ما يتم إقران NER بـ التعرف الضوئي على الحروف (OCR) لاستخراج النص من الصور قبل معالجته.
Link to this sectionتطبيقات العالم الحقيقي#
تعد NER تقنية أساسية للعديد من أدوات الأتمتة الذكية المستخدمة في مختلف الصناعات.
- الذكاء الاصطناعي في الرعاية الصحية: تستخدم المؤسسات الطبية NER للتنقيب في السجلات الصحية الإلكترونية للحصول على بيانات بالغة الأهمية. فمن خلال استخراج كيانات مثل الأعراض، وأسماء الأدوية، والجرعات من الملاحظات السريرية، يمكن للباحثين تسريع اكتشاف الأدوية وتحسين رعاية المرضى.
- دعم العملاء الذكي: توظف الشركات روبوتات الدردشة المجهزة بـ NER لتصنيف شكاوى العملاء تلقائيًا. إذا أرسل مستخدم رسالة، "شاشة الكمبيوتر المحمول الخاصة بي مكسورة"، يقوم النظام بتحديد "الكمبيوتر المحمول" كمنتج و"الشاشة مكسورة" كعيب، مما يوجه التذكرة إلى فريق الدعم الفني على الفور.
- توصية المحتوى: تستخدم خدمات البث ومجمعات الأخبار تقنية NER لوسم المحتوى بكيانات ذات صلة (على سبيل المثال، الممثلون، الأنواع، المواقع). ثم تستخدم أنظمة التوصية هذه الوسوم لاقتراح أفلام أو مقالات جديدة تطابق اهتمامات المستخدم.
- التحليل المالي: تستخدم شركات الاستثمار تقنية NER لمسح آلاف التقارير المالية والمقالات الإخبارية يوميًا. ومن خلال استخراج أسماء الشركات والقيم النقدية، يمكنهم إجراء نمذجة تنبؤية للتنبؤ باتجاهات السوق.
Link to this sectionالتمييز بين NER والمفاهيم ذات الصلة#
من المفيد التمييز بين NER ومهام التفسير الأخرى لفهم دورها المحدد في خط أنابيب الذكاء الاصطناعي.
- اكتشاف الكائنات: بينما تحدد NER الكيانات في النص، يحدد اكتشاف الكائنات الكيانات في الصور. على سبيل المثال، يكتشف نموذج مرئي مثل YOLO26 السيارات والمشاة في خلاصات الفيديو، بينما تكتشف NER "فورد" و"سائق" في التقارير المكتوبة. تهدف كلتا المهمتين إلى تحديد موقع وتصنيف عناصر الاهتمام ضمن وسائط البيانات الخاصة بهما.
- تحليل المشاعر: تحدد هذه المهمة النبرة العاطفية (إيجابية، سلبية، أو محايدة) للنص. تستخرج NER ما تتم مناقشته (على سبيل المثال، "آيفون 16")، بينما يحدد تحليل المشاعر كيف يشعر المستخدم تجاهه (على سبيل المثال، "مذهل").
- فهم اللغات الطبيعية (NLU): NLU هو مصطلح شامل أوسع لاستيعاب القراءة بواسطة الآلة. تعد NER مكونًا محددًا لـ NLU يعمل غالبًا جنبًا إلى جنب مع تصنيف القصد لفهم معنى مدخلات المستخدم بالكامل.
- استخراج الكلمات المفتاحية: على عكس NER، التي تصنف الكلمات إلى فئات دلالية (على سبيل المثال، شخص، تاريخ)، يقوم استخراج الكلمات المفتاحية ببساطة بتحديد المصطلحات الأكثر تكرارًا أو صلة في المستند دون فهم نوع الكيان الخاص بها.
Link to this sectionالجمع بين NER والرؤية الحاسوبية#
يعد تقارب النص والرؤية اتجاهًا متناميًا في التعلم متعدد الوسائط. تسد نماذج مثل YOLO-World هذه الفجوة باستخدام مطالبات نصية لتوجيه اكتشاف الكائنات. في سير العمل هذا، يعمل مشفر النص بشكل مشابه لنظام NER، حيث يفسر المعنى الدلالي لأسماء الفئات (الكيانات) التي يقدمها المستخدم للعثور على الكائنات المرئية المقابلة.
يوضح مثال Python التالي كيفية استخدام مكتبة ultralytics لاكتشاف الكائنات بناءً على أوصاف نصية مخصصة، مما يربط كيانات اللغة الطبيعية بالبيانات المرئية بشكل فعال.
from ultralytics import YOLOWorld
# Load a YOLO-World model capable of understanding text-based entities
model = YOLOWorld("yolov8s-world.pt")
# Define custom entities to search for in the image
# The model interprets these text strings to identify visual matches
model.set_classes(["red backpack", "person wearing hat", "dog"])
# Run inference on an image to localize these entities
results = model.predict("park_scene.jpg")
# Display the results with bounding boxes around detected entities
results[0].show()Link to this sectionالأدوات والتنفيذ#
يتمتع المطورون بإمكانية الوصول إلى نظام بيئي قوي من الأدوات لتنفيذ NER. توفر مكتبات مفتوحة المصدر شائعة مثل spaCy وNLTK مسارات عمل مدربة مسبقًا للاستخدام الفوري. بالنسبة للتطبيقات على مستوى المؤسسات، تقدم الخدمات السحابية مثل Google Cloud Natural Language واجهات برمجة تطبيقات مدارة تتوسع مع الطلب.
تتطلب إدارة دورة حياة نماذج الذكاء الاصطناعي هذه—سواء للنص أو الرؤية—عمليات فعالة. تبسط منصة Ultralytics عمليات MLOps هذه، حيث توفر بيئة موحدة لإدارة مجموعات البيانات، وتدريب النماذج، ونشر الحلول. يضمن هذا بقاء مشاريع الذكاء الاصطناعي قابلة للتطوير وجاهزة للإنتاج، مما يدعم التحسين المستمر لنماذج مثل YOLO26 لتحقيق أداء متطور.






