Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

التعرف على الكيانات المسماة (NER)

استكشف التعرف على الكيانات المسماة (NER) في معالجة اللغات الطبيعية (NLP). تعلم كيفية تحديد classify كيانات classify مثل الأسماء والتواريخ للحصول على رؤى باستخدام الذكاء الاصطناعي و Ultralytics .

التعرف على الكيانات المسماة (NER) هو مهمة فرعية أساسية من مهام معالجة اللغة الطبيعية (NLP) تتضمن تحديد وتصنيف المعلومات الأساسية داخل النصوص غير المنظمة. في سير العمل النموذجي، يقوم نموذج NER بمسح مستند لتحديد موقع "الكيانات" — وهي كلمات أو عبارات محددة تمثل كائنات في العالم الحقيقي — و تصنيفها إلى فئات محددة مسبقًا مثل أسماء الأشخاص أو المؤسسات أو المواقع أو التواريخ أو الرموز الطبية. هذه العملية ضرورية لتحويل البيانات الأولية غير المنظمة مثل رسائل البريد الإلكتروني ومراجعات العملاء و المقالات الإخبارية إلى تنسيقات منظمة يمكن للأجهزة معالجتها وتحليلها. من خلال الإجابة على "من وماذا وأين" في النص، يتيح NER لأنظمة الذكاء الاصطناعي (AI) استخراج رؤى مفيدة من كميات هائلة من المعلومات تلقائيًا.

كيف يعمل NER

تستفيد أنظمة NER الحديثة من النماذج الإحصائية المتقدمة وتقنيات التعلم العميق (DL) لفهم السياق المحيط بالكلمة. تبدأ العملية بـ الترميز، حيث يتم تقسيم الجملة إلى وحدات فردية تسمى الرموز. ثم تقوم البنى المعقدة، مثل Transformer، بتحليل العلاقات بين هذه الرموز لتحديد معناها بناءً على الاستخدام.

على سبيل المثال، يمكن أن تشير كلمة "Apple" إلى فاكهة أو شركة تكنولوجيا حسب الجملة. من خلال آليات مثل الانتباه الذاتي، يميز نموذج NER أن "Apple أطلقت هاتفًا جديدًا" يشير إلى منظمة، بينما "أكلت تفاحة" يشير إلى كائن عام. يعتمد أداء هذه النماذج بشكل كبير على بيانات تدريب عالية الجودة وتعليقات دقيقة على البيانات. في التطبيقات متعددة الوسائط، غالبًا ما يقترن NER بـ التعرف الضوئي على الحروف (OCR) لاستخراج النص من الصور قبل معالجته.

تطبيقات واقعية

NER هي تقنية أساسية للعديد من أدوات الأتمتة الذكية المستخدمة في مختلف الصناعات.

  • الذكاء الاصطناعي في الرعاية الصحية: تستخدم المؤسسات الطبية تقنية NER لاستخراج البيانات الهامة من السجلات الصحية الإلكترونية. من خلال استخراج عناصر مثل الأعراض وأسماء الأدوية والجرعات من الملاحظات السريرية، يمكن للباحثين تسريع اكتشاف الأدوية وتحسين رعاية المرضى.
  • دعم العملاء classify كي: تستخدم الشركات روبوتات الدردشة المزودة بتقنية NER لتصنيف شكاوى العملاء تلقائيًا. إذا أرسل المستخدم رسالة تقول: "شاشة الكمبيوتر المحمول الخاصة بي معطلة"، فإن النظام يحدد "الكمبيوتر المحمول" كمنتج و"الشاشة معطلة" كعيب، ويقوم بتوجيه التذكرة إلى فريق الدعم الفني على الفور.
  • توصية المحتوى: تستخدم خدمات البث ومجمعات الأخبار NER لتمييز المحتوى بعلامات الكيانات ذات الصلة (مثل الممثلين والأنواع والمواقع). ثم تستخدم أنظمة التوصية هذه العلامات لاقتراح أفلام أو مقالات جديدة تتوافق مع اهتمامات المستخدم.
  • التحليل المالي: تستخدم شركات الاستثمار NER لمسح آلاف التقارير المالية والمقالات الإخبارية يوميًا. من خلال استخراج أسماء الشركات والقيم النقدية، يمكنهم إجراء نمذجة تنبؤية للتنبؤ باتجاهات السوق .

التمييز بين NER والمفاهيم ذات الصلة

من المفيد التمييز بين NER ومهام التفسير الأخرى لفهم دورها المحدد في مسار الذكاء الاصطناعي.

  • كشف الكائنات: بينما يحدد NER الكيانات في النص، يحدد كشف الكائنات الكيانات في الصور. على سبيل المثال، يكتشف نموذج بصري مثل YOLO26 السيارات والمشاة في موجزات الفيديو، بينما يكتشف NER "فورد" و"سائق" في التقارير المكتوبة. تهدف كلتا المهمتين إلى تحديد موقع classify ذات الأهمية ضمن أنماط البيانات الخاصة بها.
  • تحليل المشاعر: تحدد هذه المهمة النبرة العاطفية (إيجابية أو سلبية أو محايدة) للنص. يستخرج NER ما يتم مناقشته (على سبيل المثال، "iPhone 16")، بينما يحدد تحليل المشاعر كيف يشعر المستخدم تجاهه (على سبيل المثال، "مذهل").
  • فهم اللغة الطبيعية (NLU): NLU هو مصطلح شامل أوسع نطاقًا يشير إلى فهم القراءة الآلية. NER هو مكون محدد من مكونات NLU يعمل غالبًا جنبًا إلى جنب مع تصنيف النوايا لفهم معنى مدخلات المستخدم بشكل كامل.
  • استخراج الكلمات المفتاحية: على عكس NER، الذي يصنف الكلمات إلى فئات دلالية (مثل شخص، تاريخ)، فإن استخراج الكلمات المفتاحية يحدد ببساطة المصطلحات الأكثر تكرارًا أو الأكثر صلة في المستند دون فهم نوع الكيان الخاص بها.

الجمع بين NER والرؤية الحاسوبية

يعد التقارب بين النص والرؤية اتجاهاً متنامياً في التعلم متعدد الوسائط. تعمل نماذج مثل YOLO على سد هذه الفجوة باستخدام مطالبات نصية لتوجيه عملية اكتشاف الكائنات. في سير العمل هذا، يعمل مشفر النص بشكل مشابه لنظام NER، حيث يفسر المعنى الدلالي لأسماء الفئات (الكيانات) التي يقدمها المستخدم للعثور على الكائنات المرئية المقابلة.

يوضّح مثال Python التالي كيفية استخدام الأداة ultralytics مكتبة detect بناءً على أوصاف نصية مخصصة، مما يربط بشكل فعال الكيانات اللغوية الطبيعية بالبيانات المرئية.

from ultralytics import YOLOWorld

# Load a YOLO-World model capable of understanding text-based entities
model = YOLOWorld("yolov8s-world.pt")

# Define custom entities to search for in the image
# The model interprets these text strings to identify visual matches
model.set_classes(["red backpack", "person wearing hat", "dog"])

# Run inference on an image to localize these entities
results = model.predict("park_scene.jpg")

# Display the results with bounding boxes around detected entities
results[0].show()

الأدوات والتنفيذ

يمكن للمطورين الوصول إلى نظام بيئي قوي من الأدوات لتنفيذ NER. توفر المكتبات مفتوحة المصدر الشهيرة مثل spaCy و NLTK خطوط إنتاج معدة مسبقًا للاستخدام الفوري. بالنسبة للتطبيقات على نطاق المؤسسات، توفر الخدمات السحابية مثل Google Natural Language واجهات برمجة تطبيقات مُدارة قابلة للتوسع وفقًا للطلب.

تتطلب إدارة دورة حياة نماذج الذكاء الاصطناعي هذه — سواء كانت للنصوص أو الرؤية — عمليات فعالة. Ultralytics على تبسيط عمليات MLOps هذه، حيث توفر بيئة موحدة لإدارة مجموعات البيانات وتدريب النماذج ونشر الحلول. وهذا يضمن بقاء مشاريع الذكاء الاصطناعي قابلة للتطوير وجاهزة للإنتاج، مما يدعم التحسين المستمر لنماذج مثل YOLO26 للحصول على أداء متطور.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن