مسرد المصطلحات

التعرف على الكيانات المسماة (NER)

استكشف الرؤى باستخدام ميزة التعرّف على الكيانات المسماة (NER). اكتشف كيف يقوم الذكاء الاصطناعي بتحويل النصوص غير المهيكلة إلى بيانات قابلة للتنفيذ لتطبيقات متنوعة.

التعرف على الكيانات المسماة (NER) هي مهمة أساسية في معالجة اللغات الطبيعية (NLP ) تتضمن تحديد وتصنيف الكيانات المسماة في نص غير منظم تلقائيًا إلى فئات محددة مسبقًا. يمكن أن تكون هذه الكيانات أي شيء في العالم الحقيقي، مثل الأشخاص أو المنظمات أو المواقع أو التواريخ أو الكميات أو القيم النقدية. ويتمثل الهدف الأساسي من NER في استخراج معلومات منظمة من نص غير منظم، مما يسهل على الآلات فهم اللغة البشرية ومعالجتها. ومن خلال تحويل النص الخام إلى صيغة قابلة للقراءة الآلية، تُعدّ NER خطوة أساسية للعديد من تطبيقات الذكاء الاصطناعي ذات المستوى الأعلى، بما في ذلك استرجاع المعلومات والإجابة عن الأسئلة وتحليل المحتوى.

عادةً ما يتم بناء أنظمة NER الحديثة باستخدام نماذج التعلّم الآلي، خاصةً نماذج التعلّم العميق. يتم تدريب هذه النماذج على مجموعات بيانات كبيرة ومشروحة حيث قام البشر بالفعل بتصنيف الكيانات. من خلال بيانات التدريب هذه، يتعلم النموذج التعرف على الأنماط السياقية والسمات اللغوية المرتبطة بأنواع الكيانات المختلفة. تعتبر النماذج المتقدمة مثل BERT وغيرها من البنى القائمة على المحولات فعالة للغاية في NER لأنها تستطيع معالجة سياق الجملة بالكامل لإجراء تنبؤات دقيقة.

التطبيقات الواقعية

تعد تقنية NER تقنية أساسية تدعم العديد من التطبيقات في مختلف الصناعات. ومن خلال هيكلة المعلومات، فإنها تتيح الأتمتة وتوفر رؤى قيمة.

  • التوصية بالمحتوى والبحث عنه: يستخدم مزوّدو الأخبار ومنصات المحتوى تقنية NER لفحص المقالات وتحديد الأشخاص والأماكن والموضوعات الرئيسية، ثم وضع علامات على المحتوى وفقًا لذلك. وهذا يحسن من ملاءمة نتائج البحث ويدعم محركات التوصية بالمحتوى المخصص. على سبيل المثال، يمكن للنظام تحديد "شركة Apple Inc." كمؤسسة و"تيم كوك" كشخص، وربط المقالات المتعلقة بكليهما. وهذا عنصر أساسي في تعزيز قدرات البحث الدلالي.
  • الذكاء الاصطناعي في الرعاية الصحية: في المجال الطبي، تُستخدم تقنية NER لاستخراج المعلومات الهامة من الملاحظات السريرية والأوراق البحثية وسجلات المرضى. ويمكنه تحديد أسماء المرضى وأمراضهم وأعراضهم وأدويتهم وجرعاتهم. هذه البيانات المنظمة ضرورية لتسريع تحليل الصور الطبية، وتبسيط مطابقة التجارب السريرية، وبناء رسوم بيانية معرفية شاملة للأبحاث الطبية.
  • أتمتة دعم العملاء: تستخدم روبوتات الدردشة الآلية وأنظمة الدعم نموذج التعرف على مصادر الطاقة النظيفة لفهم استفسارات المستخدم بشكل أكثر فعالية. على سبيل المثال، في جملة "شاشة هاتفي iPhone 15 متصدعة"، سيحدد نموذج NER "iPhone 15" كمنتج و"الشاشة المتصدعة" كمشكلة. وهذا يسمح للنظام بتصنيف التذكرة تلقائيًا وتوجيهها إلى قسم الدعم الصحيح، مما يحسن الكفاءة.

وحدة خفض الانبعاثات الصفرية مقابل المفاهيم ذات الصلة

وغالبًا ما تُستخدم NER جنبًا إلى جنب مع مهام البرمجة اللغوية العصبية الأخرى ولكن لها تركيزًا مميزًا:

  • تحليل المشاعر: يحدد النبرة العاطفية (إيجابية، سلبية، محايدة) المعبر عنها في النص. تحدد NER ما تتم مناقشته، بينما يحدد تحليل المشاعر كيف يشعر المؤلف حيال ذلك.
  • استخراج الكلمات المفتاحية: تحدد هذه المهمة المصطلحات أو العبارات المهمة في النص. في حين أن بعض الكلمات المفتاحية يمكن أن تكون كيانات مسماة، إلا أن استخراج الكلمات المفتاحية أوسع نطاقًا وأقل تنظيمًا. تحدد NER على وجه التحديد الكيانات وتصنفها إلى فئات محددة مسبقًا مثل PERSON أو LOCATION. يمكنك معرفة المزيد عن هذا الأمر على مصادر استخراج الكلمات المفتاحية.
  • اكتشاف الأجسام: هذه مهمة من مهام الرؤية الحاسوبية (CV) التي تحدد الأجسام داخل الصور وتحدد موقعها باستخدام تقنيات مثل المربعات المحدودة. تعمل NER على البيانات النصية فقط، بينما تقوم نماذج مثل Ultralytics YOLO بالكشف على البيانات المرئية لمختلف مهام الكشف.
  • فهم اللغة الطبيعية (NLU): مجال أوسع نطاقًا يشمل الفهم الشامل لمعنى النص، بما في ذلك التعرف على المقاصد واستخراج العلاقات. تعتبر NER مهمة فرعية محددة داخل NLU تركز فقط على تحديد الكيانات وتصنيفها.
  • تلخيص النص: يهدف هذا إلى إنشاء ملخص موجز موجز لوثيقة طويلة. وعلى الرغم من أنه قد يستخدم تقنية NER لتحديد الكيانات الرئيسية لتضمينها في الملخص، إلا أن هدفه الأساسي هو التكثيف وليس الاستخراج.

الأدوات والمنصات

يدعم نظام بيئي قوي من الأدوات والمكتبات تطوير نماذج NER.

  • المكتبات: تُستخدم المكتبات مفتوحة المصدر مثل spaCy و NLTK على نطاق واسع وتوفر نماذج وأدوات مدربة مسبقًا لبناء أنظمة NER مخصصة. وتتعامل هذه المكتبات مع المهام المعقدة مثل الترميز واستخراج الميزات.
  • المنصات: يوفر مركز تعانق الوجوه الآلاف من النماذج المدربة مسبقاً، بما في ذلك العديد من النماذج الخاصة بالتقارير الصفرية، والتي يمكن ضبطها بدقة لحالات استخدام محددة. ولإدارة دورة حياة النموذج من البداية إلى النهاية، توفر منصات مثل Ultralytics HUB قدرات قوية في عمليات التشغيل الآلي المتعدد النماذج، بدءًا من التدريب والتحقق من الصحة وحتى النشر النهائي للنموذج. في حين أن Ultralytics متخصصة في السيرة الذاتية، فإن مبادئ عمليات التشغيل الآلي المتكاملة عالمية في جميع مجالات الذكاء الاصطناعي. يمكنك العثور على مزيد من التفاصيل في وثائقنا.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون ونمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة