التعرف على الكيانات المسماة (NER)
أطلق العنان للرؤى باستخدام التعرف على الكيانات المسماة (NER). اكتشف كيف يحول الذكاء الاصطناعي النصوص غير المنظمة إلى بيانات قابلة للتنفيذ لتطبيقات متنوعة.
يعد التعرف على الكيانات المسماة (NER) مهمة فرعية بالغة الأهمية في مجال
معالجة اللغات الطبيعية (NLP)
والتي تركز على تحديد وتصنيف كيانات محددة ضمن نص غير منظم. من خلال تحليل تسلسل
من الكلمات، تقوم خوارزميات NER بتحليل تسلسل الكلمات، حيث تقوم خوارزميات NER بتحديد موقع العناصر وتصنيفها إلى مجموعات محددة مسبقًا مثل الأسماء الشخصية والمنظمات
والمواقع والرموز الطبية والتعبيرات الزمنية والقيم النقدية. تقوم هذه العملية بتحويل النص الخام إلى
معلومات منظمة، مما يمكّن
أنظمة الذكاء الاصطناعي (AI) من
فهم "من وماذا وأين" في المستند. نظرًا لاعتماد المؤسسات بشكل متزايد على كميات هائلة من
من البيانات، تُعدّ عملية NER خطوة أساسية في تحويل
البيانات غير المهيكلة إلى رؤى قابلة للتنفيذ من أجل
التحليلات والأتمتة.
كيف يعمل التعرف على الكيانات المسماة
تعتمد تقنية NER في جوهرها على النماذج الإحصائية و
تقنيات التعلّم الآلي (ML) لتمييز
الأنماط اللغوية. استخدمت الأنظمة المبكرة مناهج وقواميس قائمة على القواعد، ولكن التطبيقات الحديثة
تستخدم في الغالب التعلم العميق (DL) و
والشبكات العصبية (NN). هذه النماذج المتقدمة
على مجموعات ضخمة من النصوص المشروحة، مما يسمح لها بتعلم القرائن السياقية والسمات اللغوية.
وغالبًا ما تستفيد أحدث أنظمة NER الحديثة من
بنيات المحولات، مثل تلك الموجودة في
نماذج اللغات الكبيرة (LLMs). من خلال توظيف
آليات مثل الانتباه الذاتي، تقوم هذه النماذج بتحليل
العلاقة بين الكلمات عبر جملة كاملة، مما يحسن الدقة بشكل كبير مقارنةً بالطرق القديمة. يعتمد
يعتمد أداء نظام NER بشكل كبير على جودة
بيانات التدريب ودقة عملية شرح
عملية الشرح الأولي للبيانات.
تطبيقات واقعية
تعمل NER كعمود فقري للعديد من التطبيقات الذكية في مختلف الصناعات.
-
الرعاية الصحية والتحليل الطبي الحيوي: في المجال الطبي، تستخرج NER البيانات الأساسية من الملاحظات السريرية
السريرية والأوراق البحثية، مثل الأعراض وأسماء الأدوية والجرعات. تدعم هذه الإمكانية
الذكاء الاصطناعي في مجال الرعاية الصحية من خلال تبسيط إدارة سجلات المرضى
إدارة سجلات المرضى وتسهيل إجراء
الدراسات الوبائية على نطاق واسع.
-
البحث المحسّن والتوصيات: تستخدم محركات البحث طريقة البحث والتوصية المحسّنة لفهم مقصد المستخدم من وراء
استعلام المستخدم. من خلال تحديد كيانات مثل "Nike" (العلامة التجارية) و"أحذية الجري" (فئة المنتج
الفئة)، يمكن للمنصات تقديم
نتائج بحث دلالية دقيقة. وبالمثل
تستخدم أنظمة التوصيات الكيانات المستخرجة
المستخرجة لاقتراح محتوى أو منتجات تتوافق مع اهتمامات المستخدم.
-
دعم العملاء الآلي: تستخدم منصات خدمة العملاء نظام دعم العملاء الآلي لتوجيه تذاكر الدعم
تلقائياً. يسمح التعرّف على كيانات مثل نماذج المنتجات أو تواريخ الضمان بما يلي
لروبوتات الدردشة الآلية بمعالجة مشاكل المستخدم على الفور أو تصعيدها
إلى الوكيل البشري المناسب، مما يحسّن من تجربة
تجربة العملاء بشكل عام.
تطبيق NER مع Python
في حين أن Ultralytics متخصصة في الرؤية الحاسوبية، فإن سير العمل لنشر نماذج تعلّم الآلة يظل متسقًا عبر
المجالات. بالنسبة لمهام NER المستندة إلى النصوص، غالبًا ما يستخدم المطورون مكتبات راسخة مثل
مثل spaCy. يوضح المثال التالي كيفية تحميل نموذج مُدرَّب مسبقًا واستخراج
الكيانات من جملة.
import spacy
# Load the pre-trained English pipeline (requires: python -m spacy download en_core_web_sm)
nlp = spacy.load("en_core_web_sm")
# Process a text string containing entities
text = "Ultralytics launched YOLO11 in Madrid during 2024."
doc = nlp(text)
# Iterate over identified entities and print their labels
for ent in doc.ents:
print(f"Entity: {ent.text} | Label: {ent.label_}")
# Output examples: 'Ultralytics' (ORG), 'Madrid' (GPE), '2024' (DATE)
NER مقابل المفاهيم ذات الصلة
من المهم التمييز بين NER وتفسيرات الذكاء الاصطناعي الأخرى للبيانات، خاصةً عند تصميم
المعقدة.
-
اكتشاف الكائنات: في حين أن NER
يحدد الكيانات في النص، فإن اكتشاف الكائنات يحدد الكيانات (الكائنات) في الصور أو الفيديو.
نماذج مثل YOLO11 تقوم بمكافئ بصري ل NER من خلال
من خلال رسم مربعات محدّدة حول الأجسام مثل السيارات أو
أو الأشخاص. تهدف كلتا المهمتين إلى هيكلة البيانات غير المهيكلة - إحداهما تستخدم البيكسلات، والأخرى تستخدم الرموز.
-
تحليل المشاعر: هذه المهمة
تصنّف النبرة العاطفية للنص (إيجابية، سلبية، محايدة). تستخرج NER ما تتم مناقشته
(على سبيل المثال، "آيفون")، في حين أن تحليل المشاعر يحدد شعور الكاتب حيال ذلك.
-
فهم اللغة الطبيعية (NLU):
NLU هو مصطلح شامل أوسع نطاقًا يشمل فهم القراءة الآلية. تعد NER مكونًا محددًا من مكونات NLU,
إلى جانب مهام مثل تصنيف المقاصد واستخراج العلاقات.
-
استخراج الكلمات الرئيسية: على عكس NER، الذي يصنف الكلمات إلى فئات دلالية (على سبيل المثال، شخص,
التاريخ)، فإن استخراج الكلمات المفتاحية يحدد ببساطة أكثر المصطلحات
ذات الصلة في المستند دون فهم ما تمثله بالضرورة.
الأدوات والمنصات
يدعم النظام الإيكولوجي القوي تطوير ونشر نماذج مصادر الطاقة النووية.
-
المكتبات: توفر المكتبات مفتوحة المصدر مثل NLTK و
مجموعة ستانفورد CoreNLP توفر أدوات أساسية لمعالجة النصوص
لمعالجة النصوص. واجهات برمجة التطبيقات التجارية مثل
Google Cloud Natural Language و
Amazon Comprehend خدمات مُدارة لاستخراج الكيانات.
-
دورة حياة النموذج: تتطلب إدارة تدريب نماذج الذكاء الاصطناعي ونشرها عمليات فعالة.
تعمل منصةUltralytics على تبسيط هذه
عمليات التشغيل الآلي للذكاء الاصطناعي، حيث توفر أدوات
لإدارة مجموعات البيانات وتدريب النماذج ونشر الحلول بفعالية، مما يضمن أن تكون كل من الرؤية والنماذج المستقبلية المحتملة
النماذج متعددة الوسائط في المستقبل جاهزة للإنتاج.