مسرد المصطلحات

الرمز المميز

تعلّم كيف تعمل الرموز، وهي اللبنات الأساسية لنماذج الذكاء الاصطناعي، على تشغيل البرمجة اللغوية العصبية والرؤية الحاسوبية ومهام مثل تحليل المشاعر واكتشاف الأشياء.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

في مجال الذكاء الاصطناعي والتعلم الآلي ( AI) ، خاصةً في مجال معالجة اللغات الطبيعية (NLP) وبشكل متزايد في مجال الرؤية الحاسوبية، يمثل "الرمز المميز" أصغر وحدة من البيانات التي يعالجها النموذج. فكّر في الرموز على أنها وحدات البناء الأساسية التي تستخدمها نماذج الذكاء الاصطناعي لفهم المعلومات وتحليلها، سواء كانت نصوصًا أو صورًا أو أشكالًا أخرى من البيانات. وهي ضرورية لتحويل المدخلات الأولية إلى صيغة يمكن للخوارزميات تفسيرها والتعلم منها، مما يشكل الأساس للعديد من مهام الذكاء الاصطناعي المعقدة.

فهم الرموز المميزة

الرموز هي المخرجات المنفصلة لعملية تسمى الترميز. في البرمجة اللغوية العصبية، على سبيل المثال، يمكن تحويل جملة مثلUltralytics YOLO سريع ودقيق" إلى كلمات فردية: ["Ultralytics", "YOLO", "is", "fast", "and", "accurate"]. واعتمادًا على استراتيجية الترميز المحددة، يمكن أن تكون الرموز أيضًا وحدات كلمات فرعية (على سبيل المثال، "ألترا" أو "ليكيتكس") أو حتى أحرف فردية. يحول هذا التقسيم النص المستمر أو البيانات المعقدة إلى أجزاء يمكن التحكم فيها.

والسبب في أهمية الرموز هو أن معظم نماذج التعلّم العميق، بما في ذلك البنى القوية مثل المحولات المستخدمة في العديد من أنظمة الذكاء الاصطناعي الحديثة، لا يمكنها معالجة البيانات الخام غير المنظمة مباشرةً. فهي تتطلب مدخلات بصيغة منظمة، غالباً ما تكون رقمية. يوفر الترميز هذا الجسر. بمجرد ترميز البيانات، عادةً ما يتم تعيين كل رمز رمزي إلى تمثيل رقمي، مثل معرّف في مفردة، أو بشكل أكثر شيوعًا، تمثيلات متجهة كثيفة تسمى التضمينات. تلتقط هذه التضمينات العلاقات الدلالية بين الرموز التي تتعلمها النماذج أثناء التدريب.

طرق الترميز

توجد طرق مختلفة لتقسيم البيانات إلى رموز:

  • الترميز المستند إلى الكلمات: يقسم النص بناءً على المسافات وعلامات الترقيم. بسيطة ولكنها تواجه صعوبات مع المفردات الكبيرة والكلمات غير المعروفة.
  • الترميز القائم على الأحرف: يستخدم أحرفًا فردية كرموز. يتعامل مع أي كلمة ولكن ينتج عنه تسلسلات طويلة جدًا.
  • ترميز الكلمات الفرعية: توازن بين أساليب الكلمات والحروف. تقوم تقنيات مثل ترميز أزواج البايتات (BPE) أو ترميز الكلمات الفرعية (WordPiece ) بتقسيم الكلمات إلى وحدات فرعية مشتركة، والتعامل بكفاءة مع المفردات الكبيرة والكلمات النادرة. تُستخدم هذه التقنيات على نطاق واسع في نماذج اللغات الكبيرة (LLMs).

الرموز المميزة مقابل المفاهيم ذات الصلة

من المهم التمييز بين الرموز والمصطلحات ذات الصلة:

  • الرمز المميز مقابل الترميز: الرمز المميز هو وحدة الإخراج (على سبيل المثال،Ultralytics"، "رقعة الصورة")، في حين أن الترميز هو عملية إنشاء هذه الوحدات من البيانات الخام.
  • الرمز المميز مقابل التضمين: الرمز المميز هو وحدة منفصلة من المدخلات. أما التضمين فهو عادةً متجه رقمي كثيف يمثل الرمز المميز، ويوضح معناه بطريقة يمكن للنموذج فهمها. غالبًا ما يتم تحويل الرموز إلى تضمينات كلمات أو تضمينات مرئية قبل إدخالها في النموذج.

تطبيقات الرموز المميزة

تعتبر الرموز أساسية في مختلف مجالات الذكاء الاصطناعي. فيما يلي مثالان ملموسان:

  1. الترجمة الآلية: في خدمات مثل خدمة الترجمةGoogle Translate، يتم أولاً ترميز الجملة المدخلة بلغة واحدة. تتم معالجة هذه الرموز الرمزية بواسطة نموذج تحويل من تسلسل إلى تسلسل (غالبًا ما يكون محولاً)، والذي يقوم بعد ذلك بإنشاء رموز تمثل الجملة المترجمة في اللغة الهدف. يؤثر اختيار الترميز بشكل كبير على دقة الترجمة وطلاقتها. تعتمد الآليات اللغوية الخفيفة مثل GPT-4 و BERT بشكل كبير على معالجة الرموز في مهام تشمل الترجمة وتوليد النصوص وتحليل المشاعر. تتضمن تقنيات مثل ضبط المطالبات وتسلسل المطالبات معالجة تسلسل الرموز الرمزية للمدخلات لتوجيه سلوك النموذج.

  2. الرؤية الحاسوبية مع المحولات: على الرغم من ارتباط الرموز تقليديًا بالبرمجة اللغوية العصبية، إلا أنها أصبحت الآن أساسية في نماذج الرؤية الحاسوبية المتقدمة مثل محولات الرؤية (ViTs). في محولات الرؤية، يتم تقسيم الصورة إلى رقع ثابتة الحجم وغير متداخلة (على سبيل المثال، 16 × 16 بكسل). يتم التعامل مع كل رقعة على أنها "رمز مرئي". يتم تضمين هذه الرموز المميزة خطيًا وتغذيتها في بنية المحولات، والتي تستخدم آليات الانتباه لتحليل العلاقات بين الأجزاء المختلفة من الصورة. يُستخدم هذا النهج في مهام مثل تصنيف الصور واكتشاف الأجسام وتجزئة الصور. تستخدم نماذج مثل نموذج تجزئة أي شيء (SAM ) هذا النهج القائم على الرمز المميز. حتى في النماذج التلافيفية مثل Ultralytics YOLOv8 أو الأحدث Ultralytics YOLO11يمكن النظر إلى نظام خلايا الشبكة المستخدم في الكشف على أنه شكل ضمني من أشكال الترميز المكاني.

يعد فهم الرموز أمرًا أساسيًا لفهم كيفية تفسير نماذج الذكاء الاصطناعي للمعلومات ومعالجتها. مع تطور الذكاء الاصطناعي، سيظل مفهوم الرموز المميزة وطرق إنشائها أمراً أساسياً للتعامل مع أنواع البيانات المتنوعة وبناء نماذج أكثر تطوراً لتطبيقات تتراوح من تحليل الصور الطبية إلى المركبات ذاتية القيادة. وتوفر منصات مثل Ultralytics HUB أدوات لإدارة مجموعات البيانات وتدريب النماذج، وغالباً ما تتضمن بيانات مرمزة ضمنياً أو صراحةً.

قراءة الكل