Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

رمز

تعرف على كيفية استخدام الرموز كوحدات أساسية للمعلومات في الذكاء الاصطناعي. اكتشف دورها في معالجة اللغة الطبيعية والرؤية الحاسوبية واكتشاف المفردات المفتوحة باستخدام YOLO26.

في البنية المتطورة للذكاء الاصطناعي الحديث ، يمثل الرمز الوحدة الأساسية والجزئية للمعلومات التي يعالجها النموذج. قبل أن يتمكن الخوارزمية من تفسير جملة أو تحليل برنامج نصي أو التعرف على كائنات في صورة، يجب تقسيم البيانات الأولية المدخلة إلى هذه العناصر المنفصلة والموحدة. يعد هذا التقسيم خطوة محورية في معالجة البيانات المسبقة، حيث يحول المدخلات غير المنظمة إلى تنسيق رقمي يمكن للشبكات العصبية حسابه بكفاءة. بينما يدرك البشر اللغة على أنها تدفق مستمر للأفكار أو الصور كمشاهد بصرية سلسة، تتطلب النماذج الحسابية هذه اللبنات الأساسية الدقيقة لأداء عمليات مثل التعرف على الأنماط والتحليل الدلالي.

الرمز مقابل الترميز

لفهم آليات التعلم الآلي، من الضروري التمييز بين وحدة البيانات والعملية المستخدمة لإنشائها. هذا التمييز يمنع الالتباس عند تصميم خطوط أنابيب البيانات وإعداد مواد التدريب على Ultralytics .

  • الترميز: هو عملية حسابية (الفعل) لتقسيم البيانات الأولية إلى أجزاء. بالنسبة للنصوص، قد يتضمن ذلك استخدام مكتبات مثل مجموعة أدوات اللغة الطبيعية (NLTK) لتحديد مكان انتهاء وحدة ما وبداية أخرى .
  • الرمز: هذا هو الناتج النهائي (الاسم). وهو جزء فعلي من البيانات — مثل كلمة أو جزء من كلمة أو رقعة صورة — يتم في النهاية تعيينه إلى متجه رقمي يُعرف باسم التضمين.

الرموز المميزة في مجالات الذكاء الاصطناعي المختلفة

تختلف طبيعة الرمز بشكل كبير اعتمادًا على طريقة معالجة البيانات، خاصة بين المجالات النصية والبصرية.

الرموز النصية في البرمجة اللغوية العصبية

في مجال معالجة اللغة الطبيعية (NLP)، تعد الرموز المدخلات لنماذج اللغة الكبيرة (LLMs). كانت الطرق القديمة تعتمد بشكل صارم على الكلمات الكاملة، ولكن البنى الحديثة تستخدم خوارزميات الكلمات الفرعية مثل ترميز أزواج البايتات (BPE). تسمح هذه الطريقة للنماذج بمعالجة الكلمات النادرة عن طريق تقسيمها إلى مقاطع لفظية ذات معنى، مما يوازن بين حجم المفردات والتغطية الدلالية. على سبيل المثال، يمكن تقسيم كلمة "unhappiness" إلى "un" و"happi" و "ness".

الرموز المرئية في الرؤية الحاسوبية

توسع مفهوم الترميز إلى الرؤية الحاسوبية مع ظهور Vision Transformer (ViT). على عكس الشبكات التلافيفية التقليدية التي تعالج البكسلات في نوافذ منزلقة، تقسم Transformers الصورة إلى شبكة من البقع ذات الحجم الثابت (على سبيل المثال، 16x16 بكسل). يتم تسوية كل رقعة ومعالجتها كرمز بصري مميز. يتيح هذا النهج للنموذج استخدام آليات الانتباه الذاتي لفهم العلاقة بين الأجزاء البعيدة من الصورة، على غرار الطريقة التي طبقت بها Google في الأصل المحولات على النص.

تطبيقات واقعية

تعمل الرموز المميزة كجسر بين البيانات البشرية والذكاء الاصطناعي في عدد لا يحصى من التطبيقات.

  1. الكشف عن الكائنات ذات المفردات المفتوحة: تستخدم النماذج المتقدمة مثل YOLO نهجًا متعدد الوسائط حيث تتفاعل الرموز النصية مع الميزات المرئية. يمكن للمستخدم إدخال مطالبات نصية مخصصة (على سبيل المثال، "خوذة زرقاء")، والتي يقوم النموذج بترميزها ومطابقتها مع الكائنات الموجودة في الصورة. وهذا يتيح التعلم الفوري، مما يسمح بالكشف عن الكائنات التي لم يتم تدريب النموذج عليها بشكل صريح.
  2. الذكاء الاصطناعي التوليدي: في أنظمة توليد النصوص مثل روبوتات الدردشة، يعمل الذكاء الاصطناعي عن طريق توقع احتمالية الرمز التالي في التسلسل. من خلال الاختيار المتكرر للرمز التالي الأكثر احتمالية ، يقوم النظام ببناء جمل وفقرات متماسكة، مما يدعم أدوات تتراوح من خدمة العملاء الآلية إلى المساعدين الافتراضيين.

Python : استخدام الرموز النصية للكشف

يوضح مقتطف الشفرة التالي كيفية عمل ultralytics تستخدم الحزمة رموز نصية للتوجيه اكتشاف الأجسام. في حين أن أحدث يولو26 يوصى باستخدامه للاستدلال عالي السرعة والثابت الفئة، تسمح بنية YOLO للمستخدمين بشكل فريد بتعريف الفئات كرموز نصية في وقت التشغيل.

from ultralytics import YOLO

# Load a pre-trained YOLO-World model capable of understanding text tokens
model = YOLO("yolov8s-world.pt")

# Define specific classes; these text strings are tokenized internally
# The model will look specifically for these "tokens" in the visual data
model.set_classes(["bus", "backpack"])

# Run prediction on an image using the defined tokens
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the results showing only the tokenized classes
results[0].show()

فهم الرموز أمر أساسي للتنقل في مجال الذكاء الاصطناعي التوليدي والتحليلات المتقدمة. سواء كان ذلك لتمكين روبوت الدردشة من التحدث بطلاقة أو لمساعدة نظام الرؤية على التمييز بين فئات الكائنات الدقيقة، تظل الرموز العملة الأساسية للذكاء الآلي المستخدمة في أطر عمل مثل PyTorch و TensorFlow.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن