Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

التضمينات (Embeddings)

تعرّف على ماهية التضمينات وكيف تدعم الذكاء الاصطناعي من خلال التقاط العلاقات الدلالية في البيانات لمعالجة اللغات الطبيعية والتوصيات والرؤية الحاسوبية.

التضمينات هي تمثيلات متجهة كثيفة ومنخفضة الأبعاد ومستمرة للمتغيرات المنفصلة، وهي بمثابة تنسيق البيانات الأساسية في الذكاء الاصطناعي الحديث. على عكس التمثيلات المتفرقة مثل الترميز أحادي البعد، والتي يمكن أن تؤدي إلى متجهات ضخمة وغير فعالة, تلتقط التضمينات العلاقات الدلالية والمعنى الأساسي للبيانات عن طريق تعيين المدخلات عالية الأبعاد عالية الأبعاد - مثل الكلمات أو الصور أو الصوت - إلى فضاء رقمي مضغوط. في هذا الفضاء المتجه المكتسب، العناصر التي تشترك في الخصائص أو السياقات المتشابهة تقع على مقربة من بعضها البعض، مما يتيح التعلم الآلي (ML) نماذج من فهم الأنماط المعقدة ومعالجتها بشكل حدسي.

كيف تعمل التضمينات

المفهوم الأساسي وراء التضمينات هو ترجمة البيانات الأولية إلى شكل رياضي يمكن لأجهزة الكمبيوتر معالجته بكفاءة. تتضمن هذه العملية عادةً شبكة عصبية (NN) التي تتعلم تحويل المدخلات إلى متجهات من الأعداد الحقيقية. أثناء عملية تدريب النموذج تعدّل الشبكة هذه المتجهات بحيث تتوافق المسافة بينها مع تشابه العناصر التي تمثلها.

على سبيل المثال، في معالجة اللغة الطبيعية (NLP)فإن التضمينات لكلمتي "ملك" و"ملكة" ستكون أقرب رياضيًا إلى بعضها البعض من كلمة "تفاحة"، مما يعكس العلاقة الدلالية بينهما. هذا التحويل هو شكل من أشكال تقليل الأبعادوالذي يحافظ على المعلومات الأساسية مع التخلص من الضوضاء، مما يجعل المهام النهائية مثل التصنيف أو أو التجميع أكثر فعالية بشكل كبير.

الإنشاء والتدريب

عادةً ما يتم إنشاء التضمينات كمنتج ثانوي للتدريب التعلم العميق (DL) على على مجموعات بيانات كبيرة. أطر عمل مثل PyTorch و TensorFlow طبقات مصممة خصيصًا مصممة خصيصًا لتعلم هذه التمثيلات.

  1. التهيئة: غالبًا ما تتم تهيئة متجهات التضمين بقيم عشوائية.
  2. التعلّم: عندما يتحسن النموذج لهدف معين - مثل التنبؤ بالكلمة التالية في أو تحديد الأشياء في صورة ما، فإن أوزان النموذج المرتبطة بطبقة التضمين بطبقة التضمين.
  3. النتيجة: تعمل الأوزان المكتسبة النهائية المستفادة كجدول بحث التضمين، حيث يتوافق كل رمز أو يتوافق مع متجه كثيف محدد.

يمكنك إنشاء تضمينات للصور باستخدام معيار رؤية الكمبيوتر (CV) القياسية القياسية. يوضّح مقتطف Python التالي كيفية استخراج التضمينات من صورة باستخدام مقتطفات مُدرّبة مسبقًا Ultralytics YOLO11 المدرّب مسبقًا.

from ultralytics import YOLO

# Load a YOLO11 classification model
model = YOLO("yolo11n-cls.pt")

# Generate embeddings for an image from a URL
# The embed() method specifically returns the feature vector
embedding_vector = model.embed("https://ultralytics.com/images/bus.jpg")

# Output the shape of the embedding (e.g., a vector of length 1280)
print(f"Embedding shape: {embedding_vector[0].shape}")

تطبيقات واقعية

لقد أحدثت عمليات التضمين ثورة في كيفية تعامل الأنظمة مع البيانات غير المهيكلة، مما أدى إلى تشغيل قدرات كانت في السابق مستحيلة من قبل.

  • محركات البحث الدلالي: تعتمد محركات البحث التقليدية على مطابقة الكلمات المفتاحية، والتي غالبًا ما تفشل عندما تستخدم الاستعلامات مرادفات. البحث الدلالي يستفيد من التضمينات لمطابقة القصد من الاستعلام مع محتوى المستندات أو الصور. من خلال مقارنة المسافة بين تضمين الاستعلام وتضمين المستندات، يسترجع النظام النتائج ذات الصلة من الناحية المفاهيمية ذات صلة، حتى لو لم تتشارك نفس الكلمات بالضبط.
  • أنظمة التوصيات المخصصة: تستخدم منصات مثل نيتفليكس أو أمازون التضمينات لنمذجة تفضيلات المستخدم التفضيلات وخصائص العناصر. إذا شاهد المستخدم فيلم خيال علمي، فإن نظام التوصيات أن يقترح اقتراح أفلام أخرى ذات متجهات تضمين مماثلة. هذا النهج، الذي غالبًا ما يتم تنفيذه باستخدام أقرب جار خوارزميات في قاعدة بيانات المتجهاتبكفاءة إلى ملايين العناصر.
  • التعلّم من الصفر: النماذج المتقدمة مثل CLIP تعلم التضمينات المشتركة للنصوص والصور. وهذا يسمح للنظام classify الصور التي لم يسبق له رؤيتها أثناء من خلال مقارنة تضمين الصورة مع تضمين النص لأسماء الفئات، وهي تقنية تُعرف باسم تعلّم اللقطة الصفرية.

التضمينات مقابل المفاهيم ذات الصلة

يعد فهم التمييز بين التضمينات والمصطلحات ذات الصلة أمرًا بالغ الأهمية للتنقل في مشهد الذكاء الاصطناعي.

  • التضمين مقابل استخراج السمات: بينما يتضمن كلاهما تحويل البيانات إلى ميزات رقمية, استخراج السمات يمكن أن يشير إلى التقنيات اليدوية (مثل اكتشاف الحواف) أو الآلية. التضمينات هي نوع محدد من الاستخراج الآلي للسمات المكتسبة الآلي الذي ينتج عنه متجهات كثيفة، وغالبًا ما تُستخدم كمدخلات لنماذج أخرى أو لمهام التشابه.
  • التضمينات مقابل البحث في المتجهات: التضمين هو بنية البيانات (المتجه نفسه). البحث عن المتجهات هو عملية الاستعلام عن مجموعة من هذه التضمينات للعثور على عناصر متشابهة. تقنيات مثل بينيكون أو ميلفوس مصممة لتخزين التضمينات وإجراء هذا البحث بكفاءة.
  • التضمين مقابل الترميز: في معالجة النصوص, الترميز هي خطوة تقسيم النص إلى وحدات أصغر تسمى الرموز. هذه الرموز هي معرّفات منفصلة (أعداد صحيحة) تبحث عن متجهات التضمين المقابلة. وهكذا, يسبق الترميز استرجاع التضمينات في خط الأنابيب.

من خلال تحويل المفاهيم المجردة إلى متجهات رياضية، تعمل التضمينات على سد الفجوة بين الحدس البشري و والمنطق الآلي، مما يمكِّن المتطورة للتعرف على الأنماط المتطورة التي نراها في تطبيقات الذكاء الاصطناعي الأكثر تقدماً اليوم.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن