Embeddings
اكتشف كيف تسد التمثيلات المتجهية (embeddings) الفجوة بين بيانات الإنسان ومنطق الآلة. تعلم إنشاء تمثيلات متجهية لمهام الذكاء الاصطناعي باستخدام Ultralytics YOLO26 واستكشف منصة Ultralytics.
التضمينات هي تمثيلات متجهة كثيفة ومنخفضة الأبعاد ومستمرة للمتغيرات المنفصلة، وتعمل كمترجم أساسي بين البيانات البشرية ومنطق الآلة. في مجال الذكاء الاصطناعي (AI)، لا تستطيع أجهزة الكمبيوتر فهم البيانات غير المهيكلة المعقدة مثل النصوص أو الصور أو الصوت بشكل حدسي. تعالج التضمينات هذه المشكلة عن طريق تحويل هذه المدخلات إلى قوائم من الأرقام الحقيقية، تُعرف بالمتجهات (vectors)، والتي توجد في فضاء رياضي عالي الأبعاد. على عكس الترميز التقليدي الذي قد يعين معرفاً عشوائياً لكائن ما، يتم تعلم التضمينات من خلال التدريب، مما يضمن أن العناصر المتشابهة دلالياً - مثل كلمتي "ملك" و"ملكة"، أو صور لقطتين مختلفتين - توضع بالقرب من بعضها البعض في الفضاء المتجهي.
Link to this sectionكيف تعمل التضمينات#
يتضمن إنشاء التضمين تغذية بيانات خام إلى شبكة عصبية مصممة لغرض استخراج الميزات. أثناء التدريب، يتعلم النموذج ضغط الخصائص الأساسية للمدخلات في شكل رقمي مضغوط. على سبيل المثال، نموذج رؤية الحاسوب (CV) الذي يحلل صورة لا يرى مجرد وحدات بكسل؛ بل يحدد الأشكال والقوام والألوان في إحداثيات محددة ضمن رسم بياني متعدد الأبعاد. عند قياس التشابه، تحسب الأنظمة المسافة بين هذه الإحداثيات باستخدام مقاييس مثل تشابه جيب التمام أو المسافة الإقليدية. يسمح هذا التقارب الرياضي للخوارزميات بتنفيذ مهام معقدة مثل التصنيف والتجميع بكفاءة عالية.
Link to this sectionتطبيقات العالم الحقيقي#
تعمل التضمينات كمحرك للعديد من الميزات الذكية المستخدمة في منتجات البرمجيات الحديثة.
- البحث الدلالي: تعتمد محركات البحث التقليدية غالباً على مطابقة الكلمات الرئيسية الدقيقة، وهو ما يفشل إذا بحث المستخدم عن "سيارة" بينما يحتوي المستند على مصطلح "عربة". تلتقط التضمينات المعنى الكامن وراء الكلمات. من خلال تمثيل استعلام البحث ومستندات قاعدة البيانات كمتجهات، يمكن للنظام استرداد نتائج تطابق نية المستخدم، حتى لو اختلفت الكلمات المحددة.
- أنظمة التوصية: تستخدم خدمات البث ومواقع التجارة الإلكترونية التضمينات لتخصيص تجارب المستخدمين. إذا شاهد مستخدم فيلماً من نوع الخيال العلمي، يحدد النظام متجه التضمين الخاص بذلك الفيلم ويبحث عن أفلام أخرى ذات متجهات قريبة في قاعدة البيانات. وهذا يسمح بتقديم اقتراحات دقيقة بناءً على تشابه المحتوى بدلاً من الاعتماد فقط على العلامات أو الفئات اليدوية.
- التعلم بدون أمثلة (Zero-Shot Learning): تستخدم النماذج المتقدمة تضمينات مشتركة لربط وسائط مختلفة، مثل النص والصور. وهذا يمكن النظام من التعرف على كائنات لم يسبق له رؤيتها صراحة أثناء التدريب من خلال ربط تضمين الصورة بتضمين النص الخاص باسم الكائن.
Link to this sectionإنشاء التضمينات باستخدام Python#
يمكن استخدام نماذج متطورة مثل YOLO26 لإنشاء تضمينات صور قوية بكفاءة. يوضح المثال التالي كيفية استخراج متجه ميزة من صورة باستخدام حزمة ultralytics بلغة Python.
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Generate embeddings for an image
# The embed() method returns the feature vector representing the image content
embedding_vector = model.embed("https://ultralytics.com/images/bus.jpg")
# Print the shape of the embedding (e.g., a vector of length 1280)
print(f"Embedding shape: {embedding_vector[0].shape}")Link to this sectionالتضمينات مقابل المفاهيم ذات الصلة#
لتنفيذ حلول الذكاء الاصطناعي بفعالية، من المفيد التمييز بين التضمينات والمصطلحات التقنية ذات الصلة الوثيقة.
- التضمينات مقابل البحث المتجهي: التضمين هو تمثيل البيانات بحد ذاته (قائمة الأرقام). البحث المتجهي هو العملية اللاحقة للاستعلام عن قاعدة بيانات للعثور على أقرب الجيران لهذا التضمين. غالباً ما تُستخدم أدوات متخصصة تُعرف باسم قاعدة بيانات متجهة لتخزين هذه التضمينات والبحث فيها على نطاق واسع.
- التضمينات مقابل الترميز (Tokenization): في معالجة اللغات الطبيعية (NLP)، يُعد الترميز خطوة أولية لتقسيم النص إلى أجزاء أصغر (رموز). يتم بعد ذلك تعيين هذه الرموز إلى تضمينات. لذلك، يقوم الترميز بإعداد البيانات، بينما تمثل التضمينات معنى البيانات.
- التضمينات مقابل التعلم العميق: التعلم العميق هو المجال الأوسع لتعلم الآلة القائم على الشبكات العصبية. التضمينات هي مخرجات أو طبقة محددة داخل بنية التعلم العميق، وغالباً ما تعمل كجسر بين المدخلات الخام وطبقات اتخاذ القرار في النموذج.
يمكن للمطورين الذين يتطلعون إلى إدارة دورة حياة مجموعات بياناتهم، بما في ذلك التسمية وتدريب النماذج لإنشاء تضمينات مخصصة، الاستفادة من Ultralytics Platform. تعمل هذه الأداة الشاملة على تبسيط سير العمل بدءاً من إدارة البيانات وصولاً إلى النشر، مما يضمن أن التضمينات التي تشغل تطبيقاتك مشتقة من بيانات عالية الجودة ومنظمة بشكل جيد. سواء كنت تستخدم أطر عمل مثل PyTorch أو TensorFlow، فإن إتقان التضمينات يعد خطوة حاسمة في بناء أنظمة متطورة لـ التعرف على الأنماط.






