تعرّف على ماهية التضمينات وكيف تدعم الذكاء الاصطناعي من خلال التقاط العلاقات الدلالية في البيانات لمعالجة اللغات الطبيعية والتوصيات والرؤية الحاسوبية.
التضمينات هي تمثيلات متجهة كثيفة ومنخفضة الأبعاد ومستمرة للمتغيرات المنفصلة، وهي بمثابة تنسيق البيانات الأساسية في الذكاء الاصطناعي الحديث. على عكس التمثيلات المتفرقة مثل الترميز أحادي البعد، والتي يمكن أن تؤدي إلى متجهات ضخمة وغير فعالة, تلتقط التضمينات العلاقات الدلالية والمعنى الأساسي للبيانات عن طريق تعيين المدخلات عالية الأبعاد عالية الأبعاد - مثل الكلمات أو الصور أو الصوت - إلى فضاء رقمي مضغوط. في هذا الفضاء المتجه المكتسب، العناصر التي تشترك في الخصائص أو السياقات المتشابهة تقع على مقربة من بعضها البعض، مما يتيح التعلم الآلي (ML) نماذج من فهم الأنماط المعقدة ومعالجتها بشكل حدسي.
المفهوم الأساسي وراء التضمينات هو ترجمة البيانات الأولية إلى شكل رياضي يمكن لأجهزة الكمبيوتر معالجته بكفاءة. تتضمن هذه العملية عادةً شبكة عصبية (NN) التي تتعلم تحويل المدخلات إلى متجهات من الأعداد الحقيقية. أثناء عملية تدريب النموذج تعدّل الشبكة هذه المتجهات بحيث تتوافق المسافة بينها مع تشابه العناصر التي تمثلها.
على سبيل المثال، في معالجة اللغة الطبيعية (NLP)فإن التضمينات لكلمتي "ملك" و"ملكة" ستكون أقرب رياضيًا إلى بعضها البعض من كلمة "تفاحة"، مما يعكس العلاقة الدلالية بينهما. هذا التحويل هو شكل من أشكال تقليل الأبعادوالذي يحافظ على المعلومات الأساسية مع التخلص من الضوضاء، مما يجعل المهام النهائية مثل التصنيف أو أو التجميع أكثر فعالية بشكل كبير.
عادةً ما يتم إنشاء التضمينات كمنتج ثانوي للتدريب التعلم العميق (DL) على على مجموعات بيانات كبيرة. أطر عمل مثل PyTorch و TensorFlow طبقات مصممة خصيصًا مصممة خصيصًا لتعلم هذه التمثيلات.
يمكنك إنشاء تضمينات للصور باستخدام معيار رؤية الكمبيوتر (CV) القياسية القياسية. يوضّح مقتطف Python التالي كيفية استخراج التضمينات من صورة باستخدام مقتطفات مُدرّبة مسبقًا Ultralytics YOLO11 المدرّب مسبقًا.
from ultralytics import YOLO
# Load a YOLO11 classification model
model = YOLO("yolo11n-cls.pt")
# Generate embeddings for an image from a URL
# The embed() method specifically returns the feature vector
embedding_vector = model.embed("https://ultralytics.com/images/bus.jpg")
# Output the shape of the embedding (e.g., a vector of length 1280)
print(f"Embedding shape: {embedding_vector[0].shape}")
لقد أحدثت عمليات التضمين ثورة في كيفية تعامل الأنظمة مع البيانات غير المهيكلة، مما أدى إلى تشغيل قدرات كانت في السابق مستحيلة من قبل.
يعد فهم التمييز بين التضمينات والمصطلحات ذات الصلة أمرًا بالغ الأهمية للتنقل في مشهد الذكاء الاصطناعي.
من خلال تحويل المفاهيم المجردة إلى متجهات رياضية، تعمل التضمينات على سد الفجوة بين الحدس البشري و والمنطق الآلي، مما يمكِّن المتطورة للتعرف على الأنماط المتطورة التي نراها في تطبيقات الذكاء الاصطناعي الأكثر تقدماً اليوم.