التضمينات (Embeddings)
تعرّف على ماهية التضمينات وكيف تدعم الذكاء الاصطناعي من خلال التقاط العلاقات الدلالية في البيانات لمعالجة اللغات الطبيعية والتوصيات والرؤية الحاسوبية.
تعتبر التضمينات (Embeddings) حجر الزاوية في التعلم الآلي (ML) الحديث، وتمثل طريقة قوية لتحويل البيانات عالية الأبعاد مثل الكلمات أو الصور أو حتى المستخدمين إلى متجهات رقمية ذات معنى وكثيفة ومنخفضة الأبعاد. الهدف الأساسي من التضمين هو التقاط العلاقات الدلالية والسياق الأساسي للبيانات الأصلية. في هذا الفضاء المتجهي، يتم وضع العناصر ذات المعاني أو الخصائص المتشابهة بالقرب من بعضها البعض. وهذا يسمح لنماذج الذكاء الاصطناعي بأداء مهام معقدة للاستدلال والتشابه والتي ستكون مستحيلة مع البيانات الأولية غير المنظمة.
كيف يتم إنشاء التضمينات؟
عادةً ما يتم تعلم التضمينات تلقائيًا بواسطة نموذج التعلم العميق أثناء عملية التدريب. يتم تدريب شبكة عصبية، غالبًا ما يتم إنشاؤها باستخدام أطر عمل مثل PyTorch أو TensorFlow، على مهمة ذات صلة، مثل التنبؤ بالكلمة التالية في جملة أو تصنيف صورة. يتم بعد ذلك استخدام إحدى الطبقات المخفية داخل هذه الشبكة كطبقة تضمين. بينما يتعلم النموذج أداء مهمته، فإنه يضبط الأوزان في هذه الطبقة، ويتعلم بشكل فعال تعيين كل عنصر إدخال لمتجه يلخص أهم ميزاته. هذه العملية هي شكل من أشكال تقليل الأبعاد، وضغط كميات هائلة من المعلومات في تنسيق مضغوط ومفيد.
التطبيقات والأمثلة
تعتبر التضمينات أساسية لمجموعة واسعة من تطبيقات الذكاء الاصطناعي، من معالجة اللغة الطبيعية (NLP) إلى الرؤية الحاسوبية.
- محركات توصية التجارة الإلكترونية: تستخدم أنظمة التوصية التضمينات لتمثيل كل من المستخدمين والمنتجات. إذا كان المستخدم يشتري أو يشاهد بشكل متكرر عناصر ذات تضمينات مماثلة (مثل أنواع مختلفة من معدات الجري)، فيمكن للنظام تحديد المنتجات الأخرى في هذا الحي المتجهي (مثل المواد الهلامية للطاقة أو عبوات الترطيب) والتوصية بها. هذا أكثر فعالية بكثير من مطابقة الكلمات الرئيسية البسيطة.
- البحث الدلالي واسترجاع الصور: بدلاً من الاعتماد على العلامات أو البيانات الوصفية، تستخدم أنظمة البحث الدلالي التضمينات للعثور على نتائج بناءً على المعنى المفاهيمي. يمكن للمستخدم البحث عن "صور عطلة صيفية"، وسيقوم النظام باسترجاع صور للشواطئ والجبال ومشاهد السفر، حتى إذا لم تكن هذه الكلمات الدقيقة موجودة في وصف الصورة. يتم تشغيل هذا بواسطة نماذج مثل CLIP، التي تنشئ تضمينات متوافقة لكل من النص والصور، مما يتيح إمكانات النموذج متعدد الوسائط القوية. يسمح هذا المبدأ نفسه بالبحث المرئي القوي، وهي ميزة رئيسية في العديد من التطبيقات الحديثة. يمكنك حتى بناء الخاصة بك باستخدام دليل البحث عن التشابه الخاص بنا.
تشمل التطبيقات الأخرى اكتشاف الأدوية، حيث يتم تضمين الجزيئات للتنبؤ بالتفاعلات، وخدمات بث الموسيقى التي توصي بالأغاني ذات الميزات الصوتية المماثلة.
التضمينات مقابل المفاهيم ذات الصلة
من المفيد التمييز بين التضمينات والمصطلحات ذات الصلة:
- التضمينات مقابل استخلاص الميزات: التضمينات هي شكل متطور وغالبًا ما يكون آليًا لاستخلاص الميزات يتم تحقيقه من خلال التعلم العميق. في حين أن هندسة الميزات التقليدية قد تتضمن تحديد الميزات يدويًا (مثل المدرجات التكرارية للألوان للصور)، فإن التضمينات تتعلم الميزات ذات الصلة مباشرةً من البيانات أثناء التدريب.
- التضمينات مقابل البحث المتجهي / قواعد البيانات المتجهة: التضمينات هي تمثيلات متجهية لعناصر البيانات. البحث المتجهي هو عملية الاستعلام عن مجموعة من التضمينات للعثور على التضمينات الأكثر تشابهًا (الأقرب) لمتجه استعلام، غالبًا باستخدام خوارزميات أقرب جار تقريبي (ANN) لتحقيق الكفاءة. قواعد البيانات المتجهة (مثل Pinecone أو Milvus) هي قواعد بيانات متخصصة مُحسَّنة لتخزين وفهرسة وإجراء عمليات بحث متجهية سريعة على كميات كبيرة من التضمينات.
- التضمينات مقابل الترميز: الترميز هو عملية تقسيم النص إلى وحدات أصغر (رموز). ثم يتم تعيين هذه الرموز إلى تضمينات. لذلك، فإن الترميز هو خطوة أولية قبل إنشاء أو استرداد تمثيل التضمين. تعتمد نماذج البرمجة اللغوية العصبية البارزة مثل BERT و GPT-4 على هذه العملية المكونة من خطوتين.
توفر التضمينات طريقة قوية لتمثيل البيانات لنماذج التعلم الآلي، مما يمكنها من فهم أوجه التشابه الدلالي والأنماط المعقدة في أنواع البيانات المتنوعة. إنها جزء لا يتجزأ من قدرات منصات التعلم الآلي الحديثة مثل Ultralytics HUB، والتي تبسط إنشاء نماذج الذكاء الاصطناعي المتقدمة لمهام مثل اكتشاف الكائنات و تصنيف الصور.