استكشاف التعلم الخاضع للإشراف مقابل التعلم غير الخاضع للإشراف في مجال الرؤية الحاسوبية
تعرف على الفروق بين التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف في مجال الرؤية الحاسوبية، وكيفية اختيار النهج المناسب لبياناتك وأهداف مشروعك.
تعرف على الفروق بين التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف في مجال الرؤية الحاسوبية، وكيفية اختيار النهج المناسب لبياناتك وأهداف مشروعك.
تستند الذكاء الاصطناعي (AI) إلى المفهوم الأساسي المتمثل في تعليم الآلات كيفية التعلم والتفكير بطرق تشبه الذكاء البشري. وعلى غرار الطريقة التي يتعلم بها البشر من خلال أساليب مختلفة، مثل التعليم المباشر أو من خلال ملاحظة الأنماط والتجارب، صُممت أنظمة الذكاء الاصطناعي والتعلم الآلي لتتبع هذه الأساليب نفسها.
وعلى وجه التحديد، فيما يتعلق بخوارزميات التعلم الآلي، يتم تدريب الأنظمة على التعلم من البيانات بدلاً من برمجتها بشكل صريح لكل مهمة. وبدلاً من الاعتماد على قواعد ثابتة، تحدد نماذج التعلم الآلي الأنماط الموجودة في البيانات وتستخدمها لإجراء تنبؤات أو اتخاذ قرارات.
على سبيل المثال، الرؤية الحاسوبية هي فرع من فروع الذكاء الاصطناعي والتعلم الآلي يركز على تمكين الأنظمة من تفسير وفهم المعلومات المرئية، مثل الصور ومقاطع الفيديو. بدءًا من التعرف على الأشياء وصولاً إلى تحديد الأنماط الخفية عبر مجموعات البيانات الضخمة، تعتمد هذه الأنظمة بشكل كبير على الطريقة التي يتم تدريبها بها للتعلم.
تُستخدم تقنيات تعلم متنوعة في مجال الذكاء الاصطناعي لتدريب هذه الأنظمة، اعتمادًا على نوع البيانات المتاحة والمشكلة المطلوب حلها.
تتعلم بعض نماذج الرؤية الحاسوبية من البيانات المصنفة، حيث يتم ربط كل مدخلة بالإجابة الصحيحة، أي أن كل صورة أو نقطة بيانات تأتي مصحوبة بتصنيف محدد مسبقًا يوضح للنموذج ما تمثله. وهذا يتيح للنموذج تعلم العلاقة بين المدخلة والناتج المتوقع، مما يحسن قدرته على إصدار تنبؤات دقيقة بشأن البيانات الجديدة التي لم يسبق له رؤيتها.
تتعلم نماذج الرؤية الأخرى من البيانات غير المصنفة، حيث لا تتوفر إجابات محددة مسبقًا، وتركز بدلاً من ذلك على تحديد الأنماط والعلاقات داخل البيانات نفسها. تُعرف هاتان الطريقتان على التوالي بالتعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف، وتشكلان أساس العديد من أنظمة الرؤية الحاسوبية المتطورة.
في هذا المقال، سنتناول موضوعي التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف، وكيفية استخدامهما في مجال الرؤية الحاسوبية، وكيفية اختيار النهج الأنسب لمشروع الذكاء الاصطناعي الخاص بالرؤية. فلنبدأ!
يمكنك أن تتخيل الذكاء الاصطناعي كأنه مظلة تشمل مجموعة من التقنيات التي تمكّن الآلات من أداء مهام تتطلب عادةً الذكاء البشري. وضمن هذه المظلة، يُعد التعلم الآلي مجالًا رئيسيًا يتيح للأنظمة التعلم من البيانات بدلاً من الاعتماد فقط على قواعد ثابتة.
في مجال التعلم الآلي، تحدد تقنيات التعلم المختلفة كيفية تعلم النموذج وتحسنه بمرور الوقت. تحدد مناهج مثل التعلم الخاضع للإشراف (التعلم من البيانات المصنفة ذات الإجابات الصحيحة)، والتعلم غير الخاضع للإشراف (تحديد الأنماط في البيانات غير المصنفة)، والتعلم التعزيزي (التعلم من خلال التجربة والخطأ باستخدام التغذية الراجعة أو المكافآت)، والتعلم شبه الخاضع للإشراف (الجمع بين كمية صغيرة من البيانات المصنفة وكمية كبيرة من البيانات غير المصنفة) كيفية معالجة الأنظمة للبيانات المدخلة وإنشاء البيانات المخرجة.

وعلى وجه الخصوص، تُبنى أنظمة الرؤية الحاسوبية باستخدام نُهج التعلم هذه لتفسير البيانات المرئية وفهمها. ويُعد التعلم المُشرف عليه الطريقة الأكثر استخدامًا، حيث يتيح للنماذج التعلم من أمثلة مصنفة بوضوح وإنتاج نتائج دقيقة وموثوقة.
على سبيل المثال، يمكن تدريب نموذج ما على صور مصنفة تحت فئتي «قطة» و«كلب»، بحيث يتعلم خصائص مثل الشكل والأذنين وبنية الوجه، ليتمكن من classify الصور classify بشكل صحيح باستخدام خوارزميات التصنيف. وفي الوقت نفسه، يُستخدم التعلم غير المُشرف عليه والتعلم شبه المُشرف عليه أيضًا في مجال الرؤية الحاسوبية، غالبًا لاستكشاف الأنماط الموجودة في البيانات أو لتحسين الأداء عندما تكون البيانات المصنفة محدودة.
يمكن مقارنة خوارزميات التعلم الخاضع للإشراف ببيئة الفصل الدراسي، حيث يقدم المعلم أمثلة مصحوبة بالإجابات الصحيحة حتى يتعلم الطلاب ما هو الصواب وما هو الخطأ. وفي مجال التعلم الآلي، تتعلم النماذج بطريقة مشابهة باستخدام البيانات المصنفة، حيث يقترن كل مدخل بمخرج معروف.
لنفترض أنك تعمل على تطوير نظام للرؤية الحاسوبية يهدف إلى أتمتة تحليل مباريات البيسبول. يمكنك تدريب نموذج مثل Ultralytics على صور أو إطارات فيديو تم فيها تمييز كائنات مثل الكرة والمضرب واللاعبين.
سيتم تمييز كل كائن بموقعه وفئته، مما يمكّن النموذج من تعلم ما يجب البحث عنه. ومع مرور الوقت، يمكن للنموذج detect هذه الكائنات detect مواقعها في لقطات جديدة، مما يدعم حالات الاستخدام مثل تتبع الكرة واكتشاف اللاعبين عبر الإطارات.

إلى جانب اكتشاف الأجسام، يُستخدم التعلم المُشرف عليه على نطاق واسع في مجموعة متنوعة من مهام الرؤية الحاسوبية، مثل تصنيف الصور، وتقسيم العناصر، وتقدير الوضع، حيث تُعد الدقة والاتساق من العوامل المهمة. وفي كل مهمة من هذه المهام، تتعلم النماذج من البيانات المصنفة لتحديد أنماط معينة وإجراء تنبؤات موثوقة بشأن المدخلات الجديدة.
عادةً ما يتم بناء هذه النماذج باستخدام التعلم العميق، وهو نوع من التعلم الآلي يستخدم الشبكات العصبية لتعلم الأنماط مباشرةً من البيانات. وقد صُممت الشبكات العصبية لمعالجة المعلومات بطريقة مستوحاة بشكل عام من طريقة عمل الدماغ البشري، مما يتيح للنماذج تعلم السمات البصرية المعقدة من مجموعات البيانات الضخمة.
كانت مناهج الرؤية الحاسوبية السابقة تعتمد غالبًا على سمات مصممة يدويًّا مقترنة بخوارزميات مثل آلات المتجهات الداعمة (SVM، وهي نماذج classify من خلال تحديد أفضل حدود بين الفئات) أو أشجار القرار (وهي نماذج تتخذ القرارات عن طريق تقسيم البيانات إلى فروع).
في المقابل، تستخدم نماذج الرؤية الحاسوبية اليوم التعلم العميق لتعلم هذه السمات تلقائيًا من البيانات، مما يجعلها أكثر فعالية في التعامل مع المهام البصرية واسعة النطاق وذات التفاصيل الدقيقة.
على الرغم من أن التعلم الخاضع للإشراف هو النهج المفضل في مجال الرؤية الحاسوبية، إلا أن هناك بعض تطبيقات الرؤية التي لا تتوفر فيها البيانات المصنفة، أو يكون إنشاؤها مكلفًا للغاية ويستغرق وقتًا طويلاً.
في هذه الحالات، يمكن أن تشكل خوارزميات التعلم غير المُشرف عليه بديلاً مفيداً. لنفترض أن لديك مجموعة كبيرة من الصور غير المصنفة الملتقطة بواسطة كاميرا مراقبة الحياة البرية.
لا توجد تسميات تشير إلى محتوى كل صورة، لكنك لا تزال ترغب في تنظيم البيانات أو فهمها. يمكن لنموذج غير خاضع للإشراف تحليل هذه الصور وتجميع الصور المتشابهة معًا، وفصل الحيوانات المتشابهة في مجموعات، حتى دون معرفة تسمياتها الدقيقة.
إذن، كيف يعمل التعلم الآلي غير المُشرف عليه؟ بدلاً من التعلم من الإجابات الصحيحة، يتعلم النموذج من خلال تحديد الأنماط والبنية داخل البيانات بنفسه. فهو يبحث عن أوجه التشابه والاختلاف في البيانات دون الاعتماد على أمثلة مصنفة.
من الحالات الشائعة استخدام الكشف عن الحالات الشاذة، حيث يتعلم النموذج شكل البيانات الطبيعية ثم يحدد أي شيء ينحرف عنها. يعد الكشف عن الحالات الشاذة والقيم المتطرفة أحد أكثر التطبيقات الصناعية تأثيرًا. ومن الأمثلة على ذلك اكتشاف العناصر المعيبة في خط الإنتاج، أو الإبلاغ عن الفحوصات الطبية غير العادية لمراجعتها من قبل أخصائي الأشعة، أو الكشف عن الأنشطة المشبوهة في لقطات المراقبة. ونظرًا لأن العيوب والحالات الشاذة غالبًا ما تكون نادرة ومتنوعة، فإن تصنيف كل حالة محتملة أمر غير عملي، مما يجعل النهج غير الخاضع للإشراف خيارًا مناسبًا بشكل طبيعي.
ولدعم ذلك، غالبًا ما تُستخدم تقنيات مثل التجميع وتقليل الأبعاد، وعادةً ما يتم تطبيقها على السمات المستخرجة من الصور بدلاً من الصور الأولية نفسها. وتقوم طرق التجميع، مثل تجميع k-means، بتجميع الصور المتشابهة معًا استنادًا إلى الأنماط المشتركة، بينما تعمل تقنيات تقليل الأبعاد، مثل تحليل المكونات الرئيسية (PCA)، على تبسيط البيانات من خلال التركيز على السمات الأكثر أهمية.
وهذا يسهل على النموذج تحديد الأنماط والبنى المهمة ضمن مجموعات البيانات الكبيرة والمعقدة. وتتمثل الميزة الرئيسية للتعلم غير المُشرف عليه في أنه يعمل بشكل جيد مع البيانات غير المصنفة، ويمكنه الكشف عن أنماط لا تظهر للعيان على الفور. ومع ذلك، فإنه يصعب تقييمه، كما يوفر تحكماً أقل في النتيجة النهائية مقارنةً بالتعلم المُشرف عليه.
أثناء استكشافك للتعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف، قد تتساءل عما إذا كان هناك حل وسط بين الاثنين. ومن المثير للاهتمام أن التعلم الذاتي الخاضع للإشراف والتعلم شبه الخاضع للإشراف يسدان الفجوة بين التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف.
تتيح هذه الأساليب للنماذج التعلم من البيانات غير المصنفة بشكل أكثر فعالية. فبدلاً من الاعتماد فقط على الأمثلة المصنفة، تقوم هذه النماذج إما بإنشاء مهام تعلم خاصة بها من البيانات، أو بدمج مجموعة بيانات مصنفة صغيرة مع مجموعة بيانات غير مصنفة أكبر حجماً.
في التعلم الذاتي الإشرافي، يتعلم النموذج من خلال حل المهام التي يتم إنشاؤها من البيانات نفسها. على سبيل المثال، قد تُعرض عليه صورة بها جزء مفقود فيتعلم توقع ما الذي يجب أن يملأ تلك المساحة، أو قد يتعلم التعرف على زوايا رؤية مختلفة لنفس الكائن. وهذا يساعد النموذج على تعلم السمات المفيدة دون الحاجة إلى علامات تصنيف يدوية.
من ناحية أخرى، في التعلم شبه المُشرف عليه، تُستخدم كمية صغيرة من البيانات المصنفة جنبًا إلى جنب مع مجموعة أكبر من البيانات غير المصنفة لتحسين الأداء. وفي بعض الحالات، يمكن للنموذج إنشاء تصنيفات للبيانات غير المصنفة واستخدامها لمواصلة التعلم.
وتتمثل الميزة الرئيسية لهذه الأساليب في أنها تقلل من الحاجة إلى مجموعات البيانات الكبيرة المُصنَّفة، والتي غالبًا ما يكون إنشاؤها مكلفًا ويستغرق وقتًا طويلاً. ومع ذلك، فقد يكون تصميمها وتقييمها أكثر تعقيدًا مقارنةً بالطرق الخاضعة للإشراف الكامل.
يتمثل الفرق بين التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف في الطريقة التي يتعلم بها النموذج وما يسعى إلى تحقيقه. ففي حين يعتمد التعلم الخاضع للإشراف على البيانات المصنفة والتوجيهات الواضحة لتعلم مهام محددة، يعمل التعلم غير الخاضع للإشراف بدون إجابات محددة مسبقًا ويركز على اكتشاف الأنماط والبنية داخل البيانات.
على سبيل المثال، في نظام مراقبة حركة المرور، يمكن تدريب نموذج التعلم الخاضع للإشراف على صور مصنفة detect أو المشاة أو إشارات المرور. وفي المقابل، يمكن لنموذج التعلم غير الخاضع للإشراف تحليل كميات كبيرة من لقطات الفيديو لتجميع أنماط حركة المرور المتشابهة أو تحديد الأحداث غير العادية، مثل الازدحام غير المتوقع أو الحركة غير الطبيعية، دون أن يُطلب منه صراحةً ما الذي يجب أن يبحث عنه.
يُعد التعلم الخاضع للإشراف خيارًا ممتازًا لمهام الرؤية الحاسوبية التي يكون الهدف فيها محددًا بوضوح، ويحتاج النموذج فيها إلى ربط البيانات المدخلة بنتائج دقيقة. ويُعد هذا النهج فعالاً بشكل خاص عندما تتوفر مجموعة بيانات موثوقة ومصنفة، وتكون هناك حاجة إلى نتائج متسقة ويمكن التنبؤ بها.

يُستخدم هذا النهج عادةً في المشكلات التي يتعين فيها على النموذج التمييز بين فئات معروفة أو التنبؤ بنتائج محددة. وبدلاً من استكشاف الأنماط، ينصب التركيز على تعلم العلاقات الدقيقة من البيانات المصنفة، مما يسهل توجيه النموذج نحو النتيجة المرجوة.
ومن المزايا الرئيسية الأخرى التحكم. ففي إطار التعلم الخاضع للإشراف، يصبح من الأسهل قياس الأداء باستخدام مقاييس واضحة، وضبط النموذج، وضمان استقرار الأداء أثناء النشر. وهذا يجعله خيارًا مثاليًا للأنظمة التي تتطلب الاتساق والموثوقية على المدى الطويل.
ومع ذلك، فإن هذا الأمر ينطوي على بعض المقايضات. فالنموذج يعتمد بشكل كبير على جودة وحجم البيانات المصنفة، وقد يستغرق جمع هذه البيانات وتصنيفها وقتًا طويلاً.
تستخدم نماذج الذكاء الاصطناعي للرؤية، مثل YOLO Ultralytics التعلم الخاضع للإشراف لأداء مهام مثل اكتشاف الأجسام بدقة عالية، لا سيما في التطبيقات التي تعمل في الوقت الفعلي. وفيما يلي بعض حالات الاستخدام الشائعة للرؤية في العالم الواقعي، حيث يُحدث التعلم الخاضع للإشراف فرقًا:

يُعد التعلم غير المُشرف عليه مفيدًا عندما لا تتوفر لديك بيانات مصنفة كافية أو عندما لا تتضمن بياناتك إجابات واضحة. وفي هذه الحالات، لا يتمثل الهدف في إجراء تنبؤات دقيقة، بل في فهم الأنماط والبنية الموجودة في البيانات.
وغالبًا ما يُستخدم هذا الأسلوب عند استكشاف مجموعة بيانات غير مصنفة للمرة الأولى. فبدلاً من إخبار النموذج بما يجب أن يبحث عنه، تسمح له بتحديد أوجه التشابه، أو تجميع الصور ذات الصلة، أو إبراز الأنماط غير المعتادة من تلقاء نفسه.
في مجموعة كبيرة من الصور، يمكن أن تساعد الطريقة غير الخاضعة للإشراف في تجميع الصور المتشابهة معًا أو تحديد الحالات الشاذة التي قد تحتاج إلى مزيد من الاهتمام. وهذا يجعلها نقطة انطلاق مفيدة في مشاريع علم البيانات.
تتعلم النماذج التوليدية، بما في ذلك شبكات GAN والمشفرات التلقائية التباينية ونماذج الانتشار، التوزيع الأساسي للصور لإنشاء صور جديدة تمامًا. وتدعم هذه النماذج تطبيقات مثل تركيب الصور، وإصلاح العيوب، وزيادة الدقة، ونقل الأنماط، كما أنها تشكل العمود الفقري لأنظمة الذكاء الاصطناعي التوليدية الحالية.
التقسيم غير الخاضع للإشراف: تقوم بعض الطرق بتجميع وحدات البكسل أو المناطق في شرائح متماسكة دون الاعتماد على أقنعة مصنفة، وهو أمر مفيد عندما تكون عملية الترميز مكلفة للغاية أو عندما يكون الهدف هو اكتشاف البنية بدلاً من مطابقة فئات محددة مسبقًا.
كما أن التعلم غير المُشرف عليه له تأثير كبير عند التعامل مع مجموعات البيانات الضخمة التي يستغرق تصنيفها وقتًا طويلاً أو يكون ذلك غير عملي. وفي مثل هذه الحالات، يتيح لك هذا النوع من التعلم استخلاص رؤى من البيانات دون الاعتماد على بيانات تدريب مصنفة.
كما يُستخدم هذا النهج بشكل شائع في مجالات مثل الذكاء الاصطناعي التوليدي (النماذج التي تُنشئ بيانات جديدة مثل الصور أو النصوص أو الملفات الصوتية) وتعلم التمثيل (النماذج التي تتعلم السمات أو الأنماط المفيدة من البيانات الأولية)، حيث تتعلم النماذج السمات العامة من كميات ضخمة من البيانات. وبشكل عام، إذا كانت مشكلتك تتضمن الاستكشاف أو اكتشاف الأنماط أو التعامل مع البيانات غير المصنفة، فإن التعلم غير المُشرف عليه يُعد نهجًا مرنًا وعمليًا يستحق النظر فيه.
فيما يلي بعض الأمثلة على حالات الاستخدام التي يُطبق فيها التعلم غير المُشرف عليه في مجال الرؤية الحاسوبية:
على الرغم من مزايا كلا النهجين التعليميين، هناك بعض القيود التي يجب أخذها في الاعتبار. وفيما يلي بعض العوامل العملية التي يجب مراعاتها عند بناء نماذج الرؤية الحاسوبية:
في مجال الرؤية الحاسوبية، يلعب كل من التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف دورًا مهمًا. ويعتمد النهج المناسب على نوع البيانات المتوفرة لديك، سواء كانت مصنفة أم غير مصنفة، بالإضافة إلى المشكلة التي تحاول حلها واحتياجاتك في مجال النشر.
إذا كان هدفك هو تحقيق دقة عالية ونتائج محددة بوضوح، فغالباً ما يكون التعلم الآلي الخاضع للإشراف هو الخيار الأفضل. أما إذا كنت تستكشف البيانات أو تعمل بدون تصنيفات، فقد يكون التعلم غير الخاضع للإشراف هو الخيار الأنسب.
هل تريد معرفة المزيد عن الذكاء الاصطناعي؟ تفقد مجتمعنا و مستودع GitHub الخاص بنا. استكشف صفحات الحلول الخاصة بنا للتعرف على الذكاء الاصطناعي في مجال الروبوتات و الرؤية الحاسوبية في الزراعة. اكتشف خيارات الترخيص الخاصة بنا وابدأ البناء باستخدام الرؤية الحاسوبية اليوم!
ابدأ رحلتك مع مستقبل تعلم الآلة