استعدوا لـ YOLO Vision 2025!
25 سبتمبر، 2025
10:00 — 18:00 بتوقيت بريطانيا الصيفي
حدث هجين
مؤتمر Yolo Vision 2024

أنواع تقنيات تعلم الذكاء الاصطناعي المستخدمة في رؤية الحاسوب

أبيرامي فينا

4 دقائق قراءة

6 نوفمبر 2024

استكشف الأنواع المختلفة من تقنيات تعلم الآلة والتعلم العميق المستخدمة في تطبيقات الرؤية الحاسوبية، من التعلم الخاضع للإشراف إلى التعلم بالنقل.

التعلم الآلي هو نوع من الذكاء الاصطناعي (AI) الذي يساعد أجهزة الكمبيوتر على التعلم من البيانات حتى تتمكن من اتخاذ القرارات بمفردها، دون الحاجة إلى برمجة تفصيلية لكل مهمة. وهو ينطوي على إنشاء نماذج خوارزمية يمكنها تحديد الأنماط في البيانات. من خلال تحديد الأنماط في البيانات والتعلم منها، يمكن لهذه الخوارزميات تحسين أدائها تدريجيًا بمرور الوقت.

أحد المجالات التي يلعب فيها التعلم الآلي دورًا حاسمًا هو في رؤية الكمبيوتر، وهو مجال من مجالات الذكاء الاصطناعي يركز على البيانات المرئية. تستخدم رؤية الكمبيوتر التعلم الآلي لمساعدة أجهزة الكمبيوتر على اكتشاف الأنماط في الصور ومقاطع الفيديو والتعرف عليها. مدفوعة بالتقدم في التعلم الآلي، تقدر القيمة السوقية العالمية لرؤية الكمبيوتر بحوالي 175.72 مليار دولار بحلول عام 2032. 

في هذه المقالة، سنلقي نظرة على الأنواع المختلفة من تعلم الآلة المستخدمة في الرؤية الحاسوبية، بما في ذلك التعلم الخاضع للإشراف، والتعلم غير الخاضع للإشراف، والتعلم المعزز، والتعلم بالنقل، وكيف يلعب كل منها دورًا في التطبيقات المختلفة. هيا بنا نبدأ!

نظرة عامة على التعلم الآلي في الرؤية الحاسوبية

تعتمد رؤية الحاسوب على تعلم الآلة، وخاصة تقنيات مثل التعلم العميق و الشبكات العصبية، لتفسير وتحليل المعلومات المرئية. هذه الأساليب تجعل من الممكن لأجهزة الكمبيوتر أداء مهام رؤية الحاسوب مثل اكتشاف الأجسام في الصور، و تصنيف الصور حسب الفئة، و التعرف على الوجوه. يعد تعلم الآلة أيضًا ضروريًا لتطبيقات رؤية الحاسوب في الوقت الفعلي مثل مراقبة الجودة في التصنيع و التصوير الطبي في الرعاية الصحية. في هذه الحالات، تساعد الشبكات العصبية أجهزة الكمبيوتر على تفسير البيانات المرئية المعقدة، مثل تحليل فحوصات الدماغ لاكتشاف الأورام

في الواقع، تعتمد العديد من نماذج الرؤية الحاسوبية المتقدمة، مثل Ultralytics YOLO11، على الشبكات العصبية. 

الشكل 1. تقسيم فحوصات الدماغ باستخدام Ultralytics YOLO11.

هناك عدة أنواع من طرق التعلم في التعلم الآلي، مثل التعلم الخاضع للإشراف، والتعلم غير الخاضع للإشراف، والتعلم بالنقل، والتعلم المعزز، والتي تدفع حدود الممكن في الرؤية الحاسوبية. في الأقسام التالية، سوف نستكشف كل نوع من هذه الأنواع لفهم كيف تساهم في الرؤية الحاسوبية.

استكشاف التعلم الخاضع للإشراف.

التعلم الخاضع للإشراف هو النوع الأكثر شيوعًا من تعلم الآلة. في التعلم الخاضع للإشراف، يتم تدريب النماذج باستخدام بيانات مُصنَّفة. يتم وضع علامة على كل مدخل بالناتج الصحيح، مما يساعد النموذج على التعلم. على غرار الطالب الذي يتعلم من المعلم، تعمل هذه البيانات المصنفة كدليل أو مشرف.

أثناء التدريب، يتم تزويد النموذج ببيانات الإدخال (المعلومات التي يحتاج إلى معالجتها) وبيانات الإخراج (الإجابات الصحيحة). يساعد هذا الإعداد النموذج على تعلم العلاقة بين المدخلات والمخرجات. الهدف الرئيسي من التعلم الخاضع للإشراف هو أن يكتشف النموذج قاعدة أو نمطًا يربط بدقة كل مدخل بالإخراج الصحيح الخاص به. باستخدام هذا التعيين، يمكن للنموذج تقديم تنبؤات دقيقة عندما يواجه بيانات جديدة. على سبيل المثال، يعتمد التعرف على الوجوه في رؤية الكمبيوتر على التعلم الخاضع للإشراف لتحديد الوجوه بناءً على هذه الأنماط المتعلمة.

الاستخدام الشائع لهذا هو فتح هاتفك الذكي باستخدام تقنية التعرف على الوجه. يتم تدريب النموذج على صور مُعلَّمة لوجهك بحيث، عندما تذهب لفتح هاتفك، فإنه يقارن الصورة الحية بما تعلمه. إذا اكتشف تطابقًا، فسيتم فتح هاتفك.

الشكل 2. يمكن استخدام التعرف على الوجوه لفتح هاتفك الذكي.

كيف يعمل التعلم غير الخاضع للإشراف في الذكاء الاصطناعي؟

التعلم غير الخاضع للإشراف هو نوع من تعلم الآلة يستخدم بيانات غير مصنفة - لا يتم تزويد النموذج بأي توجيه أو إجابات صحيحة أثناء التدريب. بدلاً من ذلك، يتعلم اكتشاف الأنماط والرؤى بنفسه. 

يحدد التعلم غير الخاضع للإشراف الأنماط باستخدام ثلاث طرق رئيسية: 

  • التجميع: يجمع نقاط البيانات المتشابهة معًا. إنه مفيد لمهام مثل تقسيم العملاء، حيث يمكن تجميع العملاء المتشابهين بناءً على سلوكياتهم أو سماتهم.
  • الاقتران: يُستخدم لتحديد العلاقات بين العناصر، مما يساعد على الكشف عن الروابط داخل البيانات (على سبيل المثال، العثور على المنتجات التي يتم شراؤها غالبًا معًا في تحليل سلة السوق).
  • تخفيض الأبعاد: يبسط مجموعات البيانات عن طريق إزالة الميزات الزائدة، مما يساعد في التصور والمعالجة. 

أحد التطبيقات الرئيسية للتعلم غير الخاضع للإشراف هو ضغط الصور، حيث تقلل تقنيات مثل تجميع k-means حجم الصورة دون التأثير على الجودة المرئية. يتم تجميع وحدات البكسل في مجموعات، ويتم تمثيل كل مجموعة بلون متوسط، مما ينتج عنه صورة بألوان أقل وحجم ملف أصغر.

الشكل 3. مثال على ضغط الصور غير الخاضع للإشراف.

مع ذلك، يواجه التعلم غير الخاضع للإشراف بعض القيود. بدون إجابات محددة مسبقًا، يمكن أن يعاني من حيث الدقة و الأداء و التقييم. غالبًا ما يتطلب جهدًا يدويًا لتفسير النتائج وتسمية المجموعات، وهو حساس لمشكلات مثل القيم المفقودة والضوضاء، مما قد يؤثر على جودة النتائج.

شرح التعلم المعزز

على عكس التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف، لا يعتمد التعلم بالتعزيز على بيانات التدريب. وبدلاً من ذلك، فإنه يستخدم وكلاء الشبكة العصبية للتفاعل مع بيئة لتحقيق هدف معين. 

تتضمن العملية ثلاثة مكونات رئيسية:

  • الوكيل: المتعلم أو صانع القرار.
  • البيئة: كل ما يتفاعل معه الوكيل، والذي يمكن أن يكون حقيقيًا أو افتراضيًا.
  • إشارة المكافأة: قيمة رقمية تُعطى بعد كل إجراء، لتوجيه الوكيل نحو الهدف.

عندما يتخذ الوكيل إجراءات، فإنه يؤثر على البيئة، التي تستجيب بدورها بتقديم ملاحظات. تساعد الملاحظات الوكيل على تقييم خياراته وتعديل سلوكه. تساعد إشارة المكافأة الوكيل على فهم الإجراءات التي تقربه من تحقيق هدفه.

التعلم المعزز هو المفتاح لحالات الاستخدام مثل القيادة الذاتية و الروبوتات. في القيادة الذاتية، يتم التعلم في مهام مثل التحكم في السيارة واكتشاف الكائنات وتجنبها بناءً على التعليقات. يتم تدريب النماذج باستخدام وكلاء الشبكة العصبية لاكتشاف المشاة أو الكائنات الأخرى واتخاذ الإجراء المناسب لتجنب الاصطدام. وبالمثل، في الروبوتات، يتيح التعلم المعزز مهام مثل معالجة الكائنات والتحكم في الحركة.

من الأمثلة الرائعة على التعلم المعزز في الواقع العملي مشروع OpenAI، حيث قام الباحثون بتدريب وكلاء ذكاء اصطناعي للعب لعبة الفيديو الشهيرة متعددة اللاعبين، Dota 2. باستخدام الشبكات العصبية، قام هؤلاء الوكلاء بمعالجة كميات هائلة من المعلومات من بيئة اللعبة لاتخاذ قرارات سريعة واستراتيجية. من خلال التغذية الراجعة المستمرة، تعلم الوكلاء وتحسنوا بمرور الوقت، ووصلوا في النهاية إلى مستوى مهارة عالٍ بما يكفي للتغلب على بعض أفضل لاعبي اللعبة

الشكل 4. تفسير الإنسان مقابل الذكاء الاصطناعي لمصفوفة Dota.

فهم أساسيات التعلم بالنقل

التعلم بالنقل يختلف عن الأنواع الأخرى من التعلم. بدلاً من تدريب نموذج من البداية، فإنه يستخدم نموذجًا مُدرَّبًا مسبقًا على مجموعة بيانات كبيرة ويقوم بضبطه بدقة لمهمة جديدة ولكن ذات صلة. تُستخدم المعرفة المكتسبة خلال التدريب الأولي لتحسين أداء المهمة الجديدة. يقلل التعلم بالنقل الوقت اللازم للتدريب على مهمة جديدة، اعتمادًا على مدى تعقيدها. وهو يعمل عن طريق الاحتفاظ بالطبقات الأولية من النموذج التي تلتقط الميزات العامة واستبدال الطبقات النهائية بتلك الخاصة بالمهمة المحددة الجديدة. 

يعد نقل الأنماط الفنية تطبيقًا مثيرًا للاهتمام لنقل التعلم في الرؤية الحاسوبية. تتيح هذه التقنية للنموذج تحويل صورة لتتناسب مع نمط عمل فني مختلف. لتحقيق ذلك، يتم أولاً تدريب شبكة عصبية على مجموعة بيانات كبيرة من الصور المقترنة بأنماطها الفنية. من خلال هذه العملية، يتعلم النموذج تحديد ميزات الصورة العامة وأنماط الأسلوب.

بمجرد تدريب النموذج، يمكن ضبطه بدقة لتطبيق نمط لوحة معينة على صورة جديدة. تتكيف الشبكة مع الصورة الجديدة مع الحفاظ على ميزات النمط المتعلمة، مما يسمح لها بإنشاء نتيجة فريدة تجمع بين المحتوى الأصلي والأسلوب الفني المحدد. على سبيل المثال، يمكنك التقاط صورة لسلسلة جبال وتطبيق أسلوب الصرخة لإدفارد مونك، مما ينتج عنه صورة تلتقط المشهد ولكن بأسلوب اللوحة الجريء والمعبر.

الشكل 5. مثال على نقل الأنماط الفنية باستخدام التعلم بالنقل.

نظرة على الاختلافات بين أنواع تعلم الآلة

الآن بعد أن غطينا الأنواع الرئيسية لتعلم الآلة، دعنا نلقي نظرة فاحصة على كل نوع لمساعدتك على فهم الأنسب للتطبيقات المختلفة.

  • التعلم الخاضع للإشراف: هذا النوع دقيق للغاية عند العمل مع البيانات المصنفة ولكنه يتطلب الكثير من البيانات ويمكن أن يكون حساسًا للضوضاء.
  • التعلم غير الخاضع للإشراف: إنه مفيد لاستكشاف البيانات غير المسماة للعثور على أنماط مخفية، على الرغم من أن النتائج قد تكون أقل دقة وأصعب في التفسير.
  • التعلم المعزز: يدرب الوكلاء على اتخاذ قرارات خطوة بخطوة في البيئات المعقدة ولكنه غالبًا ما يتطلب قوة حوسبة كبيرة.
  • التعلم بالنقل: يستخدم هذا الأسلوب نماذج مدربة مسبقًا لتسريع التدريب وتحسين الأداء في المهام الجديدة، خاصة عندما تكون البيانات محدودة.
الشكل 6. مقارنة بين جميع أنواع تعلم الآلة. صورة من إعداد المؤلف.

يعتمد اختيار نوع التعلم الآلي المناسب على عدة عوامل. يعمل التعلم الخاضع للإشراف بشكل جيد إذا كان لديك بيانات مصنفة وفيرة ومهمة واضحة. التعلم غير الخاضع للإشراف مفيد لاستكشاف البيانات أو عندما تكون الأمثلة المصنفة نادرة. يعتبر التعلم بالتعزيز مثاليًا للمهام المعقدة التي تتطلب اتخاذ قرارات خطوة بخطوة، في حين أن التعلم بالنقل رائع عندما تكون البيانات محدودة أو الموارد مقيدة. من خلال النظر في هذه العوامل، يمكنك تحديد النهج الأنسب لمشروع الرؤية الحاسوبية الخاص بك.

ملخص

يمكن لتقنيات تعلم الآلة معالجة مجموعة متنوعة من التحديات، خاصة في مجالات مثل الرؤية الحاسوبية. من خلال فهم الأنواع المختلفة، التعلم الخاضع للإشراف، والتعلم غير الخاضع للإشراف، والتعلم المعزز، والتعلم بالنقل، يمكنك اختيار أفضل نهج لاحتياجاتك.

 التعلم الخاضع للإشراف رائع للمهام التي تتطلب دقة عالية وبيانات مصنفة، في حين أن التعلم غير الخاضع للإشراف مثالي للعثور على أنماط في البيانات غير المصنفة. يعمل التعلم بالتعزيز بشكل جيد في الإعدادات المعقدة القائمة على اتخاذ القرارات، والتعلم بالنقل مفيد عندما تريد البناء على نماذج مدربة مسبقًا ببيانات محدودة. 

لكل طريقة نقاط قوة وتطبيقات فريدة، من التعرف على الوجوه إلى الروبوتات إلى نقل الأسلوب الفني. يمكن أن يؤدي اختيار النوع المناسب إلى إطلاق إمكانات جديدة في مختلف الصناعات مثل الرعاية الصحية والسيارات والترفيه.

لاستكشاف المزيد، قم بزيارة مستودع GitHub الخاص بنا، وتفاعل مع مجتمعنا. استكشف تطبيقات الذكاء الاصطناعي في السيارات ذاتية القيادة و الزراعة في صفحات الحلول الخاصة بنا. 🚀

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا
تم نسخ الرابط إلى الحافظة