Yolo فيجن شنتشن
شنتشن
انضم الآن

أنواع تقنيات تعلم الذكاء الاصطناعي المستخدمة في رؤية الحاسوب

أبيرامي فينا

4 دقائق قراءة

6 نوفمبر 2024

استكشف الأنواع المختلفة من تقنيات تعلم الآلة والتعلم العميق المستخدمة في تطبيقات الرؤية الحاسوبية، من التعلم الخاضع للإشراف إلى التعلم بالنقل.

التعلم الآلي هو نوع من الذكاء الاصطناعي (AI) الذي يساعد أجهزة الكمبيوتر على التعلم من البيانات حتى تتمكن من اتخاذ القرارات بمفردها، دون الحاجة إلى برمجة تفصيلية لكل مهمة. وهو ينطوي على إنشاء نماذج خوارزمية يمكنها تحديد الأنماط في البيانات. من خلال تحديد الأنماط في البيانات والتعلم منها، يمكن لهذه الخوارزميات تحسين أدائها تدريجيًا بمرور الوقت.

أحد المجالات التي يلعب فيها التعلم الآلي دوراً حاسماً هو مجال الرؤية الحاسوبية، وهو مجال الذكاء الاصطناعي الذي يركز على البيانات المرئية. تستخدم الرؤية الحاسوبية التعلم الآلي لمساعدة أجهزة الكمبيوتر على detect الأنماط في الصور ومقاطع الفيديو والتعرف عليها. ومن المتوقع أن تبلغ القيمة السوقية العالمية للرؤية الحاسوبية حوالي 175.72 مليار دولار بحلول عام 2032، مدفوعةً بالتطورات في مجال التعلم الآلي. 

في هذه المقالة، سنلقي نظرة على الأنواع المختلفة من تعلم الآلة المستخدمة في الرؤية الحاسوبية، بما في ذلك التعلم الخاضع للإشراف، والتعلم غير الخاضع للإشراف، والتعلم المعزز، والتعلم بالنقل، وكيف يلعب كل منها دورًا في التطبيقات المختلفة. هيا بنا نبدأ!

نظرة عامة على التعلم الآلي في الرؤية الحاسوبية

تعتمد الرؤية الحاسوبية على التعلّم الآلي، خاصةً تقنيات مثل التعلّم العميق والشبكات العصبية، لتفسير المعلومات البصرية وتحليلها. تتيح هذه الأساليب لأجهزة الكمبيوتر أداء مهام الرؤية الحاسوبية مثل اكتشاف الأجسام في الصور، وتصنيف الصور حسب الفئة، والتعرف على الوجوه. يعد التعلم الآلي ضروريًا أيضًا لتطبيقات الرؤية الحاس وبية في الوقت الفعلي مثل مراقبة الجودة في التصنيع والتصوير الطبي في مجال الرعاية الصحية. في هذه الحالات، تساعد الشبكات العصبية أجهزة الكمبيوتر في تفسير البيانات المرئية المعقدة، مثل تحليل فحوصات الدماغ detect الأورام

في الواقع، العديد من نماذج الرؤية الحاسوبية المتقدمة، مثل Ultralytics YOLO11مبنية على الشبكات العصبية. 

الشكل 1. تقسيم فحوصات الدماغ باستخدام Ultralytics YOLO11.

هناك عدة أنواع من طرق التعلم في التعلم الآلي، مثل التعلم الخاضع للإشراف، والتعلم غير الخاضع للإشراف، والتعلم بالنقل، والتعلم المعزز، والتي تدفع حدود الممكن في الرؤية الحاسوبية. في الأقسام التالية، سوف نستكشف كل نوع من هذه الأنواع لفهم كيف تساهم في الرؤية الحاسوبية.

استكشاف التعلم الخاضع للإشراف.

التعلم الخاضع للإشراف هو النوع الأكثر شيوعًا من تعلم الآلة. في التعلم الخاضع للإشراف، يتم تدريب النماذج باستخدام بيانات مُصنَّفة. يتم وضع علامة على كل مدخل بالناتج الصحيح، مما يساعد النموذج على التعلم. على غرار الطالب الذي يتعلم من المعلم، تعمل هذه البيانات المصنفة كدليل أو مشرف.

أثناء التدريب، يتم تزويد النموذج ببيانات الإدخال (المعلومات التي يحتاج إلى معالجتها) وبيانات الإخراج (الإجابات الصحيحة). يساعد هذا الإعداد النموذج على تعلم العلاقة بين المدخلات والمخرجات. الهدف الرئيسي من التعلم الخاضع للإشراف هو أن يكتشف النموذج قاعدة أو نمطًا يربط بدقة كل مدخل بالإخراج الصحيح الخاص به. باستخدام هذا التعيين، يمكن للنموذج تقديم تنبؤات دقيقة عندما يواجه بيانات جديدة. على سبيل المثال، يعتمد التعرف على الوجوه في رؤية الكمبيوتر على التعلم الخاضع للإشراف لتحديد الوجوه بناءً على هذه الأنماط المتعلمة.

الاستخدام الشائع لهذا هو فتح هاتفك الذكي باستخدام تقنية التعرف على الوجه. يتم تدريب النموذج على صور مُعلَّمة لوجهك بحيث، عندما تذهب لفتح هاتفك، فإنه يقارن الصورة الحية بما تعلمه. إذا اكتشف تطابقًا، فسيتم فتح هاتفك.

الشكل 2. يمكن استخدام التعرف على الوجوه لفتح هاتفك الذكي.

كيف يعمل التعلم غير الخاضع للإشراف في الذكاء الاصطناعي؟

التعلم غير الخاضع للإشراف هو نوع من تعلم الآلة يستخدم بيانات غير مصنفة - لا يتم تزويد النموذج بأي توجيه أو إجابات صحيحة أثناء التدريب. بدلاً من ذلك، يتعلم اكتشاف الأنماط والرؤى بنفسه. 

يحدد التعلم غير الخاضع للإشراف الأنماط باستخدام ثلاث طرق رئيسية: 

  • التجميع: يجمع نقاط البيانات المتشابهة معًا. إنه مفيد لمهام مثل تقسيم العملاء، حيث يمكن تجميع العملاء المتشابهين بناءً على سلوكياتهم أو سماتهم.
  • الاقتران: يُستخدم لتحديد العلاقات بين العناصر، مما يساعد على الكشف عن الروابط داخل البيانات (على سبيل المثال، العثور على المنتجات التي يتم شراؤها غالبًا معًا في تحليل سلة السوق).
  • تخفيض الأبعاد: يبسط مجموعات البيانات عن طريق إزالة الميزات الزائدة، مما يساعد في التصور والمعالجة. 

أحد التطبيقات الرئيسية للتعلم غير الخاضع للإشراف هو ضغط الصور، حيث تقلل تقنيات مثل تجميع k-means حجم الصورة دون التأثير على الجودة المرئية. يتم تجميع وحدات البكسل في مجموعات، ويتم تمثيل كل مجموعة بلون متوسط، مما ينتج عنه صورة بألوان أقل وحجم ملف أصغر.

الشكل 3. مثال على ضغط الصور غير الخاضع للإشراف.

مع ذلك، يواجه التعلم غير الخاضع للإشراف بعض القيود. بدون إجابات محددة مسبقًا، يمكن أن يعاني من حيث الدقة و الأداء و التقييم. غالبًا ما يتطلب جهدًا يدويًا لتفسير النتائج وتسمية المجموعات، وهو حساس لمشكلات مثل القيم المفقودة والضوضاء، مما قد يؤثر على جودة النتائج.

شرح التعلم المعزز

على عكس التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف، لا يعتمد التعلم بالتعزيز على بيانات التدريب. وبدلاً من ذلك، فإنه يستخدم وكلاء الشبكة العصبية للتفاعل مع بيئة لتحقيق هدف معين. 

تتضمن العملية ثلاثة مكونات رئيسية:

  • الوكيل: المتعلم أو صانع القرار.
  • البيئة: كل ما يتفاعل معه الوكيل، والذي يمكن أن يكون حقيقيًا أو افتراضيًا.
  • إشارة المكافأة: قيمة رقمية تُعطى بعد كل إجراء، لتوجيه الوكيل نحو الهدف.

عندما يتخذ الوكيل إجراءات، فإنه يؤثر على البيئة، التي تستجيب بدورها بتقديم ملاحظات. تساعد الملاحظات الوكيل على تقييم خياراته وتعديل سلوكه. تساعد إشارة المكافأة الوكيل على فهم الإجراءات التي تقربه من تحقيق هدفه.

يُعد التعلُّم المعزز أمراً أساسياً لحالات الاستخدام مثل القيادة الذاتية والروبوتات. في القيادة الذاتية، تتعلم مهام مثل التحكم في السيارة واكتشاف الأجسام وتجنبها بناءً على التغذية الراجعة. يتم تدريب النماذج باستخدام عوامل الشبكة العصبية detect المشاة أو الأجسام الأخرى واتخاذ الإجراءات المناسبة لتجنب الاصطدام. وبالمثل، في مجال الروبوتات، يتيح التعلم المعزز مهام مثل التلاعب بالأشياء والتحكم في الحركة.

من الأمثلة الرائعة على التعلم المعزز في الواقع العملي مشروع OpenAI، حيث قام الباحثون بتدريب وكلاء ذكاء اصطناعي للعب لعبة الفيديو الشهيرة متعددة اللاعبين، Dota 2. باستخدام الشبكات العصبية، قام هؤلاء الوكلاء بمعالجة كميات هائلة من المعلومات من بيئة اللعبة لاتخاذ قرارات سريعة واستراتيجية. من خلال التغذية الراجعة المستمرة، تعلم الوكلاء وتحسنوا بمرور الوقت، ووصلوا في النهاية إلى مستوى مهارة عالٍ بما يكفي للتغلب على بعض أفضل لاعبي اللعبة

الشكل 4. تفسير الإنسان مقابل الذكاء الاصطناعي لمصفوفة Dota.

فهم أساسيات التعلم بالنقل

التعلم بالنقل يختلف عن الأنواع الأخرى من التعلم. بدلاً من تدريب نموذج من البداية، فإنه يستخدم نموذجًا مُدرَّبًا مسبقًا على مجموعة بيانات كبيرة ويقوم بضبطه بدقة لمهمة جديدة ولكن ذات صلة. تُستخدم المعرفة المكتسبة خلال التدريب الأولي لتحسين أداء المهمة الجديدة. يقلل التعلم بالنقل الوقت اللازم للتدريب على مهمة جديدة، اعتمادًا على مدى تعقيدها. وهو يعمل عن طريق الاحتفاظ بالطبقات الأولية من النموذج التي تلتقط الميزات العامة واستبدال الطبقات النهائية بتلك الخاصة بالمهمة المحددة الجديدة. 

يعد نقل الأنماط الفنية تطبيقًا مثيرًا للاهتمام لنقل التعلم في الرؤية الحاسوبية. تتيح هذه التقنية للنموذج تحويل صورة لتتناسب مع نمط عمل فني مختلف. لتحقيق ذلك، يتم أولاً تدريب شبكة عصبية على مجموعة بيانات كبيرة من الصور المقترنة بأنماطها الفنية. من خلال هذه العملية، يتعلم النموذج تحديد ميزات الصورة العامة وأنماط الأسلوب.

بمجرد تدريب النموذج، يمكن ضبطه بدقة لتطبيق نمط لوحة معينة على صورة جديدة. تتكيف الشبكة مع الصورة الجديدة مع الحفاظ على ميزات النمط المتعلمة، مما يسمح لها بإنشاء نتيجة فريدة تجمع بين المحتوى الأصلي والأسلوب الفني المحدد. على سبيل المثال، يمكنك التقاط صورة لسلسلة جبال وتطبيق أسلوب الصرخة لإدفارد مونك، مما ينتج عنه صورة تلتقط المشهد ولكن بأسلوب اللوحة الجريء والمعبر.

الشكل 5. مثال على نقل الأنماط الفنية باستخدام التعلم بالنقل.

نظرة على الاختلافات بين أنواع تعلم الآلة

الآن بعد أن غطينا الأنواع الرئيسية لتعلم الآلة، دعنا نلقي نظرة فاحصة على كل نوع لمساعدتك على فهم الأنسب للتطبيقات المختلفة.

  • التعلم الخاضع للإشراف: هذا النوع دقيق للغاية عند العمل مع البيانات المصنفة ولكنه يتطلب الكثير من البيانات ويمكن أن يكون حساسًا للضوضاء.
  • التعلم غير الخاضع للإشراف: إنه مفيد لاستكشاف البيانات غير المسماة للعثور على أنماط مخفية، على الرغم من أن النتائج قد تكون أقل دقة وأصعب في التفسير.
  • التعلم المعزز: يدرب الوكلاء على اتخاذ قرارات خطوة بخطوة في البيئات المعقدة ولكنه غالبًا ما يتطلب قوة حوسبة كبيرة.
  • التعلم بالنقل: يستخدم هذا الأسلوب نماذج مدربة مسبقًا لتسريع التدريب وتحسين الأداء في المهام الجديدة، خاصة عندما تكون البيانات محدودة.
الشكل 6. مقارنة بين جميع أنواع تعلم الآلة. صورة من إعداد المؤلف.

يعتمد اختيار نوع التعلم الآلي المناسب على عدة عوامل. يعمل التعلم الخاضع للإشراف بشكل جيد إذا كان لديك بيانات مصنفة وفيرة ومهمة واضحة. التعلم غير الخاضع للإشراف مفيد لاستكشاف البيانات أو عندما تكون الأمثلة المصنفة نادرة. يعتبر التعلم بالتعزيز مثاليًا للمهام المعقدة التي تتطلب اتخاذ قرارات خطوة بخطوة، في حين أن التعلم بالنقل رائع عندما تكون البيانات محدودة أو الموارد مقيدة. من خلال النظر في هذه العوامل، يمكنك تحديد النهج الأنسب لمشروع الرؤية الحاسوبية الخاص بك.

ملخص

يمكن لتقنيات تعلم الآلة معالجة مجموعة متنوعة من التحديات، خاصة في مجالات مثل الرؤية الحاسوبية. من خلال فهم الأنواع المختلفة، التعلم الخاضع للإشراف، والتعلم غير الخاضع للإشراف، والتعلم المعزز، والتعلم بالنقل، يمكنك اختيار أفضل نهج لاحتياجاتك.

 التعلم الخاضع للإشراف رائع للمهام التي تتطلب دقة عالية وبيانات مصنفة، في حين أن التعلم غير الخاضع للإشراف مثالي للعثور على أنماط في البيانات غير المصنفة. يعمل التعلم بالتعزيز بشكل جيد في الإعدادات المعقدة القائمة على اتخاذ القرارات، والتعلم بالنقل مفيد عندما تريد البناء على نماذج مدربة مسبقًا ببيانات محدودة. 

لكل طريقة نقاط قوة وتطبيقات فريدة، من التعرف على الوجوه إلى الروبوتات إلى نقل الأسلوب الفني. يمكن أن يؤدي اختيار النوع المناسب إلى إطلاق إمكانات جديدة في مختلف الصناعات مثل الرعاية الصحية والسيارات والترفيه.

لاستكشاف المزيد، قم بزيارة مستودع GitHub الخاص بنا، وتفاعل مع مجتمعنا. استكشف تطبيقات الذكاء الاصطناعي في السيارات ذاتية القيادة و الزراعة في صفحات الحلول الخاصة بنا. 🚀

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا