الاستفادة من التعلم المعزز في مشاريع الرؤية الحاسوبية

أبيرامي فينا

5 دقائق للقراءة

5 يونيو 2025

اكتشف كيف يساعد التعلُّم المعزز في تطبيقات الرؤية الحاسوبية الأنظمة على الرؤية واتخاذ القرارات والتحسين في تطبيقات العالم الحقيقي في مختلف الصناعات.

إن الطريقة المباشرة لشرح الذكاء الاصطناعي (AI) هي أنه مجال يركز على إعادة إنشاء طريقة تفكير البشر وتعلمهم. ومن هنا تأتي فكرة تقنيات التعلّم في الذكاء الاصطناعي، وهي أساليب مختلفة تسمح للآلات بتحسين أدائها بمرور الوقت، تماماً كما يفعل البشر.

لقد استكشفنا في السابق تقنيات تعلم الذكاء الاصطناعي الرئيسية، بما في ذلك التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف والتعلم المعزز والتعلم التحوّلي، وكيف يلعب كل منها دورًا مهمًا في مساعدة نماذج الذكاء الاصطناعي على معالجة المعلومات واتخاذ القرارات.

سنلقي اليوم نظرة فاحصة على التعلم المعزز، وهي تقنية تعلم أنظمة الذكاء الاصطناعي التعلم من خلال التجربة من خلال التفاعل مع البيئة والتحسن بناءً على التغذية الراجعة. على وجه التحديد، سنستكشف كيف يمكن تطبيق التعلّم المعزز على تطبيقات الرؤية الحاسوبية - وهي أنظمة تمكّن الآلات من تفسير وفهم المعلومات المرئية من العالم.

يتيح الجمع بين مفاهيم مثل التعلم المعزز والرؤية الحاسوبية إمكانيات جديدة ومثيرة وهو مجال بحثي نشط. فهو يمكّن أنظمة الذكاء الاصطناعي من التعرف على ما تراه واتخاذ قرارات مستنيرة بناءً على تلك المعلومات المرئية. 

ما هو التعلم المعزز؟

التعلُّم المعزز هو فرع من التعلم الآلي حيث يتعلم وكيل الذكاء الاصطناعي من خلال اتخاذ إجراءات وتلقي تغذية راجعة في شكل مكافآت أو عقوبات. الهدف هو معرفة الإجراءات التي تؤدي إلى أفضل النتائج بمرور الوقت.

يمكنك التفكير في التعلم المعزز مثل تدريب الكلب. عندما يجلس الكلب بناءً على أمر، تعطيه مكافأة. بعد فترة، يتعلم الكلب أن الجلوس يؤدي إلى مكافأة. في التعلم المعزز، يكون وكيل أو نموذج الذكاء الاصطناعي مثل الكلب؛ البيئة هي العالم من حوله، وتساعده المكافأة على فهم ما إذا كان قد قام بالحركة الصحيحة.

وهذا يختلف عن التعلم تحت الإشراف، حيث يُعرض على نموذج الذكاء الاصطناعي العديد من الأمثلة على الإجابات الصحيحة. على سبيل المثال، قد تُعرض على النموذج صورة كلب ويُقال له: "هذا كلب". 

من ناحية أخرى، لا يعتمد التعلّم المعزز على البيانات المصنفة. بدلاً من ذلك، فهو ينطوي على التعلم من خلال تجربة إجراءات مختلفة والتعلم من النتائج، تماماً مثل لعب لعبة ومعرفة الحركات التي تساعدك على الفوز.

_w_f_reserved_nherit
الشكل 1. التعلم المعزز مقابل التعلم تحت الإشراف.

يُعد التعلّم المعزز أمرًا بالغ الأهمية للمهام التي يتم فيها اتخاذ القرارات خطوة بخطوة، وكل خيار يغير ما يحدث بعد ذلك. يُستخدم هذا النوع من التعلّم في ألعاب الفيديو الاستراتيجية لجعل اللعب أكثر تحدياً وجاذبية للاعبين.

كيف يعمل التعلم المعزز في حلول الذكاء الاصطناعي

فكر في كيفية تعلم ركوب الدراجة. في البداية، قد تسقط في البداية. ولكن مع الممارسة، تبدأ في اكتشاف ما يساعدك على الحفاظ على توازنك. وكلما ركبت أكثر، كلما تحسنت. أنت تتعلم بالممارسة، وليس فقط بتلقينك ما يجب عليك فعله.

يعمل التعلم المعزز بطريقة مماثلة للذكاء الاصطناعي. فهو يتعلم من خلال التجربة - من خلال تجربة إجراءات مختلفة، ومراقبة ما يحدث، وتحسين قدرته تدريجياً على اتخاذ الخيارات الصحيحة بمرور الوقت.

_w_f_reserved_nherit
الشكل 2. فهم كيفية عمل التعلّم المعزز.

فيما يلي نظرة على بعض المكونات الرئيسية للتعلم المعزز:

  • الوكيل: الوكيل هو المتعلم أو صانع القرار. وهو يتفاعل مع البيئة من خلال اتخاذ إجراءات ويهدف إلى تحقيق هدف محدد.
  • البيئة: تشمل البيئة كل ما يتفاعل معه الوكيل. وهي تتغير استجابةً لتصرفات الوكيل وتوفر تغذية مرتدة بناءً على النتائج.
  • الحالة: تمثل الحالة لقطة للوضع الحالي في البيئة. يراقب الوكيل الحالة لفهم ما يحيط به وتحديد الإجراء الذي سيتخذه بعد ذلك.
  • الفعل: الإجراء هو حركة أو قرار يتخذه الوكيل يؤثر على البيئة. كل إجراء يؤدي إلى حالة جديدة ويمكن أن يؤثر على المكافآت المستقبلية.
  • المكافأة: المكافأة هي ببساطة التغذية الراجعة من البيئة التي تخبر الوكيل ما إذا كان عمله مفيدًا أم لا. وتشجع المكافآت الإيجابية الوكيل على تكرار الأفعال الجيدة، في حين أن المكافآت السلبية تثبط الأفعال السيئة.
  • السياسة: السياسة هي استراتيجية الوكيل لاختيار الإجراءات بناءً على الحالة الحالية. بمرور الوقت، يقوم الوكيل بتحسين سياسته لتعظيم إجمالي المكافآت التي يمكن أن يكسبها.

وباستخدام هذه المكونات معًا، يتيح التعلّم المعزز لأنظمة الذكاء الاصطناعي تعلم السلوكيات الفعالة من خلال التجربة والخطأ المستمرين. ومع كل محاولة، يصبح الوكيل أفضل في اختيار الإجراءات التي تؤدي إلى مكافآت أعلى ونتائج أفضل.

التعلم المعزز في ابتكارات الرؤية الحاسوبية

تُستخدم الرؤية الحاسوبية في مهام مثل اكتشاف الأجسام في الصور، وتصنيف ما في الصورة، وتجزئة الصورة إلى أجزاء مختلفة. تدعم نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11 مثل هذه المهام ويمكن استخدامها لبناء تطبيقات مؤثرة يمكنها جمع الرؤى البصرية.  

ومع ذلك، عندما يتم الجمع بين مهام الذكاء الاصطناعي المرئي هذه والتعلم المعزز، فإن النتيجة هي حل ذكاء اصطناعي لا يرى فقط؛ بل يتعلم أيضاً كيفية التصرف بناءً على الرؤى المرئية ويتحسن بمرور الوقت.

من الأمثلة المثيرة للاهتمام للتعلم المعزز في تطبيقات الرؤية الحاسوبية استخدام الروبوتات في المستودعات. حيث يمكن للروبوتات المزودة بكاميرات وأنظمة رؤية حاسوبية تحليل محيطها واكتشاف مكان كل عنصر وتحديد شكله وحجمه وفهم كيفية وضعه على الرف.

في كل مرة يحاول فيها الروبوت التقاط غرض ما، يتلقى الروبوت تغذية راجعة - النجاح إذا تم التقاط الغرض بشكل صحيح أو الفشل إذا تم إسقاطه. بمرور الوقت، يتعلم الروبوت الإجراءات التي تعمل بشكل أفضل مع العناصر المختلفة. فبدلاً من اتباع مجموعة ثابتة من التعليمات، يتحسن الروبوت باستمرار من خلال التجربة.

_w_f_reserved_nherit
الشكل 3. ذراع روبوتية تستخدم الذكاء الاصطناعي للرؤية والتعلم المعزز لالتقاط الأشياء.

تطبيقات التعلم المعزز في الرؤية الحاسوبية

والآن بعد أن أصبح لدينا فهم أفضل لماهية التعلم المعزز ودوره في الرؤية الحاسوبية، دعونا نلقي نظرة فاحصة على بعض الأمثلة التي يُستخدم فيها التعلم المعزز والرؤية الحاسوبية معًا.

دمج الذكاء الاصطناعي البصري والتعلم المعزز من أجل مركبات أكثر ذكاءً

يمكن للمركبات ذاتية القيادة الاعتماد على كل من الذكاء الاصطناعي البصري لفهم محيطها والتعلم المعزز لاتخاذ القرارات بناءً على ما تراه. ومن الأمثلة الرائعة على ذلك أثناء العمل هو AWS DeepRacer.

AWS DeepRacer هي سيارة سباق ذاتية القيادة بمقياس 1/18 تتعلم كيفية القيادة باستخدام الكاميرا والتعلم المعزز. فبدلاً من أن يُملى عليها ما يجب أن تفعله، فإنها تكتشف الأشياء من تلقاء نفسها من خلال المحاولة وارتكاب الأخطاء والتعلم منها.

تعمل كاميرا هذه السيارة الصغيرة مثل زوج من العيون، حيث تلتقط المسار أمامك. وبناءً على ما تراه، تتعلم السيارة كيفية التوجيه والسرعة التي يجب أن تسير بها. ومع كل لفة، تتحسن السيارة. على سبيل المثال، قد تتعلم السيارة كيف تنعطف على منعطفات أوسع أو تبطئ السرعة قبل المنعطفات الحادة من خلال التعلم من المحاولات السابقة.

يبدأ تدريب DeepRacer في بيئة افتراضية، حيث يتدرب النموذج على مهارات القيادة ويصقلها. وبمجرد أن يصل إلى مستوى معين من الأداء، يتم نقل هذه المهارات إلى مسارات العالم الحقيقي بسيارات فعلية. 

_w_f_reserved_nherit
الشكل 4. يستخدم AWS DeepRacer الرؤية والتعلم المعزز للقيادة الذاتية. مصدر الصورة: أمازون. 

الانتقال نحو الروبوتات الجراحية المستقلة

من المجالات البحثية المثيرة التي تكتسب اهتماماً متزايداً دمج الذكاء الاصطناعي البصري والتعلم المعزز في الجراحة الروبوتية. في الوقت الحالي، لا يزال هذا التطبيق نظرياً إلى حد كبير. يقوم الباحثون بإجراء عمليات محاكاة في بيئات افتراضية.

ومع ذلك، تُظهر التجارب المبكرة نتائج واعدة، مما يشير إلى أن الروبوتات الجراحية يمكن أن تؤدي في نهاية المطاف عمليات معقدة ودقيقة بدقة أكبر وقدرة على التكيف والحد الأدنى من التدخل البشري.

_w_f_reserved_nherit
الشكل 5. أصبحت الروبوتات الجراحية أكثر تطوراً.

على سبيل المثال، تخيل حالة تحتاج فيها قطعة من الشاش إلى رفعها بعناية من موقع جراحي. سيحلل الروبوت المزود بالذكاء الاصطناعي للرؤية المشهد أولاً، باستخدام التجزئة لتحديد الشاش والأنسجة المحيطة به. 

ومن ثم سيساعد التعلم المعزز الروبوت الجراحي على تحديد كيفية التعامل مع المهمة، وتحديد أفضل زاوية للإمساك بالشاش، ومقدار الضغط الذي يجب تطبيقه، وكيفية رفعه دون إزعاج المناطق الحساسة القريبة. وبمرور الوقت ومن خلال الممارسة المتكررة في بيئات المحاكاة، يمكن للروبوت أن يتعلم أداء هذه الحركات الدقيقة والحرجة بمهارة وثقة متزايدة.

إيجابيات وسلبيات التعلم المعزز في الذكاء الاصطناعي للرؤية

يسمح التعلّم المعزز لأنظمة الذكاء الاصطناعي للرؤية بتجاوز مرحلة التعرّف البسيط والبدء في اتخاذ القرارات بناءً على ما تراه. وهذا يفتح إمكانيات جديدة في مجالات مثل الروبوتات والأتمتة والتفاعل في الوقت الحقيقي. 

فيما يلي بعض المزايا الرئيسية لدمج التعلُّم المعزز في عمليات سير عمل الذكاء الاصطناعي المرئي:

  • اعتماد أقل على البيانات المصنفة: يمكن لهذه الأنظمة أن تتعلم من التفاعل، لذا فهي لا تحتاج إلى مجموعات بيانات موسومة ضخمة للبدء.
  • يتعامل مع عدم اليقين بشكل أفضل: يمكن للتعلم المعزز التعامل مع المعلومات البصرية غير المكتملة أو الصاخبة من خلال تعديل الإجراءات بناءً على التغذية الراجعة بدلاً من الاعتماد فقط على البيانات الكاملة.
  • يدعم التعلم على المدى الطويل: يساعد النماذج على تحسين النماذج بمرور الوقت من خلال التعلم من تسلسل الإجراءات، وليس فقط القرارات ذات الخطوة الواحدة.

من ناحية أخرى، إليك بعض قيود التعلم المعزز التي يجب مراعاتها:

  • مشكلة تخصيص الائتمان: قد يكون من الصعب على الوكيل معرفة الإجراءات المحددة التي ساهمت في النتيجة النهائية، خاصة في التسلسل الطويل للقرارات.
  • خطر الاستكشاف غير الآمن: أثناء التدريب، قد يحاول الوكيل أثناء التدريب القيام بإجراءات غير آمنة أو غير مرغوب فيها لن تكون مقبولة في تطبيقات العالم الحقيقي مثل الرعاية الصحية أو القيادة الذاتية.
  • التقارب البطيء: يمكن أن يستغرق النموذج وقتًا طويلاً حتى يصل إلى أداء جيد، خاصةً بالنسبة للمهام المعقدة.

الوجبات الرئيسية

يتيح التعلّم المعزز في مشاريع الرؤية الحاسوبية لأنظمة الذكاء الاصطناعي فهم ما يحيط بها وتعلّم كيفية التصرف من خلال التجربة. ومن خلال نماذج مثل Ultralytics YOLO11 التي توفر إمكانية الكشف عن الأشياء في الوقت الفعلي، يمكن للنظام اتخاذ قرارات مستنيرة بناءً على ما يراه.

يتخطى هذا النهج الأساليب التقليدية من خلال السماح للذكاء الاصطناعي بالتحسن من خلال التجربة والتغذية الراجعة بدلاً من الاعتماد فقط على البيانات المصنفة. وهو يدعم التعلم المستمر ويساعد على بناء أنظمة ذكاء اصطناعي رؤيوي أكثر مرونة وتكيّفاً وذكاءً تتحسن بمرور الوقت.

انضم إلى مجتمعنا المتنامي. قم بزيارة مستودع GitHub الخاص بنا للتعمق في الذكاء الاصطناعي. هل تتطلع إلى بدء مشاريع الرؤية الحاسوبية الخاصة بك؟ استكشف خيارات الترخيص لدينا. تعرّف على المزيد حول الذكاء الاصطناعي في التصنيع والذكاء الاصطناعي البصري في صناعة السيارات على صفحات الحلول الخاصة بنا.

دعونا نبني المستقبل
للذكاء الاصطناعي معاً!

ابدأ رحلتك مع مستقبل التعلم الآلي

ابدأ مجاناً
تم نسخ الرابط إلى الحافظة