10 مشاريع سهلة في مجال الرؤية الحاسوبية للتعلم العملي
اكتشف 10 مشاريع سهلة للرؤية الحاسوبية للتعلم العملي وابدأ في بناء تطبيقات ذكاء اصطناعي مرئي واقعية يمكنك إنشاؤها وتجربتها اليوم.
هل لاحظت من قبل كيف تكتشف كاميرات المرور المركبات تلقائياً، أو كيف تستخدم المتاجر كاميرات المراقبة لتتبع المنتجات على الأرفف، أو كيف تستخدم تطبيقات اللياقة البدنية كاميرا هاتفك لفهم حركاتك في الوقت الفعلي؟ تعتمد كل هذه التقنيات على الرؤية الحاسوبية.
الرؤية الحاسوبية هي فرع من الذكاء الاصطناعي يساعد الآلات على رؤية وفهم الصور ومقاطع الفيديو. وبدلاً من مجرد تسجيل المرئيات، يمكن لهذه الأنظمة التعرف على الأشياء، وتحديد الأنماط، وتحويل ما تراه إلى معلومات مفيدة.
تُستخدم الرؤية الحاسوبية اليوم في مختلف الصناعات مثل التصنيع والرعاية الصحية وتجارة التجزئة، مع مجموعة واسعة من حالات الاستخدام العملية. تعمل هذه الأنظمة في سيناريوهات واقعية يومية، مما يمكن الشركات من مراقبة البيئات، وتحسين الدقة، والاستجابة بشكل أسرع للتغيرات.
تدعم نماذج الرؤية الحاسوبية مفتوحة المصدر المتطورة، مثل Ultralytics YOLO26، مجموعة متنوعة من مهام الرؤية، بما في ذلك اكتشاف الأشياء، وتصنيف الصور، وتجزئة المثيلات، وتقدير الوضعية، وتتبع الأشياء. صُممت هذه النماذج لتعمل بكفاءة في الوقت الفعلي، مما يسهل على المطورين بناء تطبيقات عملية عبر قطاعات مختلفة.
إذا كنت قد بدأت للتو في مجال الرؤية الحاسوبية، فإن إحدى أفضل طرق التعلم هي بناء حلول الذكاء الاصطناعي المرئي. العمل على أمثلة تطبيقية يمكن أن يجعل من السهل فهم كيفية عمل النماذج وكيف يمكن استخدامها في مواقف العالم الحقيقي.
في هذه المقالة، سنستكشف 10 مشاريع رؤية حاسوبية مناسبة للمبتدئين يمكنك البدء في بنائها على الفور. لنبدأ!
Link to this sectionفهم كيفية عمل الرؤية الحاسوبية#
الرؤية الحاسوبية هي مجال من مجالات الذكاء الاصطناعي يستخدم التعلم العميق، والتعلم الآلي، وتقنيات أخرى لمساعدة الآلات على فهم الصور ومقاطع الفيديو. وهي تتيح للأنظمة تحليل البيانات المرئية والتعرف على الأنماط.
تبدأ العملية غالباً بمعالجة الصور أو معالجة البيانات مسبقاً، حيث يتم تنظيف البيانات المرئية أو تغيير حجمها أو تحسينها قبل تحليلها. بعد ذلك، يتم تدريب شبكة عصبية على مجموعات بيانات كبيرة حتى تتمكن من تعلم الأنماط مثل الأشكال، والحواف، والقوام، وسمات الأشياء. وبشكل عام، كلما زادت جودة البيانات التي يتم تدريب النموذج عليها، كان أداؤه أفضل عبر سيناريوهات العالم الحقيقي المختلفة.
تعتمد العديد من أنظمة الرؤية الحاسوبية الحديثة على الشبكات العصبية التلافيفية (CNNs)، المصممة خصيصاً للمهام المتعلقة بالصور. تقوم شبكات CNN تلقائياً باستخراج السمات المرئية المهمة واستخدامها لإجراء التنبؤات. يقوم المطورون عادةً بتدريب هذه النماذج أو الخوارزميات باستخدام أطر عمل التعلم العميق الشهيرة التي تبسط عمليات البناء والاختبار.
تُبنى معظم مشاريع المبتدئين حول بضع مهام رؤية أساسية. إليك المهام الرئيسية التي ستواجهها:
- تصنيف الصور: تعين هذه المهمة تصنيفاً واحداً لصورة كاملة، مثل تحديد ما إذا كانت الصورة تعرض قطة أم كلباً.
- اكتشاف الأشياء: يتم تحديد وتظليل الأشياء داخل الصورة باستخدام BBox، على سبيل المثال، تحديد السيارات أو الأشخاص أو الدراجات في مشهد الشارع.
- تجزئة المثيلات: يتم فصل كل شيء في الصورة على مستوى البكسل بحيث يمكن تحديد شكله الدقيق، وهو أمر مفيد عند الحاجة إلى حدود دقيقة.
- تقدير الوضعية: يتم تحديد نقاط رئيسية على جسم الإنسان، مثل الكتفين، والمرفقين، والركبتين، في الصور لفهم الوضعية والحركة.
- تتبع الأشياء: يتم متابعة الأشياء عبر إطارات الفيديو لمراقبة كيفية تحركها بمرور الوقت.

الشكل 1. مثال على اكتشاف الأشياء باستخدام الرؤية الحاسوبية
Link to this sectionالتأثير المتزايد للرؤية الحاسوبية#
في الوقت الحاضر، يتم تبني الذكاء الاصطناعي المرئي في العديد من الصناعات. في الواقع، من المتوقع أن يصل سوق الرؤية الحاسوبية العالمي إلى 58 مليار دولار بحلول عام 2030، بمعدل نمو سنوي يقارب 20% مع قيام المزيد من المؤسسات بدمج الذكاء المرئي في أنظمتها.
على سبيل المثال، يعد النقل أحد مجالات النمو الرئيسية. فيما يتعلق بالسيارات ذاتية القيادة، تسمح الرؤية الحاسوبية للمركبات باكتشاف المسارات، والمركبات، والمشاة، وإشارات المرور في الوقت الفعلي.
تعد تجارة التجزئة مثالاً آخر مثيراً للاهتمام. تستخدم متاجر التجزئة الآلية الرؤية الحاسوبية ودمج المستشعرات لاكتشاف المنتجات التي يلتقطها العملاء، مما يتيح تسوقاً بدون دفع.
في غضون ذلك، في الرعاية الصحية، تُستخدم الرؤية الحاسوبية على نطاق واسع في التصوير الطبي لتحليل المسوحات مثل الأشعة السينية، والرنين المغناطيسي، وصور الأشعة المقطعية، مما يساعد الأطباء على اكتشاف التشوهات ودعم التشخيص. وفي أنظمة الذكاء الاصطناعي الأكبر، يمكنها أيضاً العمل جنباً إلى جنب مع معالجة اللغات الطبيعية (NLP) لدمج البيانات المرئية مع الملاحظات السريرية، أو التقارير، أو سجلات المرضى لإجراء تحليل أكثر شمولاً.
Link to this section10 مشاريع رؤية حاسوبية سهلة للمبتدئين#
الآن بعد أن أصبح لدينا فهم أفضل لكيفية عمل الرؤية الحاسوبية وأين تُستخدم، لنلقِ نظرة فاحصة على بعض مشاريع الرؤية الحاسوبية الصديقة للمبتدئين التي يمكنك البدء في بنائها اليوم.
Link to this sectionنظام إنذار أمني يعتمد على الرؤية#
تُستخدم أنظمة الأمان في المنازل والمكاتب والمستودعات للحفاظ على سلامة المساحات. الأنظمة التقليدية القائمة على المستشعرات ليست دائماً موثوقة، خاصة في البيئات المتغيرة.
على سبيل المثال، غالباً ما تطلق مستشعرات الحركة الأساسية إنذارات كاذبة بسبب الظلال، أو تغيرات الإضاءة، أو الحركات الصغيرة. في المقابل، يمكن لنظام يعتمد على الكاميرا ومدعوم بالرؤية الحاسوبية تحديد أشياء معينة ذات أهمية، مما يحسن الدقة بشكل كبير ويقلل من التنبيهات الكاذبة.
يمكن بناء نظام مراقبة أمني في الوقت الفعلي باستخدام Ultralytics YOLO26، والذي يعالج كل إطار كاميرا ويكتشف أشياء محددة مسبقاً مثل الأشخاص أو المركبات داخل المشهد. عند تحديد شيء مثير للاهتمام، يرسم النظام BBox حوله ويعين درجة ثقة للتنبؤ.

الشكل 2. اكتشاف شخص في فناء خلفي باستخدام نموذج Ultralytics YOLO (المصدر)
يمكن أيضاً تحديد منطقة اهتمام (ROI)، مثل مدخل أو منطقة مقيدة، بحيث يتم تفعيل التنبيهات فقط عندما تدخل الأشياء إلى تلك المنطقة المحددة. يمكن أن يساعدك هذا النوع من المشاريع في التعرف على كيفية عمل اكتشاف الأشياء في الوقت الفعلي وكيف يمكن دمج مخرجات النموذج مع الإجراءات الآلية، مثل الإخطارات أو الإنذارات.
Link to this sectionمراقبة التمرين باستخدام الرؤية الحاسوبية#
تستخدم العديد من تطبيقات اللياقة البدنية كاميرا لحساب التكرارات وتتبع الحركة. بينما تلتقط الكاميرا الفيديو، تقوم الرؤية الحاسوبية بتحليل حركة الجسم في الوقت الفعلي.
يمكن تطوير نظام مراقبة التمارين هذا باستخدام Ultralytics YOLO26 وقدراته في تقدير الوضعية. يعالج النموذج كل إطار ويكتشف نقاط الجسم الرئيسية مثل الكتفين، والمرفقين، والوركين، والركبتين. تشكل هذه النقاط هيكلاً عظمياً رقمياً يمثل وضعية الشخص وحركته.

الشكل 3. تتبع في الوقت الفعلي وحساب آلي لتكرارات التمارين (المصدر)
أثناء أداء تمارين مثل القرفصاء أو الضغط، يمكن قياس التغيرات في زوايا المفاصل لتقدير التكرارات. على سبيل المثال، من خلال تتبع كيفية انثناء الركبة واستقامتها أثناء تمرين القرفصاء، يمكن للنظام حساب كل تكرار مكتمل.
Link to this sectionإدارة مواقف المركبات بتمكين الرؤية#
يمكن أن يكون ركن السيارات محبطاً في أماكن مثل المولات، والمكاتب، والمطارات، والمجمعات السكنية. تستغرق عمليات التحقق اليدوي من المساحات وقتاً، وتظهر المستشعرات الأساسية فقط ما إذا كان مكان واحد مشغولاً أم لا. يمكن لنظام يعتمد على الكاميرا مراقبة منطقة المواقف بأكملها في وقت واحد وإظهار المساحات الخالية في الوقت الفعلي.
هذا يجعل من السهل على السائقين العثور على موقف بسرعة ويقلل من حركة المرور غير الضرورية داخل مواقف السيارات. كما أنه يساعد مديري العقارات على فهم كيفية استخدام المساحات طوال اليوم.
يمكنك بناء نظام إدارة مواقف باستخدام Ultralytics YOLO26 لاكتشاف المركبات من بث كاميرا مباشر. يقوم النظام بتحليل كل إطار وتحديد السيارات في المشهد.

الشكل 4. إدارة ذكية للمواقف بتمكين الرؤية الحاسوبية (المصدر)
يمكنك رسم مناطق للمواقف على الشاشة والتحقق مما إذا كانت السيارة المكتشفة تتداخل مع أي من تلك المناطق. إذا حدث ذلك، يتم تمييز هذا المكان على أنه مشغول. وإذا لم يحدث، فإنه يظل متاحاً.
لتوسيع النظام، يمكنك إضافة اكتشاف لوحة الترخيص وتطبيق التعرف الضوئي على الحروف (OCR) لقراءة أرقام اللوحات للتسجيل أو التحكم في الوصول.
Link to this sectionتحديد أنواع النباتات باستخدام تصنيف الصور#
يعد تحديد النباتات أمراً مهماً في الزراعة، والمراقبة البيئية، والتعليم. يستخدمه المزارعون لاكتشاف صحة المحاصيل، ويستخدمه الباحثون لدراسة التنوع البيولوجي، ويستخدمه الطلاب للتعرف على الأنواع المختلفة.
غالباً ما يتطلب تحديد النباتات التقليدي معرفة الخبراء والمقارنة اليدوية، وهو ما قد يستغرق وقتاً طويلاً وغير متسق. تسرع الرؤية الحاسوبية هذه العملية وتوسع نطاقها عن طريق تحليل الصور تلقائياً.
بالنسبة لهذا النوع من الحلول، يمكنك بناء نموذج تصنيف صور يتنبأ بنوع النبات من صورة. يمكنك البدء بنموذج مدرب مسبقاً مثل YOLO26 وضبطه على مجموعة بيانات نباتية مصنفة باستخدام التعلم بنقل المعرفة.
أثناء التدريب، يتعلم النموذج أنماطاً مثل شكل الورقة، والقوام، واختلافات الألوان للتمييز بين الأنواع. للبدء في هذا المشروع، يمكنك استكشاف مجموعات البيانات النباتية المتاحة للجمهور أو مجموعات البيانات المنسقة من قبل المجتمع على منصات مثل Roboflow Universe للوصول إلى الصور المصنفة بسرعة.
Link to this sectionإدارة الطوابير باستخدام الذكاء الاصطناعي المرئي#
تُستخدم أنظمة إدارة الطوابير في أماكن مثل البنوك، والمطارات، والمستشفيات، ومتاجر التجزئة لمراقبة تدفق الحشود وتقليل وقت الانتظار. وتحديداً، باستخدام الرؤية الحاسوبية، يمكنك عد ومراقبة الأشخاص في طابور باستخدام بث كاميرا مباشر.
يمكن لـ نظام مراقبة الطوابير المدمج مع نموذج رؤية حاسوبية، مثل YOLO26 لاكتشاف وتتبع الأشخاص، تبسيط إدارة الطوابير. يمكن للنظام معالجة كل إطار فيديو، واكتشاف الأفراد، وعد عدد الأشخاص الموجودين داخل منطقة طابور محددة مسبقاً.

الشكل 5. إدارة الطوابير في مطار مدعومة بالذكاء الاصطناعي المرئي
من خلال الجمع بين اكتشاف الأشياء ومنطق التتبع البسيط، يمكنك تقدير طول الطابور وحتى الحصول على فكرة عن وقت الانتظار بناءً على سرعة تحرك الطابور.
Link to this sectionاكتشاف ومراقبة الحشود القائمة على المناطق#
يعد عد الأشخاص في منطقة معينة أمراً مهماً للفعاليات، والمساحات العامة، وإدارة السلامة. بدلاً من عد الجميع في الإطار، يمكنك التركيز فقط على منطقة مختارة مثل مدخل، أو منطقة انتظار، أو منطقة مقيدة.
على وجه الخصوص، باستخدام YOLO26، يمكنك اكتشاف الأشخاص في كل إطار فيديو ثم تحديد منطقة مخصصة على الشاشة. يمكن تصميم هذا الحل لعد الأفراد الموجودين داخل ذلك الحد فقط.

الشكل 6. مراقبة الحشود باستخدام العد القائم على المنطقة (المصدر)
يساعدك هذا النهج على مراقبة كثافة الحشود في المناطق المستهدفة وفهم كيفية تغير الإشغال بمرور الوقت.
Link to this sectionفحص الجودة في التصنيع#
في التصنيع، يمكن أن تؤثر الأخطاء الصغيرة مثل المكونات المفقودة أو الوضع غير الصحيح على جودة المنتج وتؤدي إلى المرتجعات. لتقليل هذه المشكلات، تستخدم العديد من خطوط الإنتاج أنظمة رؤية لاكتشاف العيوب قبل انتقال المنتجات إلى المرحلة التالية.
يمكنك محاكاة خط تجميع بسيط حيث تلتقط كاميرا المنتجات أثناء تحركها على طول حزام ناقل. باستخدام YOLO26، يمكن لنظام كهذا التحقق مما إذا كانت جميع المكونات المطلوبة موجودة وموضوعة بشكل صحيح. وهو يحلل التفاصيل المرئية الرئيسية من خلال استخراج السمات، مما يمكنه من اكتشاف الأجزاء المفقودة، أو العناصر التالفة، أو التغليف غير الصحيح.

الشكل 7. اكتشاف وعدد الطرود في خط تجميع باستخدام YOLO
يمكن أيضاً تطوير هذا النوع من الأنظمة لعد العناصر، والتأكد من إغلاق التغليف، والتحقق مما إذا كانت المنتجات مرتبة بشكل صحيح قبل مغادرة الخط. يسلط هذا المشروع الضوء على كيفية استخدام الرؤية الحاسوبية في المصانع الحقيقية لاكتشاف المشكلات مبكراً والحفاظ على جودة منتج متسقة.
Link to this sectionمراقبة المرور باستخدام تجزئة الصور#
غالباً ما تتضمن مراقبة المرور أكثر من مجرد عد المركبات. في التقاطعات المزدحمة، يساعد فهم كيفية تموضع المركبات داخل المسارات ومقدار المساحة التي تشغلها على الطريق.
بالنسبة لنظام مراقبة المرور، يمكنك بناء حل باستخدام دعم تجزئة المثيلات في YOLO26. على عكس اكتشاف الأشياء الأساسي، تقوم تجزئة المثيلات بإنشاء أقنعة على مستوى البكسل لكل مركبة مكتشفة، وتحدد شكلها الدقيق بدلاً من مجرد رسم BBox.

الشكل 8. تجزئة، وعد، وتتبع المركبات في الوقت الفعلي (المصدر)
من خلال تحليل أقنعة التجزئة هذه، يمكن للنظام تقديم رؤى أكثر تفصيلاً حول استخدام المسار، وكثافة المركبات، وأنماط الازدحام. هذا المستوى الإضافي من الدقة يجعل من الأسهل مراقبة تدفق المرور، وتحديد الاختناقات، وتقييم مدى كفاءة استخدام مساحة الطريق.
Link to this sectionاستخدام الرؤية الحاسوبية لتقدير السرعة#
تقدير السرعة يُستخدم بشكل شائع في مراقبة المرور، والخدمات اللوجستية، وأنظمة النقل الذكية. باستخدام الرؤية الحاسوبية، يمكنك تقدير سرعة المركبة مباشرة من لقطات الفيديو دون استخدام مستشعرات فيزيائية أو رادار.

الشكل 9. تتبع المركبات باستخدام YOLO (المصدر)
على سبيل المثال، يمكنك استخدام YOLO26 لاكتشاف وتتبع الأشياء في تدفق فيديو. من خلال قياس المسافة التي تقطعها المركبة بين الإطارات واستخدام معدل إطارات الفيديو جنباً إلى جنب مع مرجع مسافة واقعي، يمكنك تقدير سرعتها.
Link to this sectionمراقبة سلامة العمال باستخدام تقدير الوضعية#
تعد سلامة العمال أمراً بالغ الأهمية في بيئات مثل مواقع البناء، والمصانع، والمستودعات. يمكن أن تؤدي الوضعية غير الآمنة، أو تقنيات الرفع غير السليمة، أو السقوط المفاجئ إلى زيادة خطر الإصابة بشكل كبير.
يمكن لأنظمة الرؤية الحاسوبية مراقبة أنماط الحركة من خلال تحليل الفيديو للمساعدة في تحديد مخاوف السلامة المحتملة. أحد الأمثلة هو استخدام YOLO26 مع تقدير الوضعية لتحليل وضعية العمال في الوقت الفعلي.
يكتشف النموذج نقاط الجسم الرئيسية مثل الكتفين، والوركين، والركبتين، والمرفقين. من خلال تقييم زوايا المفاصل وأنماط الحركة، يمكن للنظام تحديد الانحناء غير الآمن، أو وضعية الرفع السيئة، أو الحركات المفاجئة التي قد تشير إلى سقوط.

الشكل 10. استخدام تقدير وضعية الإنسان لتحليل وضعية عمال البناء (المصدر)
يمكنه أيضاً قياس المدة التي يظل فيها العامل في وضعية مجهدة وإطلاق تنبيهات إذا تم تجاوز عتبات الوضعية المحددة مسبقاً.
Link to this sectionأشياء يجب مراعاتها قبل البدء في مشروع ذكاء اصطناعي مرئي#
التخطيط المسبق لمشروع الذكاء الاصطناعي المرئي الخاص بك يمكن أن يساعدك على تجنب الأخطاء الشائعة وبناء نظام أكثر موثوقية. إليك بعض العوامل العملية التي يجب مراعاتها قبل البدء في مشروع رؤية حاسوبية:
- حدد الهدف بوضوح: كن محدداً بشأن ما تريد أن يفعله النظام، سواء كان ذلك اكتشاف الأشياء، أو تتبع الحركة، أو تقدير الوضعية، أو تصنيف الصور. يمكن لهدف واضح أن يوجه قراراتك التقنية بشكل أفضل طوال المشروع.
- أعط الأولوية لجودة مجموعات البيانات: تعد البيانات والتعليقات التوضيحية المصنفة جيداً، والمتنوعة، والممثلة ضرورية. غالباً ما تؤدي البيانات منخفضة الجودة إلى أداء نموذج غير موثوق به.
- اختر الأدوات المناسبة: اختر الأدوات المدعومة جيداً والتي يسهل العمل معها. تعد Python خياراً شائعاً للمبتدئين لأنها توفر نظاماً بيئياً كبيراً من مكتبات الرؤية الحاسوبية وموارد التعلم. كما تعد النماذج من عائلة Ultralytics YOLO شائعة أيضاً لمهام الرؤية المختلفة مثل اكتشاف الأشياء وتتبعها، مما يجعلها نقطة انطلاق عملية ومتاحة.
- التحسين لظروف العالم الحقيقي: يمكن أن تؤثر تغيرات الإضاءة، وزوايا الكاميرا، وضبابية الحركة، وفوضى الخلفية على الأداء. اختبر نظامك في ظروف مشابهة لما سيتم استخدامه فيه فعلياً.
- فكر في الخصوصية والأخلاقيات: إذا كنت تعمل مع صور أو مقاطع فيديو لأشخاص، ففكر في لوائح خصوصية البيانات وممارسات الذكاء الاصطناعي المسؤول. تأكد من جمع البيانات واستخدامها بشكل مناسب.
Link to this sectionأبرز النقاط#
تغير الرؤية الحاسوبية الطريقة التي تفهم بها الأنظمة البيانات المرئية. من خلال استكشاف أفكار المشاريع العملية وتطبيقات العالم الحقيقي، يمكن للمبتدئين اكتساب خبرة عملية بسرعة.
تجعل نماذج مثل Ultralytics YOLO26 من الأسهل البدء والحصول على نتائج أسرع. مع أهداف واضحة وبيانات عالية الجودة، يمكنك بناء أساس متين لأنظمة رؤية حاسوبية أكثر تقدماً.
انضم إلى مجتمعنا المتنامي واستكشف مستودع GitHub الخاص بنا للحصول على موارد الذكاء الاصطناعي. للبدء في بناء تطبيقات Vision AI اليوم، تحقق من خيارات الترخيص المتاحة لدينا. تعرف على كيفية تحويل الذكاء الاصطناعي في الزراعة لطرق العمل الزراعي، وكيف يشكل Vision AI في الروبوتات ملامح المستقبل من خلال زيارة صفحات الحلول الخاصة بنا.






