Yolo فيجن شنتشن
شنتشن
انضم الآن

10 مشاريع سهلة في مجال الرؤية الحاسوبية للتعلم العملي

اكتشف 10 مشاريع سهلة في مجال الرؤية الحاسوبية للتعلم العملي وابدأ في بناء تطبيقات الرؤية الاصطناعية في العالم الحقيقي التي يمكنك إنشاؤها وتجربتها اليوم.

قم بتوسيع نطاق مشاريع الرؤية الحاسوبية الخاصة بك باستخدام Ultralytics

تواصل معنا

هل لاحظت من قبل كيف detect كاميرات المرور detect تلقائيًا، وكيف تستخدم المتاجر كاميرات المراقبة track على الرفوف، أو كيف تستخدم تطبيقات اللياقة البدنية كاميرا هاتفك لفهم حركاتك في الوقت الفعلي؟ كل هذه التقنيات تعتمد على الرؤية الحاسوبية.

الرؤية الحاسوبية هي أحد فروع الذكاء الاصطناعي الذي يساعد الآلات على رؤية الصور ومقاطع الفيديو وفهمها. بدلاً من مجرد تسجيل الصور، يمكن لهذه الأنظمة التعرف على الأشياء وتحديد الأنماط وتحويل ما تراه إلى معلومات مفيدة.

اليوم، تُستخدم الرؤية الحاسوبية في مختلف الصناعات مثل التصنيع والرعاية الصحية والتجزئة، مع مجموعة واسعة من حالات الاستخدام العملي. تعمل هذه الأنظمة في سيناريوهات واقعية يومية، مما يمكّن الشركات من مراقبة البيئات وتحسين الدقة والاستجابة بشكل أسرع للتغييرات.

تدعم نماذج الرؤية الحاسوبية المفتوحة المصدر المتطورة، مثل Ultralytics مجموعة متنوعة من مهام الرؤية، بما في ذلك اكتشاف الكائنات وتصنيف الصور وتجزئة الحالات وتقدير الوضع وتتبع الكائنات. تم تصميم هذه النماذج للعمل بكفاءة في الوقت الفعلي، مما يسهل على المطورين إنشاء تطبيقات عملية في مختلف القطاعات.

إذا كنت مبتدئًا في مجال الرؤية الحاسوبية، فإن إحدى أفضل الطرق للتعلم هي بناء حلول الذكاء الاصطناعي للرؤية. يمكن أن يسهل العمل على أمثلة عملية فهم كيفية عمل النماذج وكيفية استخدامها في مواقف واقعية.

في هذه المقالة، سوف نستكشف 10 مشاريع رؤية حاسوبية مناسبة للمبتدئين يمكنك البدء في بنائها على الفور. هيا بنا نبدأ!

فهم كيفية عمل الرؤية الحاسوبية

الرؤية الحاسوبية هي مجال من مجالات الذكاء الاصطناعي يستخدم التعلم العميق والتعلم الآلي وتقنيات أخرى لمساعدة الآلات على فهم الصور ومقاطع الفيديو. وهي تتيح للأنظمة تحليل البيانات المرئية والتعرف على الأنماط.

غالبًا ما تبدأ العملية بمعالجة الصور أو المعالجة المسبقة للبيانات، حيث يتم تنظيف البيانات المرئية أو تغيير حجمها أو تحسينها قبل تحليلها. ثم يتم تدريب الشبكة العصبية على مجموعات بيانات كبيرة حتى تتمكن من تعلم الأنماط مثل الأشكال والحواف والأنسجة وخصائص الكائنات. بشكل عام، كلما زادت جودة البيانات التي يتم تدريب النموذج عليها، كان أداؤه أفضل في مختلف السيناريوهات الواقعية.

تعتمد العديد من أنظمة الرؤية الحاسوبية الحديثة على الشبكات العصبية التلافيفية (CNNs)، والتي تم تصميمها خصيصًا للمهام المتعلقة بالصور. تقوم الشبكات العصبية التلافيفية باستخراج الميزات البصرية المهمة تلقائيًا واستخدامها لعمل تنبؤات. عادةً ما يقوم المطورون بتدريب هذه النماذج أو الخوارزميات باستخدام أطر عمل التعلم العميق الشائعة التي تبسط عملية البناء والاختبار. 

تتمحور معظم مشاريع المبتدئين حول عدد قليل من المهام الأساسية المتعلقة بالرؤية. فيما يلي أهمها:

  • تصنيف الصور: تخصص هذه المهمة علامة واحدة للصورة بأكملها، مثل تحديد ما إذا كانت الصورة تظهر قطة أم كلبًا.
  • كشف الأجسام: يتم تحديد مواقع الأجسام الموجودة داخل الصورة وتمييزها باستخدام مربعات تحديد، على سبيل المثال، تحديد السيارات أو الأشخاص أو الدراجات في مشهد شارع.
  • تجزئة المثيلات: يتم فصل كل كائن في الصورة على مستوى البكسل بحيث يمكن تحديد شكله بدقة، وهو أمر مفيد عندما تكون الحدود الدقيقة مطلوبة.
  • تقدير الوضع: يتم تحديد النقاط الرئيسية على جسم الإنسان، مثل الكتفين والمرفقين والركبتين، في الصور لفهم الوضع والحركة.
  • تتبع الكائنات: يتم تتبع الكائنات عبر إطارات الفيديو لمراقبة كيفية تحركها بمرور الوقت.
الشكل 1. مثال على اكتشاف الأجسام باستخدام الرؤية الحاسوبية

التأثير المتزايد للرؤية الحاسوبية

في الوقت الحاضر، يتم اعتماد الذكاء الاصطناعي البصري في العديد من الصناعات. في الواقع، من المتوقع أن يصل حجم سوق الرؤية الحاسوبية العالمية إلى 58 مليار دولار بحلول عام 2030، بمعدل نمو سنوي يقارب 20٪، مع قيام المزيد من المؤسسات بدمج الذكاء البصري في أنظمتها.

على سبيل المثال، يعد النقل أحد المجالات الرئيسية للنمو. فيما يتعلق بالسيارات ذاتية القيادة، تتيح الرؤية الحاسوبية للمركبات detect والمركبات والمشاة وإشارات المرور في الوقت الفعلي. 

التجزئة هي مثال آخر مثير للاهتمام. تستخدم متاجر التجزئة الآلية الرؤية الحاسوبية ودمج أجهزة الاستشعار detect يختارها العملاء، مما يتيح التسوق بدون الدفع عند الخروج.

وفي الوقت نفسه، في مجال الرعاية الصحية، تُستخدم الرؤية الحاسوبية على نطاق واسع في التصوير الطبي لتحليل الفحوصات مثل الأشعة السينية والتصوير بالرنين المغناطيسي والتصوير المقطعي المحوسب، مما يساعد الأطباء detect ودعم التشخيص. وفي أنظمة الذكاء الاصطناعي الأكبر حجماً، يمكن أن تعمل أيضاً جنباً إلى جنب مع معالجة اللغة الطبيعية (NLP) لدمج البيانات المرئية مع الملاحظات السريرية أو التقارير أو سجلات المرضى من أجل تحليل أكثر شمولاً.

10 مشاريع سهلة في مجال الرؤية الحاسوبية للمبتدئين

الآن بعد أن أصبح لدينا فهم أفضل لكيفية عمل الرؤية الحاسوبية وأين يتم استخدامها، دعونا نلقي نظرة فاحصة على بعض مشاريع الرؤية الحاسوبية الملائمة للمبتدئين والتي يمكنك البدء في بنائها اليوم.

1. نظام إنذار أمني مدفوع بالرؤية

تُستخدم أنظمة الأمان في المنازل والمكاتب والمستودعات للحفاظ على أمان الأماكن. لا تعتبر الأنظمة التقليدية القائمة على أجهزة الاستشعار موثوقة دائمًا، خاصة في البيئات المتغيرة.

على سبيل المثال، غالبًا ما تؤدي مستشعرات الحركة الأساسية إلى إطلاق إنذارات كاذبة بسبب الظلال أو تغيرات الإضاءة أو الحركات الصغيرة. في المقابل، يمكن للنظام القائم على الكاميرات والمزود برؤية حاسوبية تحديد الأجسام المحددة التي تهم المستخدم، مما يحسن الدقة بشكل كبير ويقلل من الإنذارات الكاذبة.

يمكن إنشاء نظام مراقبة أمنية في الوقت الفعلي باستخدام Ultralytics الذي يعالج كل إطار من الكاميرا ويكتشف الأجسام المحددة مسبقًا مثل الأشخاص أو المركبات داخل المشهد. عند تحديد جسم مهم، يرسم النظام مربعات حدودية حوله ويخصص درجة ثقة للتنبؤ.

الشكل 2. اكتشاف شخص في الفناء الخلفي باستخدامYOLO Ultralytics YOLO (المصدر)

يمكن أيضًا تحديد منطقة الاهتمام (ROI)، مثل مدخل أو منطقة محظورة، بحيث يتم تشغيل التنبيهات فقط عند دخول كائنات إلى تلك المنطقة المحددة. يمكن أن يساعدك هذا النوع من المشاريع على التعرف على كيفية عمل اكتشاف الكائنات في الوقت الفعلي وكيفية دمج مخرجات النموذج مع الإجراءات التلقائية، مثل الإخطارات أو الإنذارات.

2. مراقبة التمرينات باستخدام الرؤية الحاسوبية

تستخدم العديد من تطبيقات اللياقة البدنية الكاميرا لحساب عدد التكرارات track . بينما تلتقط الكاميرا الفيديو، تقوم الرؤية الحاسوبية بتحليل حركة الجسم في الوقت الفعلي.

يمكن تطوير نظام مراقبة التمارين الرياضية هذا باستخدام Ultralytics وقدراته على تقدير الوضع. يعالج النموذج كل إطار ويكتشف النقاط الرئيسية في الجسم مثل الكتفين والمرفقين والوركين والركبتين. تشكل هذه النقاط هيكلاً عظمياً رقمياً يمثل وضعية الشخص وحركته.

الشكل 3. تتبع في الوقت الفعلي وعدد تكرارات التمرينات تلقائيًا (المصدر

عند أداء تمارين مثل القرفصاء أو الضغط، يمكن قياس التغيرات في زوايا المفاصل لتقدير عدد مرات التكرار. على سبيل المثال، من خلال تتبع كيفية انثناء الركبة واستقامتها أثناء القرفصاء، يمكن للنظام حساب كل تكرار مكتمل.

3. إدارة مواقف السيارات باستخدام الرؤية

قد يكون إيجاد مكان لوقوف السيارة أمرًا محبطًا في أماكن مثل مراكز التسوق والمكاتب والمطارات والمجمعات السكنية. يستغرق التحقق اليدوي من توفر الأماكن وقتًا طويلاً، ولا تظهر المستشعرات الأساسية سوى ما إذا كان مكان واحد مشغولًا أم لا. يمكن لنظام قائم على الكاميرات مراقبة منطقة وقوف السيارات بأكملها في وقت واحد وإظهار الأماكن الشاغرة في الوقت الفعلي.

وهذا يسهل على السائقين العثور على مواقف بسرعة ويقلل من الازدحام غير الضروري داخل مواقف السيارات. كما يساعد مديري العقارات على فهم كيفية استخدام المساحات على مدار اليوم.

يمكنك إنشاء نظام لإدارة مواقف السيارات باستخدام Ultralytics detect من بث مباشر للكاميرا. يقوم النظام بتحليل كل إطار وتحديد السيارات الموجودة في المشهد.

الشكل 4. إدارة ذكية لمواقف السيارات بواسطة الرؤية الحاسوبية (المصدر)

يمكنك رسم مناطق وقوف السيارات على الشاشة والتحقق مما إذا كانت السيارة المكتشفة تتداخل مع أي من تلك المناطق. إذا كان الأمر كذلك، يتم وضع علامة على تلك البقعة على أنها مشغولة. إذا لم يكن الأمر كذلك، تظل متاحة.

لتوسيع النظام، يمكنك إضافة ميزة التعرف على لوحات السيارات وتطبيق تقنية التعرف الضوئي على الحروف (OCR) لقراءة أرقام اللوحات لأغراض التسجيل أو التحكم في الوصول.

4. تحديد أنواع النباتات باستخدام تصنيف الصور

تعد عملية تحديد النباتات مهمة في الزراعة ومراقبة البيئة والتعليم. يستخدمها المزارعون detect صحة detect ويستخدمها الباحثون لدراسة التنوع البيولوجي، ويستخدمها الطلاب للتعرف على الأنواع المختلفة. 

غالبًا ما يتطلب التعرف على النباتات التقليدية معرفة متخصصة ومقارنة يدوية، مما قد يستغرق وقتًا طويلاً ويكون غير متسق. تعمل الرؤية الحاسوبية على تسريع هذه العملية وتوسيع نطاقها من خلال تحليل الصور تلقائيًا.

بالنسبة لهذا النوع من الحلول، يمكنك إنشاء نموذج لتصنيف الصور يتنبأ بنوع النبات من الصورة. يمكنك البدء بنموذج مدرب مسبقًا مثل YOLO26 وضبطه على مجموعة بيانات نباتية مصنفة باستخدام التعلم النقلي. 

أثناء التدريب، يتعلم النموذج أنماطًا مثل شكل الأوراق وملمسها واختلافات ألوانها لتمييز الأنواع عن بعضها البعض. لبدء العمل في هذا المشروع، يمكنك استكشاف مجموعات بيانات النباتات المتاحة للجمهور أو مجموعات البيانات المجتمعية المنسقة على منصات مثل Roboflow للوصول إلى الصور المصنفة بسرعة.

5. إدارة الطوابير باستخدام الذكاء الاصطناعي البصري

تُستخدم أنظمة إدارة الطوابير في أماكن مثل البنوك والمطارات والمستشفيات ومتاجر البيع بالتجزئة لمراقبة تدفق الحشود وتقليل وقت الانتظار. على وجه التحديد، باستخدام الرؤية الحاسوبية، يمكنك حساب ومراقبة الأشخاص في الطابور باستخدام بث مباشر من الكاميرا.

يمكن لنظام مراقبة الطوابير المدمج مع نموذج الرؤية الحاسوبية، مثل YOLO26 لاكتشاف الأشخاص وتتبعهم، أن يبسط إدارة الطوابير. يمكن للنظام معالجة كل إطار فيديو، detect وحساب عدد الأشخاص الموجودين داخل منطقة طابور محددة مسبقًا.

الشكل 5. إدارة الطوابير في المطار بواسطة الذكاء الاصطناعي البصري

من خلال الجمع بين اكتشاف الأجسام ومنطق التتبع البسيط، يمكنك تقدير طول الطابور وحتى الحصول على فكرة عن وقت الانتظار بناءً على سرعة تحرك الطابور.

6. الكشف عن التجمعات ومراقبتها على أساس المنطقة

يعد حساب عدد الأشخاص في منطقة معينة أمرًا مهمًا للأحداث والأماكن العامة وإدارة السلامة. بدلاً من حساب عدد جميع الأشخاص الموجودين في الإطار، يمكنك التركيز فقط على منطقة محددة مثل المدخل أو منطقة الانتظار أو المنطقة المحظورة.

على وجه الخصوص، باستخدام YOLO26، يمكنك detect في كل إطار فيديو ثم تحديد منطقة مخصصة على الشاشة. يمكن تصميم هذا الحل بحيث يحسب فقط الأفراد الموجودين داخل تلك الحدود.

الشكل 6. مراقبة الحشود باستخدام العد القائم على المنطقة (المصدر)

يساعدك هذا النهج على مراقبة كثافة الحشود في المناطق المستهدفة وفهم كيفية تغير معدل الإشغال بمرور الوقت. 

7. فحص الجودة في التصنيع

في مجال التصنيع، يمكن أن تؤثر الأخطاء الصغيرة مثل المكونات المفقودة أو الوضع غير الصحيح على جودة المنتج وتؤدي إلى إرجاعه. للحد من هذه المشكلات، تستخدم العديد من خطوط الإنتاج أنظمة الرؤية للكشف عن العيوب قبل انتقال المنتجات إلى المرحلة التالية.

يمكنك محاكاة خط تجميع بسيط حيث تلتقط الكاميرا المنتجات أثناء تحركها على حزام ناقل. باستخدام YOLO26، يمكن لمثل هذا النظام التحقق من وجود جميع المكونات المطلوبة ووضعها بشكل صحيح. يقوم بتحليل التفاصيل المرئية الرئيسية من خلال استخراج الميزات، مما يتيح له اكتشاف الأجزاء المفقودة أو العناصر التالفة أو التغليف غير الصحيح.

الشكل 7. اكتشاف وحساب العبوات في خط التجميع باستخدام YOLO

يمكن أيضًا تطوير هذا النوع من الأنظمة لحساب العناصر والتأكد من إغلاق العبوات والتحقق من ترتيب المنتجات بشكل صحيح قبل مغادرتها خط الإنتاج. يسلط هذا المشروع الضوء على كيفية استخدام الرؤية الحاسوبية في المصانع الحقيقية لاكتشاف المشكلات في وقت مبكر والحفاظ على جودة المنتجات.

8. مراقبة حركة المرور باستخدام تقسيم الصور

غالبًا ما تتضمن مراقبة حركة المرور أكثر من مجرد عد المركبات. في التقاطعات المزدحمة، من المفيد فهم كيفية وضع المركبات داخل الممرات ومقدار المساحة التي تشغلها على الطريق.

بالنسبة لنظام مراقبة حركة المرور، يمكنك إنشاء حل باستخدام دعم تقسيم المثيلات في YOLO26. على عكس الكشف الأساسي عن الكائنات، يولد تقسيم المثيلات أقنعة على مستوى البكسل لكل مركبة يتم الكشف عنها، محددًا شكلها الدقيق بدلاً من مجرد رسم مربع حدودي.

الشكل 8. تقسيم المركبات وحسابها وتتبعها في الوقت الفعلي (المصدر)

من خلال تحليل أقنعة التجزئة هذه، يمكن للنظام توفير رؤى أكثر تفصيلاً حول استخدام الممرات وكثافة المركبات وأنماط الازدحام. هذا المستوى الإضافي من الدقة يجعل من السهل مراقبة تدفق حركة المرور وتحديد الاختناقات وتقييم مدى كفاءة استخدام مساحة الطريق.

9. استخدام الرؤية الحاسوبية لتقدير السرعة

يستخدم تقدير السرعة بشكل شائع في مراقبة حركة المرور واللوجستيات وأنظمة النقل الذكية. باستخدام الرؤية الحاسوبية، يمكنك تقدير سرعة المركبة مباشرة من لقطات الفيديو دون استخدام أجهزة استشعار مادية أو رادار.

الشكل 9. تتبع المركبات باستخدام YOLO المصدر)

على سبيل المثال، يمكنك استخدام YOLO26 detect track في دفق الفيديو. من خلال قياس المسافة التي تقطعها السيارة بين الإطارات واستخدام معدل إطارات الفيديو مع مرجع المسافة في العالم الحقيقي، يمكنك تقدير سرعتها.

10. مراقبة سلامة العمال من خلال تقدير الوضع

تعد سلامة العمال أمراً بالغ الأهمية في بيئات مثل مواقع البناء والمصانع والمستودعات. فقد تؤدي الوضعيات غير الآمنة أو تقنيات الرفع غير السليمة أو السقوط المفاجئ إلى زيادة خطر الإصابة بشكل كبير.

يمكن لأنظمة الرؤية الحاسوبية مراقبة أنماط الحركة من خلال تحليل الفيديو للمساعدة في تحديد المخاوف المحتملة المتعلقة بالسلامة. أحد الأمثلة على ذلك هو استخدام YOLO26 مع تقدير الوضع لتحليل وضعية العمال في الوقت الفعلي.

يكتشف النموذج نقاط الجسم الرئيسية مثل الكتفين والوركين والركبتين والمرفقين. من خلال تقييم زوايا المفاصل وأنماط الحركة، يمكن للنظام تحديد الانحناء غير الآمن أو وضعية الرفع السيئة أو الحركات المفاجئة التي قد تشير إلى السقوط.

الشكل 10. استخدام تقدير وضعية الإنسان لتحليل وضعية عمال البناء (المصدر)

كما يمكنه قياس المدة التي يقضيها العامل في وضع متوتر وإصدار تنبيهات في حالة تجاوز عتبات الوضع المحددة مسبقًا.

أمور يجب مراعاتها قبل البدء في مشروع الرؤية بالذكاء الاصطناعي

التخطيط المسبق لمشروع الرؤية الاصطناعية يمكن أن يساعدك على تجنب الأخطاء الشائعة وبناء نظام أكثر موثوقية. فيما يلي بعض العوامل العملية التي يجب مراعاتها قبل البدء في مشروع الرؤية الحاسوبية:

  • حدد الهدف بوضوح: كن محددًا بشأن ما تريد أن يفعله النظام، سواء كان ذلك اكتشاف الأجسام أو تتبع الحركة أو تقدير الوضع أو تصنيف الصور. يمكن أن يساعدك الهدف الواضح في توجيه قراراتك الفنية بشكل أفضل طوال المشروع.
  • إعطاء الأولوية لجودة مجموعة البيانات: من الضروري أن تكون البيانات والتعليقات التوضيحية جيدة التسمية ومتنوعة وممثلة. غالبًا ما تؤدي البيانات ذات الجودة الرديئة إلى أداء غير موثوق للنموذج.
  • اختر الأدوات المناسبة: اختر الأدوات التي تحظى بدعم جيد وسهلة الاستخدام. Python خيارًا شائعًا للمبتدئين لأنها توفر نظامًا بيئيًا كبيرًا من مكتبات الرؤية الحاسوبية وموارد التعلم. نماذج من Ultralytics YOLO شائعة أيضًا في مهام الرؤية المختلفة مثل اكتشاف الكائنات وتتبعها، مما يجعلها نقطة انطلاق عملية وسهلة الوصول.
  • التحسين وفقًا للظروف الواقعية: يمكن أن تؤثر تغيرات الإضاءة وزوايا الكاميرا وضبابية الحركة وفوضى الخلفية على الأداء. اختبر نظامك في ظروف مشابهة للظروف التي سيتم استخدامه فيها بالفعل.
  • فكر في الخصوصية والأخلاق: إذا كنت تعمل مع صور أو مقاطع فيديو لأشخاص، فضع في اعتبارك لوائح خصوصية البيانات وممارسات الذكاء الاصطناعي المسؤولة. تأكد من جمع البيانات واستخدامها بشكل مناسب.

النقاط الرئيسية

تغير الرؤية الحاسوبية طريقة فهم الأنظمة للبيانات المرئية. من خلال استكشاف أفكار مشاريع عملية وتطبيقات واقعية، يمكن للمبتدئين اكتساب خبرة عملية بسرعة. 

تسهل نماذج مثل Ultralytics البدء في العمل والحصول على نتائج أسرع. من خلال أهداف واضحة وبيانات عالية الجودة، يمكنك بناء أساس متين لأنظمة رؤية حاسوبية أكثر تقدمًا.

انضم إلى مجتمعنا المتنامي واستكشف مستودع GitHub الخاص بنا للحصول على موارد الذكاء الاصطناعي. لبدء البناء باستخدام الذكاء الاصطناعي البصري اليوم، تحقق من خيارات الترخيص المتاحة لدينا. تعرف على كيفية قيام الذكاء الاصطناعي في الزراعة بتغيير شكل الزراعة وكيفية قيام الذكاء الاصطناعي البصري في مجال الروبوتات بتشكيل المستقبل من خلال زيارة صفحات الحلول الخاصة بنا.

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا