استكشاف كيفية عمل تطبيقات الرؤية الحاسوبية
تعمق معنا في تطبيقات الرؤية الحاسوبية. سنستعرض أيضاً مهام الرؤية الحاسوبية المختلفة مثل الكشف عن الكائنات والتجزئة.

عندما استكشفنا تاريخ نماذج الرؤية الحاسوبية، رأينا كيف تطورت الرؤية الحاسوبية والمسار الذي أدى إلى نماذج الرؤية المتقدمة التي نمتلكها اليوم. تدعم النماذج الحديثة مثل Ultralytics YOLOv8 مهام متعددة من مهام الرؤية الحاسوبية ويتم استخدامها في العديد من التطبيقات المثيرة.
في هذه المقالة، سنلقي نظرة على أساسيات الرؤية الحاسوبية ونماذج الرؤية. سنغطي كيفية عملها وتطبيقاتها المتنوعة عبر مختلف الصناعات. ابتكارات الرؤية الحاسوبية موجودة في كل مكان، وتشكل عالمنا بصمت. دعونا نكشفها واحدة تلو الأخرى!
Link to this sectionما هي الرؤية الحاسوبية؟#
الذكاء الاصطناعي (AI) هو مصطلح شامل يضم العديد من التقنيات التي تهدف إلى تكرار جزء من الذكاء البشري. أحد هذه الحقول الفرعية للذكاء الاصطناعي هو الرؤية الحاسوبية. تركز الرؤية الحاسوبية على منح الآلات عيوناً يمكنها الرؤية والملاحظة وفهم محيطها.
تماماً مثل الرؤية البشرية، تهدف حلول الرؤية الحاسوبية إلى تمييز الأشياء وحساب المسافات واكتشاف الحركات. ومع ذلك، على عكس البشر الذين لديهم تجارب حياتية لمساعدتهم على الرؤية والفهم، تعتمد أجهزة الكمبيوتر على كميات هائلة من البيانات، وكاميرات عالية الدقة، وخوارزميات معقدة.

الشكل 1. مقارنة بين الرؤية البشرية والرؤية الحاسوبية.
يمكن لأنظمة الرؤية الحاسوبية معالجة وتحليل البيانات المرئية مثل الصور ومقاطع الفيديو بسرعة ودقة مذهلة. إن القدرة على تحليل كميات هائلة من المعلومات المرئية بسرعة وبدقة تجعل من الرؤية الحاسوبية أداة قوية في مختلف الصناعات، بدءاً من التصنيع إلى الرعاية الصحية.
Link to this sectionتدعم نماذج الرؤية مهام الرؤية الحاسوبية المختلفة#
تعد نماذج الرؤية الحاسوبية جوهر أي تطبيق للرؤية الحاسوبية. فهي في الأساس خوارزميات حسابية مدعومة بتقنيات التعلم العميق مصممة لمنح الآلات القدرة على تفسير وفهم المعلومات المرئية. تمكّن نماذج الرؤية مهام الرؤية الحاسوبية الحاسمة التي تتراوح من تصنيف الصور إلى اكتشاف الأشياء. دعونا نلقي نظرة فاحصة على بعض هذه المهام وحالات استخدامها بمزيد من التفصيل.
Link to this sectionتصنيف الصور#
يتضمن تصنيف الصور تصنيف وتوسيم الصور في فئات أو أقسام محددة مسبقاً. يمكن تدريب نموذج رؤية مثل YOLOv8 على مجموعات بيانات كبيرة من الصور المصنفة. أثناء التدريب، يتعلم النموذج التعرف على الأنماط والميزات المرتبطة بكل فئة. بمجرد تدريبه، يمكنه التنبؤ بفئة الصور الجديدة غير المرئية من خلال تحليل ميزاتها ومقارنتها بالأنماط التي تعلمها.

الشكل 2. مثال على تصنيف الصور. (المصدر: towardsdatascience.com)
هناك أنواع مختلفة من تصنيف الصور. على سبيل المثال، عند التعامل مع الصور الطبية، يمكنك استخدام التصنيف الثنائي لتقسيم الصور إلى مجموعتين، مثل سليم أو مريض. نوع آخر هو التصنيف متعدد الفئات. يمكن أن يساعد في تصنيف الصور إلى مجموعات عديدة، مثل تصنيف حيوانات مختلفة في مزرعة مثل الخنازير والماعز والأبقار. أو، لنقل أنك تريد تصنيف الحيوانات إلى مجموعات ومجموعات فرعية، مثل تصنيف الحيوانات إلى ثدييات وطيور ثم تصنيفها لاحقاً إلى أنواع مثل الأسود والنمور والنسور والعصافير؛ سيكون التصنيف الهرمي هو الخيار الأفضل.
Link to this sectionكشف الكائنات#
اكتشاف الأشياء هو عملية تحديد وتحديد مواقع الأشياء في الصور وإطارات الفيديو باستخدام الرؤية الحاسوبية. وهي تتكون من مهمتين: تحديد موقع الشيء، الذي يرسم مربعات إحاطة حول الأشياء، وتصنيف الأشياء، الذي يحدد فئة كل شيء. بناءً على تعليقات مربعات الإحاطة، يمكن لنموذج الرؤية تعلم التعرف على الأنماط والميزات الخاصة بكل فئة من فئات الأشياء والتنبؤ بوجود هذه الأشياء وموقعها في صور جديدة غير مرئية.

الشكل 3. استخدام اكتشاف الأشياء عبر YOLOv8 للكشف عن اللاعبين في ملعب كرة قدم.
يحتوي اكتشاف الأشياء على العديد من حالات الاستخدام عبر صناعات مختلفة، في أي مكان من الرياضة إلى علم الأحياء البحرية. على سبيل المثال، في تجارة التجزئة، تستخدم تقنية Amazon’s Just Walk Out اكتشاف الأشياء لأتمتة عملية الدفع عن طريق تحديد العناصر التي يلتقطها العملاء. يسمح الجمع بين الرؤية الحاسوبية وبيانات المستشعر للعملاء بأخذ أغراضهم والمغادرة دون انتظار في الطابور.
إليك نظرة فاحصة على كيفية عمل ذلك:
- تلتقط الكاميرات المثبتة في السقف حركة العملاء داخل المتجر، وتتم معالجة لقطات الفيديو هذه في الوقت الفعلي بواسطة نماذج الرؤية.
- يُستخدم اكتشاف الأشياء لتحديد المنتج الدقيق الذي يلتقطه العميل ويضعه في سلة التسوق الخاصة به لتحديث عربة التسوق الافتراضية الخاصة به وفقاً لذلك.
- تعمل مستشعرات الوزن الموجودة على الرفوف على تحسين الدقة من خلال اكتشاف إزالة العناصر أو استبدالها.
- بينما يغادر العميل المتجر، يمكن استخدام اكتشاف الأشياء وتقنية التعرف على الوجه لتأكيد مغادرة العميل، ويمكن استخدام تفاصيل الدفع الخاصة به، مثل بطاقة الائتمان، لتحصيل الرسوم منه تلقائياً.
Link to this sectionالتجزئة الدلالية وتجزئة المثيلات#
التجزئة الدلالية وتجزئة المثيلات هي مهام رؤية حاسوبية تساعد في تقسيم الصور إلى أجزاء ذات معنى. تصنف التجزئة الدلالية البكسلات بناءً على معناها الدلالي وتعامل جميع الأشياء ضمن فئة واحدة ككيان واحد بنفس التسمية. وهي مناسبة لتوسيم الأشياء التي لا تُعد مثل "السماء" أو "المحيط" أو مجموعات مثل "الأوراق" أو "العشب".
من ناحية أخرى، يمكن لتجزئة المثيلات التمييز بين مثيلات مختلفة من نفس الفئة من خلال تعيين تسمية فريدة لكل شيء مكتشف. يمكنك استخدام تجزئة المثيلات لتجزئة الأشياء القابلة للعد حيث يكون عدد الأشياء واستقلاليتها أمراً مهماً. وهي تسمح بتحديد وتمييز أكثر دقة.

الشكل 4. مثال على التجزئة الدلالية وتجزئة المثيلات.
يمكننا فهم التباين بين التجزئة الدلالية وتجزئة المثيلات بشكل أوضح من خلال مثال يتعلق بـ السيارات ذاتية القيادة. تُعد التجزئة الدلالية رائعة للمهام التي تتطلب فهم محتويات مشهد ما ويمكن استخدامها في المركبات ذاتية القيادة لتصنيف الميزات على الطريق، مثل ممرات المشاة وإشارات المرور. وفي الوقت نفسه، يمكن استخدام تجزئة المثيلات في المركبات ذاتية القيادة للتمييز بين المشاة الأفراد، والمركبات، والعقبات.
Link to this sectionتقدير الوضع#
تقدير الوضعية هو مهمة رؤية حاسوبية تركز على اكتشاف وتتبع النقاط الرئيسية لوضعيات كائن ما في الصور أو مقاطع الفيديو. وهي تُستخدم بشكل شائع لتقدير وضعية الإنسان، مع نقاط رئيسية تشمل مناطق مثل الكتفين والركبتين. يساعد تقدير وضعية الإنسان في فهم وتمييز الإجراءات والحركات التي تعتبر حاسمة لتطبيقات مختلفة.

الشكل 5. مثال على تقدير الوضعية باستخدام YOLOv8.
يمكن استخدام تقدير الوضعية في الرياضة لتحليل كيفية تحرك الرياضيين. يستخدم الدوري الاميركي للمحترفين (NBA) تقدير الوضعية لدراسة حركات ومواقع اللاعبين أثناء المباراة. من خلال تتبع النقاط الرئيسية مثل الكتفين والمرفقين والركبتين والكاحلين، يوفر تقدير الوضعية رؤى مفصلة حول حركات اللاعبين. تساعد هذه الرؤى المدربين في تطوير استراتيجيات أفضل، وتحسين برامج التدريب، وإجراء تعديلات في الوقت الفعلي أثناء المباريات. كما يمكن للبيانات المساعدة في مراقبة إرهاق اللاعبين وخطر الإصابة لتحسين صحة وأداء اللاعبين بشكل عام.
Link to this sectionاكتشاف الأشياء بمربعات إحاطة موجهة#
يستخدم اكتشاف الأشياء بمربعات إحاطة موجهة (OBB) مستطيلات مدورة لتحديد وتحديد مواقع الأشياء في الصورة بدقة. على عكس مربعات الإحاطة القياسية التي تصطف مع محاور الصورة، تدور OBBs لتطابق اتجاه الشيء. وهذا يجعلها مفيدة بشكل خاص للأشياء التي لا تكون أفقية أو رأسية تماماً. وهي رائعة في تحديد وعزل الأشياء المدورة بدقة لمنع التداخلات في البيئات المزدحمة.

الشكل 6. مثال على اكتشاف بمربعات إحاطة موجهة على صورة جوية للقوارب باستخدام YOLOv8.
في المراقبة البحرية، يعد تحديد وتتبع السفن أمراً أساسياً للأمن وإدارة الموارد. يمكن استخدام اكتشاف OBB لتحديد دقيق لمواقع السفن، حتى عندما تكون متراصة بكثافة أو متجهة بزوايا مختلفة. يساعد ذلك في مراقبة ممرات الشحن، وإدارة حركة المرور البحرية، وتحسين عمليات الموانئ. يمكنه أيضاً المساعدة في الاستجابة للكوارث من خلال التحديد السريع وتقييم الأضرار التي تلحق بالسفن والبنية التحتية بعد أحداث مثل الأعاصير أو تسرب النفط.
Link to this sectionتتبع الأشياء#
حتى الآن، ناقشنا مهام الرؤية الحاسوبية التي تتعامل مع الصور. تتبع الأشياء هو مهمة رؤية حاسوبية يمكنها تتبع شيء ما عبر إطارات الفيديو. يبدأ بتحديد الشيء في الإطار الأول باستخدام خوارزميات الاكتشاف ثم يتبع موضعه باستمرار أثناء تحركه عبر الفيديو. يتضمن تتبع الأشياء تقنيات مثل اكتشاف الأشياء، واستخراج الميزات، والتنبؤ بالحركة للحفاظ على دقة التتبع.

الشكل 7. استخدام YOLOv8 لتتبع الأسماك.
يمكن استخدام نماذج الرؤية مثل YOLOv8 لـ تتبع الأسماك في علم الأحياء البحرية. باستخدام كاميرات تحت الماء، يمكن للباحثين مراقبة تحركات وسلوكيات الأسماك في بيئاتها الطبيعية. تبدأ العملية باكتشاف الأسماك الفردية في الإطارات الأولى ثم تتبع مواقعها عبر الفيديو. يساعد تتبع الأسماك العلماء في فهم أنماط الهجرة، والسلوكيات الاجتماعية، والتفاعلات مع البيئة. كما أنه يدعم ممارسات الصيد المستدامة من خلال توفير رؤى حول توزيع الأسماك ووفرتها.
Link to this sectionنظرة أخيرة على الرؤية الحاسوبية#
تعمل الرؤية الحاسوبية بنشاط على تغيير كيفية استخدامنا للتكنولوجيا وتفاعلنا مع العالم. من خلال استخدام نماذج التعلم العميق والخوارزميات المعقدة لفهم الصور ومقاطع الفيديو، تساعد الرؤية الحاسوبية الصناعات على تبسيط العديد من العمليات. تجعل مهام الرؤية الحاسوبية مثل اكتشاف الأشياء وتتبع الأشياء من الممكن إنشاء حلول لم يتم تخيلها من قبل. مع استمرار تحسن تقنية الرؤية الحاسوبية، يحمل المستقبل العديد من التطبيقات المبتكرة!
دعونا نتعلم وننمو معاً! استكشف مستودع GitHub الخاص بنا لرؤية مساهماتنا في الذكاء الاصطناعي. تحقق من كيفية إعادة تعريفنا لصناعات مثل السيارات ذاتية القيادة والزراعة باستخدام الذكاء الاصطناعي. 🚀






