Yolo فيجن شنتشن
شنتشن
انضم الآن

استكشاف كيفية عمل تطبيقات رؤية الكمبيوتر

أبيرامي فينا

5 دقائق قراءة

9 أغسطس، 2024

تعمق معنا في تطبيقات الرؤية الحاسوبية. سنتناول أيضًا مهام الرؤية الحاسوبية المختلفة مثل اكتشاف الأجسام وتقسيمها.

عندما استكشفنا تاريخ نماذج الرؤية الحاسوبية، رأينا كيف تطورت الرؤية الحاسوبية والمسار الذي أدى إلى نماذج الرؤية المتقدمة التي لدينا اليوم. النماذج الحديثة مثل Ultralytics YOLOv8 تدعم العديد من مهام الرؤية الحاسوبية وتُستخدم في العديد من التطبيقات المثيرة. 

في هذه المقالة، سوف نلقي نظرة على أساسيات الرؤية الحاسوبية ونماذج الرؤية. سنغطي كيفية عملها وتطبيقاتها المتنوعة عبر مختلف الصناعات. ابتكارات الرؤية الحاسوبية موجودة في كل مكان، وتشكل عالمنا بصمت. دعونا نكشفها واحدة تلو الأخرى! 

ما هي رؤية الحاسوب؟

الذكاء الاصطناعي (AI) هو مصطلح شامل يضم العديد من التقنيات التي تهدف إلى تكرار جزء من الذكاء البشري. أحد المجالات الفرعية للذكاء الاصطناعي هو رؤية الكمبيوتر. تركز رؤية الكمبيوتر على منح الآلات عيونًا يمكنها الرؤية والمراقبة وفهم محيطها. 

تمامًا مثل الرؤية البشرية، تهدف حلول الرؤية الحاسوبية إلى تمييز الأجسام وحساب المسافات detect الحركات. ومع ذلك، على عكس البشر، الذين لديهم خبرات طويلة تساعدهم على الرؤية والفهم، تعتمد أجهزة الكمبيوتر على كميات هائلة من البيانات والكاميرات عالية الوضوح والخوارزميات المعقدة. 

الشكل 1. مقارنة بين رؤية الإنسان ورؤية الحاسوب.

يمكن لأنظمة الرؤية الحاسوبية معالجة وتحليل البيانات المرئية مثل الصور ومقاطع الفيديو بسرعات ودقة لا تصدق. إن القدرة على تحليل كميات هائلة من المعلومات المرئية بسرعة ودقة تجعل الرؤية الحاسوبية أداة قوية في مختلف الصناعات، بدءًا من التصنيع إلى الرعاية الصحية.

تدعم نماذج الرؤية مهام رؤية الكمبيوتر المختلفة

تعتبر نماذج رؤية الحاسوب هي جوهر أي تطبيق رؤية حاسوب. وهي في الأساس خوارزميات حسابية مدعومة بتقنيات التعلم العميق المصممة لمنح الآلات القدرة على تفسير المعلومات المرئية وفهمها. تمكّن نماذج الرؤية مهام رؤية الحاسوب الحاسمة التي تتراوح من تصنيف الصور إلى الكشف عن الأجسام. دعونا نلقي نظرة فاحصة على بعض هذه المهام وحالات استخدامها بمزيد من التفصيل. 

تصنيف الصور

يتضمن تصنيف الصور تصنيف الصور وتصنيفها إلى فئات أو فئات محددة مسبقًا. نموذج رؤية مثل YOLOv8 على مجموعات بيانات كبيرة من الصور المصنفة. أثناء التدريب، يتعلم النموذج التعرف على الأنماط والميزات المرتبطة بكل فئة. بمجرد التدريب، يمكن للنموذج التنبؤ بفئة الصور الجديدة غير المرئية من خلال تحليل سماتها ومقارنتها بالأنماط المكتسبة. 

الشكل 2. مثال على تصنيف الصور. (المصدر: towardsdatascience.com)

هناك أنواع مختلفة من تصنيف الصور. على سبيل المثال، عند التعامل مع الصور الطبية، يمكنك استخدام التصنيف الثنائي لتقسيم الصور إلى مجموعتين، مثل الصور السليمة أو المريضة. نوع آخر هو التصنيف متعدد الطبقات. يمكن أن يساعد في classify الصور إلى عدة مجموعات، مثل تصنيف الحيوانات المختلفة في مزرعة مثل الخنازير والماعز والأبقار. أو لنفترض أنك تريد classify الحيوانات إلى مجموعات ومجموعات فرعية، مثل تصنيف الحيوانات إلى ثدييات وطيور ثم إلى أنواع أخرى مثل الأسود والنمور والنسور والعصافير، سيكون التصنيف الهرمي هو الخيار الأفضل.

اكتشاف الكائنات

الكشف عن الأجسام هو عملية تحديد وتعيين مواقع الأجسام في الصور وإطارات الفيديو باستخدام الرؤية الحاسوبية. ويتكون من مهمتين: تحديد موقع الجسم، والذي يرسم مربعات إحاطة حول الأجسام، وتصنيف الجسم، والذي يحدد فئة كل جسم. بناءً على ترميز مربعات الإحاطة، يمكن لنموذج الرؤية أن يتعلم التعرف على الأنماط والميزات الخاصة بكل فئة جسم والتنبؤ بوجود وموقع هذه الأجسام في صور جديدة غير مرئية. 

الشكل 3. YOLOv8 للكشف عن الأجسام التي يتم استخدامها detect اللاعبين في ملعب كرة قدم.

يحتوي اكتشاف الكائنات على العديد من حالات الاستخدام في مختلف الصناعات، في أي مكان من الرياضة إلى علم الأحياء البحرية. على سبيل المثال، في البيع بالتجزئة، تستخدم تقنية Just Walk Out من Amazon اكتشاف الكائنات لأتمتة الدفع عن طريق تحديد العناصر التي يلتقطها العملاء. يتيح الجمع بين رؤية الكمبيوتر وبيانات المستشعر للعملاء الحصول على مشترياتهم والمغادرة دون الانتظار في الصف. 

إليك نظرة فاحصة على كيفية عملها:

  • تلتقط الكاميرات المثبتة على السقف صورًا للعملاء وهم يتحركون في جميع أنحاء المتجر، وتتم معالجة لقطات الفيديو هذه في الوقت الفعلي بواسطة نماذج الرؤية.
  • يُستخدم اكتشاف الكائنات detect المنتج المحدد الذي يلتقطه العميل ويضعه في سلة التسوق الخاصة به لتحديث عربة التسوق الافتراضية وفقًا لذلك.
  • تعمل مستشعرات الوزن الموجودة على الأرفف على تحسين الدقة عن طريق اكتشاف إزالة العناصر أو استبدالها.
  • عندما يخرج العميل من المتجر، يمكن استخدام تقنية الكشف عن الأشياء و التعرف على الوجوه للتأكد من مغادرة العميل، ويمكن استخدام تفاصيل الدفع الخاصة به، مثل بطاقة الائتمان، لتحصيل الرسوم تلقائيًا.

التجزئة الدلالية وتجزئة المثيلات

التجزئة الدلالية و تجزئة المثيلات هما مهمتان في الرؤية الحاسوبية تساعدان في تقسيم الصور إلى أجزاء ذات معنى. تصنف التجزئة الدلالية وحدات البكسل بناءً على معناها الدلالي وتعامل جميع الكائنات داخل فئة واحدة ككيان واحد بنفس التصنيف. وهي مناسبة لتصنيف الكائنات غير القابلة للعد مثل "السماء" أو "المحيط" أو التجمعات مثل "الأوراق" أو "العشب".

من ناحية أخرى، يمكن لتجزئة المثيل التمييز بين المثيلات المختلفة لنفس الفئة من خلال تعيين تسمية فريدة لكل كائن تم اكتشافه. يمكنك استخدام تجزئة المثيل segment الكائنات القابلة للعد حيث يكون عدد الكائنات واستقلاليتها مهمين. وهو يسمح بتحديد وتمييز أكثر دقة.

الشكل 4. مثال على التقسيم الدلالي وتقسيم المثيل.

يمكننا أن نفهم التباين بين التجزئة الدلالية وتجزئة المثيل بشكل أوضح من خلال مثال يتعلق بالسيارات ذاتية القيادة. التجزئة الدلالية رائعة للمهام التي تتطلب فهم محتويات المشهد ويمكن استخدامها في المركبات ذاتية القيادة classify الميزات على الطريق، مثل معابر المشاة وإشارات المرور. وفي الوقت نفسه، يمكن استخدام تجزئة المثيل في المركبات ذاتية القيادة للتمييز بين المشاة والمركبات والعوائق الفردية. 

تقدير الوضعية

تقدير الوضعية هو مهمة رؤية حاسوبية تركز على اكتشاف وتتبع النقاط الرئيسية لأوضاع الجسم في الصور أو مقاطع الفيديو. يشيع استخدامه لتقدير وضعية الإنسان، مع نقاط رئيسية تشمل مناطق مثل الكتفين والركبتين. يساعدنا تقدير وضعية الإنسان على فهم وتمييز الإجراءات والحركات الضرورية لمختلف التطبيقات.

الشكل 5. مثال على تقدير الوضعية باستخدام YOLOv8.

يمكن استخدام تقدير الوضعية في الرياضة لتحليل كيفية تحرك الرياضيين. تستخدم الرابطة الوطنية لكرة السلة (NBA) تقدير الوضعية لدراسة حركات اللاعبين ومواقعهم أثناء المباراة. من خلال تتبع النقاط الرئيسية مثل الأكتاف والمرفقين والركبتين والكاحلين، يوفر تقدير الوضعية رؤى تفصيلية حول حركات اللاعبين. تساعد هذه الرؤى المدربين على تطوير استراتيجيات أفضل، وتحسين برامج التدريب، وإجراء تعديلات في الوقت الفعلي أثناء المباريات. أيضًا، يمكن أن تساعد البيانات في مراقبة إرهاق اللاعبين وخطر الإصابة لتحسين الصحة والأداء العام للاعبين.

الكشف عن الكائنات ذات الصناديق المحيطة الموجهة

تستخدم صناديق الإحاطة الموجهة للكشف عن الأجسام (OBB) مستطيلات مُدَوَّرة لتحديد وتحديد مواقع الأجسام بدقة في الصورة. على عكس صناديق الإحاطة القياسية التي تتماشى مع محاور الصورة، تدور صناديق الإحاطة الموجهة لتتوافق مع اتجاه الجسم. وهذا يجعلها مفيدة بشكل خاص للأجسام التي ليست أفقية أو رأسية تمامًا. إنها رائعة في تحديد وعزل الأجسام المدورة بدقة لمنع التداخل في البيئات المزدحمة.

الشكل 6. مثال لاكتشاف الصندوق المحدود الموجه على صورة جوية للقوارب باستخدام YOLOV8.

في المراقبة البحرية، يعد تحديد وتتبع السفن أمرًا أساسيًا للأمن وإدارة الموارد. يمكن استخدام الكشف عن الكائنات ذات الحدود الموجهة (OBB) لتحديد دقيق لمواقع السفن، حتى عندما تكون مكتظة أو موجهة بزوايا مختلفة. فهو يساعد في مراقبة الممرات الملاحية وإدارة حركة المرور البحرية وتحسين عمليات الموانئ. ويمكنه أيضًا المساعدة في الاستجابة للكوارث من خلال تحديد وتقييم الأضرار التي لحقت بالسفن والبنية التحتية بسرعة بعد أحداث مثل الأعاصير أو انسكابات النفط.

تتبع الأجسام

لقد ناقشنا حتى الآن مهام الرؤية الحاسوبية التي تتعامل مع الصور. تتبع الأجسام هو مهمة رؤية حاسوبية يمكنها track جسم ما خلال إطارات الفيديو. تبدأ بتحديد الجسم في الإطار الأول باستخدام خوارزميات الكشف ثم تتبع موقعه باستمرار أثناء تحركه عبر الفيديو. يتضمن تتبع الأجسام تقنيات مثل اكتشاف الأجسام واستخراج السمات والتنبؤ بالحركة للحفاظ على دقة التتبع.

الشكل 7. استخدام YOLOv8 track الأسماك.

يمكن استخدام نماذج الرؤية مثل YOLOv8 track الأسماك في علم الأحياء البحرية. باستخدام الكاميرات تحت الماء، يمكن للباحثين مراقبة تحركات وسلوكيات الأسماك في موائلها الطبيعية. تبدأ العملية باكتشاف الأسماك الفردية في الإطارات الأولى ثم تتبع مواقعها طوال الفيديو. يساعد تتبع الأسماك العلماء على فهم أنماط الهجرة والسلوكيات الاجتماعية والتفاعلات مع البيئة. كما يدعم ممارسات الصيد المستدامة من خلال توفير رؤى حول توزيع الأسماك ووفرة الأسماك.

نظرة أخيرة على رؤية الحاسوب

يُحدث مجال رؤية الحاسوب (Computer vision) تغييرًا جذريًا في طريقة استخدامنا للتكنولوجيا وتفاعلنا مع العالم. فمن خلال استخدام نماذج التعلم العميق والخوارزميات المعقدة لفهم الصور ومقاطع الفيديو، يساعد رؤية الحاسوب الصناعات على تبسيط العديد من العمليات. إن مهام رؤية الحاسوب مثل الكشف عن الأجسام وتتبعها تمكننا من إيجاد حلول لم نكن نتخيلها من قبل. ومع استمرار تحسن تكنولوجيا رؤية الحاسوب، يحمل المستقبل المزيد من التطبيقات المبتكرة! 

هيا نتعلم وننمو معًا! استكشف مستودع GitHub الخاص بنا للاطلاع على مساهماتنا في مجال الذكاء الاصطناعي. تحقق من كيف نعيد تعريف صناعات مثل السيارات ذاتية القيادة و الزراعة بالذكاء الاصطناعي. 🚀

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا