استعدوا لـ YOLO Vision 2025!
25 سبتمبر، 2025
10:00 — 18:00 بتوقيت بريطانيا الصيفي
حدث هجين
مؤتمر Yolo Vision 2024

استكشاف كيفية عمل تطبيقات رؤية الكمبيوتر

أبيرامي فينا

5 دقائق قراءة

9 أغسطس، 2024

تعمق معنا في تطبيقات الرؤية الحاسوبية. سنتناول أيضًا مهام الرؤية الحاسوبية المختلفة مثل اكتشاف الأجسام وتقسيمها.

عندما استكشفنا تاريخ نماذج رؤية الكمبيوتر، رأينا كيف تطورت رؤية الكمبيوتر والمسار الذي أدى إلى نماذج الرؤية المتقدمة التي لدينا اليوم. تدعم النماذج الحديثة مثل Ultralytics YOLOv8 مهام رؤية الكمبيوتر المتعددة ويتم استخدامها في تطبيقات مثيرة مختلفة. 

في هذه المقالة، سوف نلقي نظرة على أساسيات الرؤية الحاسوبية ونماذج الرؤية. سنغطي كيفية عملها وتطبيقاتها المتنوعة عبر مختلف الصناعات. ابتكارات الرؤية الحاسوبية موجودة في كل مكان، وتشكل عالمنا بصمت. دعونا نكشفها واحدة تلو الأخرى! 

ما هي رؤية الحاسوب؟

الذكاء الاصطناعي (AI) هو مصطلح شامل يضم العديد من التقنيات التي تهدف إلى تكرار جزء من الذكاء البشري. أحد المجالات الفرعية للذكاء الاصطناعي هو رؤية الكمبيوتر. تركز رؤية الكمبيوتر على منح الآلات عيونًا يمكنها الرؤية والمراقبة وفهم محيطها. 

تمامًا مثل رؤية الإنسان، تهدف حلول رؤية الكمبيوتر إلى تمييز الكائنات وحساب المسافات واكتشاف الحركات. ومع ذلك، على عكس البشر، الذين لديهم خبرة عمر كامل لمساعدتهم على الرؤية والفهم، تعتمد أجهزة الكمبيوتر على كميات هائلة من البيانات وكاميرات عالية الدقة وخوارزميات معقدة. 

الشكل 1. مقارنة بين رؤية الإنسان ورؤية الحاسوب.

يمكن لأنظمة الرؤية الحاسوبية معالجة وتحليل البيانات المرئية مثل الصور ومقاطع الفيديو بسرعات ودقة لا تصدق. إن القدرة على تحليل كميات هائلة من المعلومات المرئية بسرعة ودقة تجعل الرؤية الحاسوبية أداة قوية في مختلف الصناعات، بدءًا من التصنيع إلى الرعاية الصحية.

تدعم نماذج الرؤية مهام رؤية الكمبيوتر المختلفة

تعتبر نماذج رؤية الحاسوب هي جوهر أي تطبيق رؤية حاسوب. وهي في الأساس خوارزميات حسابية مدعومة بتقنيات التعلم العميق المصممة لمنح الآلات القدرة على تفسير المعلومات المرئية وفهمها. تمكّن نماذج الرؤية مهام رؤية الحاسوب الحاسمة التي تتراوح من تصنيف الصور إلى الكشف عن الأجسام. دعونا نلقي نظرة فاحصة على بعض هذه المهام وحالات استخدامها بمزيد من التفصيل. 

تصنيف الصور

يتضمن تصنيف الصور تصنيف الصور ووضع علامات عليها في فئات أو تصنيفات محددة مسبقًا. يمكن تدريب نموذج رؤية مثل YOLOv8 على مجموعات بيانات كبيرة من الصور المصنفة. خلال التدريب، يتعلم النموذج التعرف على الأنماط والميزات المرتبطة بكل فئة. بمجرد التدريب، يمكنه التنبؤ بفئة الصور الجديدة غير المرئية عن طريق تحليل ميزاتها ومقارنتها بالأنماط التي تعلمها. 

الشكل 2. مثال على تصنيف الصور. (المصدر: towardsdatascience.com)

هناك أنواع مختلفة من تصنيف الصور. على سبيل المثال، عند التعامل مع الصور الطبية، يمكنك استخدام التصنيف الثنائي لتقسيم الصور إلى مجموعتين، مثل صحي أو مريض. نوع آخر هو التصنيف متعدد الفئات. يمكن أن يساعد في تصنيف الصور إلى مجموعات عديدة، مثل تصنيف الحيوانات المختلفة في مزرعة مثل الخنازير والماعز والأبقار. أو، لنفترض أنك تريد تصنيف الحيوانات إلى مجموعات ومجموعات فرعية، مثل تصنيف الحيوانات إلى ثدييات وطيور ثم إلى أنواع مثل الأسود والنمور والنسور والعصافير؛ سيكون التصنيف الهرمي هو الخيار الأفضل.

اكتشاف الكائنات

الكشف عن الأجسام هو عملية تحديد وتعيين مواقع الأجسام في الصور وإطارات الفيديو باستخدام الرؤية الحاسوبية. ويتكون من مهمتين: تحديد موقع الجسم، والذي يرسم مربعات إحاطة حول الأجسام، وتصنيف الجسم، والذي يحدد فئة كل جسم. بناءً على ترميز مربعات الإحاطة، يمكن لنموذج الرؤية أن يتعلم التعرف على الأنماط والميزات الخاصة بكل فئة جسم والتنبؤ بوجود وموقع هذه الأجسام في صور جديدة غير مرئية. 

الشكل 3. يتم استخدام اكتشاف الكائنات YOLOv8 للكشف عن اللاعبين في ملعب كرة القدم.

يحتوي اكتشاف الكائنات على العديد من حالات الاستخدام في مختلف الصناعات، في أي مكان من الرياضة إلى علم الأحياء البحرية. على سبيل المثال، في البيع بالتجزئة، تستخدم تقنية Just Walk Out من Amazon اكتشاف الكائنات لأتمتة الدفع عن طريق تحديد العناصر التي يلتقطها العملاء. يتيح الجمع بين رؤية الكمبيوتر وبيانات المستشعر للعملاء الحصول على مشترياتهم والمغادرة دون الانتظار في الصف. 

إليك نظرة فاحصة على كيفية عملها:

  • تلتقط الكاميرات المثبتة على السقف صورًا للعملاء وهم يتحركون في جميع أنحاء المتجر، وتتم معالجة لقطات الفيديو هذه في الوقت الفعلي بواسطة نماذج الرؤية.
  • يُستخدم الكشف عن الأجسام للكشف عن المنتج المحدد الذي يختاره العميل ويضعه في سلته لتحديث عربة التسوق الافتراضية الخاصة به وفقًا لذلك.
  • تعمل مستشعرات الوزن الموجودة على الأرفف على تحسين الدقة عن طريق اكتشاف إزالة العناصر أو استبدالها.
  • عندما يخرج العميل من المتجر، يمكن استخدام تقنية الكشف عن الأشياء و التعرف على الوجوه للتأكد من مغادرة العميل، ويمكن استخدام تفاصيل الدفع الخاصة به، مثل بطاقة الائتمان، لتحصيل الرسوم تلقائيًا.

التجزئة الدلالية وتجزئة المثيلات

التجزئة الدلالية و تجزئة المثيلات هما مهمتان في الرؤية الحاسوبية تساعدان في تقسيم الصور إلى أجزاء ذات معنى. تصنف التجزئة الدلالية وحدات البكسل بناءً على معناها الدلالي وتعامل جميع الكائنات داخل فئة واحدة ككيان واحد بنفس التصنيف. وهي مناسبة لتصنيف الكائنات غير القابلة للعد مثل "السماء" أو "المحيط" أو التجمعات مثل "الأوراق" أو "العشب".

من ناحية أخرى، يمكن أن يميز تجزئة المثيل بين مثيلات مختلفة من نفس الفئة عن طريق تعيين تسمية فريدة لكل كائن يتم اكتشافه. يمكنك استخدام تجزئة المثيل لتقسيم الكائنات القابلة للعد حيث يكون عدد واستقلالية الكائنات مهمين. يسمح بتحديد وتفريق أكثر دقة.

الشكل 4. مثال على التقسيم الدلالي وتقسيم المثيل.

يمكننا فهم التباين بين التقسيم الدلالي وتقسيم المثيلات بشكل أكثر وضوحًا من خلال مثال يتعلق بـ السيارات ذاتية القيادة. التقسيم الدلالي رائع للمهام التي تتطلب فهم محتويات المشهد ويمكن استخدامه في المركبات ذاتية القيادة لتصنيف الميزات على الطريق، مثل معابر المشاة وإشارات المرور. وفي الوقت نفسه، يمكن استخدام تقسيم المثيلات في المركبات ذاتية القيادة للتمييز بين المشاة والمركبات والعقبات الفردية. 

تقدير الوضعية

تقدير الوضعية هو مهمة رؤية حاسوبية تركز على اكتشاف وتتبع النقاط الرئيسية لأوضاع الجسم في الصور أو مقاطع الفيديو. يشيع استخدامه لتقدير وضعية الإنسان، مع نقاط رئيسية تشمل مناطق مثل الكتفين والركبتين. يساعدنا تقدير وضعية الإنسان على فهم وتمييز الإجراءات والحركات الضرورية لمختلف التطبيقات.

الشكل 5. مثال على تقدير الوضعية باستخدام YOLOv8.

يمكن استخدام تقدير الوضعية في الرياضة لتحليل كيفية تحرك الرياضيين. تستخدم الرابطة الوطنية لكرة السلة (NBA) تقدير الوضعية لدراسة حركات اللاعبين ومواقعهم أثناء المباراة. من خلال تتبع النقاط الرئيسية مثل الأكتاف والمرفقين والركبتين والكاحلين، يوفر تقدير الوضعية رؤى تفصيلية حول حركات اللاعبين. تساعد هذه الرؤى المدربين على تطوير استراتيجيات أفضل، وتحسين برامج التدريب، وإجراء تعديلات في الوقت الفعلي أثناء المباريات. أيضًا، يمكن أن تساعد البيانات في مراقبة إرهاق اللاعبين وخطر الإصابة لتحسين الصحة والأداء العام للاعبين.

الكشف عن الكائنات ذات الصناديق المحيطة الموجهة

تستخدم صناديق الإحاطة الموجهة للكشف عن الأجسام (OBB) مستطيلات مُدَوَّرة لتحديد وتحديد مواقع الأجسام بدقة في الصورة. على عكس صناديق الإحاطة القياسية التي تتماشى مع محاور الصورة، تدور صناديق الإحاطة الموجهة لتتوافق مع اتجاه الجسم. وهذا يجعلها مفيدة بشكل خاص للأجسام التي ليست أفقية أو رأسية تمامًا. إنها رائعة في تحديد وعزل الأجسام المدورة بدقة لمنع التداخل في البيئات المزدحمة.

الشكل 6. مثال على الكشف عن الصندوق المحيط الموجه على صورة جوية للقوارب باستخدام YOLOV8.

في المراقبة البحرية، يعد تحديد وتتبع السفن أمرًا أساسيًا للأمن وإدارة الموارد. يمكن استخدام الكشف عن الكائنات ذات الحدود الموجهة (OBB) لتحديد دقيق لمواقع السفن، حتى عندما تكون مكتظة أو موجهة بزوايا مختلفة. فهو يساعد في مراقبة الممرات الملاحية وإدارة حركة المرور البحرية وتحسين عمليات الموانئ. ويمكنه أيضًا المساعدة في الاستجابة للكوارث من خلال تحديد وتقييم الأضرار التي لحقت بالسفن والبنية التحتية بسرعة بعد أحداث مثل الأعاصير أو انسكابات النفط.

تتبع الأجسام

حتى الآن، ناقشنا مهام الرؤية الحاسوبية التي تتعامل مع الصور. تتبع الكائنات هي مهمة رؤية حاسوبية يمكنها تتبع كائن ما عبر إطارات الفيديو. يبدأ بتحديد الكائن في الإطار الأول باستخدام خوارزميات الاكتشاف ثم يتبع موضعه باستمرار أثناء تحركه عبر الفيديو. يتضمن تتبع الكائنات تقنيات مثل اكتشاف الكائنات واستخراج الميزات والتنبؤ بالحركة للحفاظ على دقة التتبع.

الشكل 7. استخدام YOLOv8 لتتبع الأسماك.

يمكن استخدام نماذج الرؤية مثل YOLOv8 لتتبع الأسماك في علم الأحياء البحرية. باستخدام الكاميرات تحت الماء، يمكن للباحثين مراقبة تحركات وسلوكيات الأسماك في بيئاتها الطبيعية. تبدأ العملية بالكشف عن الأسماك الفردية في الإطارات الأولى ثم تتبع مواقعها طوال الفيديو. يساعد تتبع الأسماك العلماء على فهم أنماط الهجرة والسلوكيات الاجتماعية والتفاعلات مع البيئة. كما أنه يدعم ممارسات الصيد المستدامة من خلال توفير رؤى حول توزيع الأسماك ووفرتها.

نظرة أخيرة على رؤية الحاسوب

يُحدث مجال رؤية الحاسوب (Computer vision) تغييرًا جذريًا في طريقة استخدامنا للتكنولوجيا وتفاعلنا مع العالم. فمن خلال استخدام نماذج التعلم العميق والخوارزميات المعقدة لفهم الصور ومقاطع الفيديو، يساعد رؤية الحاسوب الصناعات على تبسيط العديد من العمليات. إن مهام رؤية الحاسوب مثل الكشف عن الأجسام وتتبعها تمكننا من إيجاد حلول لم نكن نتخيلها من قبل. ومع استمرار تحسن تكنولوجيا رؤية الحاسوب، يحمل المستقبل المزيد من التطبيقات المبتكرة! 

هيا نتعلم وننمو معًا! استكشف مستودع GitHub الخاص بنا للاطلاع على مساهماتنا في مجال الذكاء الاصطناعي. تحقق من كيف نعيد تعريف صناعات مثل السيارات ذاتية القيادة و الزراعة بالذكاء الاصطناعي. 🚀

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا
تم نسخ الرابط إلى الحافظة