كل ما تحتاج إلى معرفته عن مهام رؤية الكمبيوتر

تعرّف على كيفية عمل مهام الرؤية الحاسوبية مثل تتبع الأجسام، وتجزئة المثيلات، وتصنيف الصور، وكيف يدعمهاYOLO11 Ultralytics YOLO11 .

كتبه

أبيرامي فينا

قراءة دقيقة

16 أبريل 2025

ما هي مهام الرؤية الحاسوبية؟

نظرة عامة على مهام الرؤية الحاسوبية التي يدعمها YOLO11

دعم YOLO11لتصنيف الصور في YOLO11

قدرات YOLO11على اكتشاف الأجسام في YOLO11

استخدام YOLO11 لتجزئة المثيل

تتبع الأجسام: تتبع الأجسام عبر الإطارات باستخدام YOLO11

اكتشاف المربعات المحدودة الموجهة (OBB) باستخدام YOLO11

تقدير الوضعية و YOLO11: تتبع النقاط الرئيسية

استكشاف كيفية دعم YOLO11 لمهام الرؤية الحاسوبية المختلفة

الوجبات الرئيسية

بفضل الكاميرات والتطورات في مجال الذكاء الاصطناعي (AI)، أصبحت أجهزة الكمبيوتر والآلات الآن قادرة على رؤية العالم بطريقة مشابهة لما يراه البشر. على سبيل المثال، يمكنها التعرف على الأشخاص وتتبع الأشياء وحتى فهم سياق ما يحدث في الفيديو.

على وجه التحديد، الرؤية الحاسوبية هي فرع من فروع الذكاء الاصطناعي الذي يمكّن الآلات من فهم وتفسير المعلومات المرئية من العالم من حولها. تنطوي الرؤية الحاسوبية على مجموعة متنوعة من المهام، كل منها مصمم لاستخراج نوع معين من المعلومات من الصور أو مقاطع الفيديو. على سبيل المثال، يساعد اكتشاف الأجسام على تحديد العناصر المختلفة في الصورة وتحديد موقعها، بينما تساعد مهام أخرى مثل التتبع والتجزئة وتقدير الوضعيات الآلات على فهم الحركة والأشكال والمواضع بدقة أكبر.

تعتمد مهمة الرؤية الحاسوبية المستخدمة في تطبيق معين على نوع الرؤى التي تحتاجها. نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11 تدعم العديد من مهام الرؤية الحاسوبية المختلفة، مما يجعلها خيارًا موثوقًا لبناء أنظمة ذكاء اصطناعي للرؤية في العالم الحقيقي.

في هذا الدليل، سنلقي نظرة فاحصة على مهام الرؤية الحاسوبية التي تدعمها نماذج مثل YOLO11. سنستكشف كيفية عمل كل مهمة وكيفية استخدامها في مختلف الصناعات. لنبدأ!

ما هي مهام الرؤية الحاسوبية؟

تهدف مهام الرؤية الحاسوبية إلى محاكاة قدرات الرؤية البشرية بطرق مختلفة. يمكن أن تساعد هذه المهام الآلات على اكتشاف الأجسام وتتبع حركاتها وتقدير أوضاعها وحتى تحديد العناصر الفردية في الصور ومقاطع الفيديو. وعادةً ما يتم تمكين مهام الرؤية الحاسوبية من خلال نماذج تقسم البيانات المرئية إلى أجزاء أصغر حتى تتمكن من تفسير ما يحدث بشكل أوضح.

تدعم نماذج الذكاء الاصطناعي للرؤية مثل نماذج Ultralytics YOLO مهام متعددة، مثل الكشف والتتبع والتجزئة في إطار عمل واحد. وبفضل هذا التنوع في الاستخدام، يسهل اعتماد نماذج YOLO11 لمجموعة متنوعة من حالات الاستخدام.

الشكل 1. مهام الرؤية الحاسوبية التي يدعمها YOLO11.

‍

ومن الأمثلة الجيدة على ذلك في التحليلات الرياضية. يمكن استخدام YOLO11 لاكتشاف كل لاعب في الملعب باستخدام خاصية اكتشاف الأجسام، ثم يمكنه متابعتهم طوال المباراة باستخدام تتبع الأجسام. وفي الوقت نفسه، يمكن أن تساعد قدرات YOLO11 في تقدير الوضعية في تحليل حركات اللاعبين وتقنياتهم، ويمكن أن يساعد تجزئة المثيل في فصل كل لاعب عن الخلفية، مما يضيف دقة إلى التحليل.

تُنشئ مهام الرؤية الحاسوبية YOLO11 هذه معًا صورة كاملة لما يحدث أثناء اللعبة، مما يمنح الفرق رؤى أعمق حول أداء اللاعبين والتكتيكات والاستراتيجية العامة.

نظرة عامة على مهام الرؤية الحاسوبية التي يدعمها YOLO11

والآن بعد أن ألقينا نظرة على ماهية مهام الرؤية الحاسوبية، دعونا نتعمق في فهم كل مهمة مدعومة من YOLO11 بمزيد من التفصيل، باستخدام أمثلة واقعية.

دعم YOLO11لتصنيف الصور في YOLO11

عندما تنظر إلى صورة ما، يمكن لمعظم الناس بسهولة معرفة ما إذا كانت الصورة تُظهر كلباً أو جبلاً أو إشارة مرور، لأننا تعلمنا جميعاً كيف تبدو هذه الأشياء عادةً. يساعد تصنيف الصور الآلات على فعل الشيء نفسه من خلال تعليمها كيفية تصنيف الصورة وتسميتها بناءً على الكائن الرئيسي فيها - سواء كانت "سيارة" أو "موزة" أو "أشعة سينية مع كسر". وتساعد هذه التسمية أنظمة الرؤية الحاسوبية على فهم المحتوى المرئي حتى تتمكن من الاستجابة أو اتخاذ القرارات وفقاً لذلك.

أحد التطبيقات المثيرة للاهتمام لمهمة الرؤية الحاسوبية هذه هو مراقبة الحياة البرية. يمكن استخدام تصنيف الصور لتحديد أنواع الحيوانات المختلفة من الصور الملتقطة في البرية. ومن خلال تصنيف الصور تلقائيًا، يمكن للباحثين تتبع مجموعات الحيوانات ومراقبة أنماط الهجرة وتحديد الأنواع المهددة بالانقراض بسهولة أكبر لدعم جهود الحفاظ على البيئة.

الشكل 2. مثال على استخدام YOLO11 لتصنيف الصور.

‍

قدرات YOLO11على اكتشاف الأجسام في YOLO11

على الرغم من أن تصنيف الصور مفيد في الحصول على فكرة عامة عما تحتويه الصورة، إلا أنه لا يعيّن سوى تسمية واحدة للصورة بأكملها. في الحالات التي تتطلب معلومات مفصّلة، مثل الموقع الدقيق وهوية الأجسام المتعددة، يصبح اكتشاف الأجسام أمراً ضرورياً.

اكتشاف الكائنات هو عملية تحديد الكائنات الفردية وتحديد موقعها داخل الصورة، وغالبًا ما يتم ذلك عن طريق رسم مربعات محددة حولها. يؤديYOLO11 Ultralytics YOLO11 أداءً جيدًا بشكل خاص في اكتشاف الكائنات في الوقت الفعلي، مما يجعله مثاليًا لمجموعة كبيرة من التطبيقات.

خذ، على سبيل المثال، حلول الرؤية الحاسوبية المستخدمة في متاجر البيع بالتجزئة لتخزين الأرفف. يمكن أن يساعد اكتشاف الأجسام في عدّ الفواكه والخضروات وغيرها من الأصناف، مما يضمن جرداً دقيقاً. وفي الحقول الزراعية، يمكن للتقنية نفسها مراقبة نضج المحاصيل لمساعدة المزارعين على تحديد أفضل وقت للحصاد، وحتى التمييز بين المنتجات الناضجة وغير الناضجة.

الشكل 3. الكشف عن الفاكهة باستخدام Ultralytics YOLO11.

‍

استخدام YOLO11 لتجزئة المثيل

يستخدم الكشف عن الكائنات المربعات المحدودة لتحديد الكائنات في الصورة وتحديد موقعها، ولكنه لا يلتقط أشكالها الدقيقة. وهنا يأتي دور تجزئة المثيل. بدلاً من رسم مربع حول كائن ما، يتتبع تجزئة المثيل مخططه الدقيق.

يمكنك التفكير في الأمر على هذا النحو: بدلاً من مجرد الإشارة إلى أن "هناك تفاحة في هذه المنطقة"، فإنه يحدد بعناية شكل التفاحة الدقيق ويملأه. تساعد هذه العملية التفصيلية أنظمة الذكاء الاصطناعي على فهم حدود الجسم بوضوح، خاصةً عندما تكون الأجسام قريبة من بعضها البعض.

يمكن تطبيق تجزئة المثيل على العديد من التطبيقات، بدءًا من عمليات فحص البنية التحتية إلى المسوحات الجيولوجية. على سبيل المثال، يمكن تحليل البيانات المستمدة من المسوحات الجيولوجية باستخدام YOLO11 لتجزئة الشقوق أو الشذوذات السطحية الكبيرة والصغيرة على حد سواء. من خلال رسم حدود دقيقة حول هذه التشوهات، يمكن للمهندسين تحديد المشكلات ومعالجتها قبل بدء المشروع.

‍

تتبع الأجسام: تتبع الأجسام عبر الإطارات باستخدام YOLO11

حتى الآن، تركز مهام الرؤية الحاسوبية التي نظرنا إليها على ما يوجد في صورة واحدة. ومع ذلك، عندما يتعلق الأمر بمقاطع الفيديو، نحتاج إلى رؤى تتجاوز الإطار الواحد. يمكن استخدام مهمة تتبع الكائنات لهذا الغرض.

يمكن لقدرة YOLO11 على تتبع جسم معين، مثل شخص أو سيارة، أثناء تحركه عبر سلسلة من إطارات الفيديو. حتى إذا تغيرت زاوية الكاميرا أو ظهرت أجسام أخرى، يستمر النظام في تتبع الهدف نفسه.

وهذا أمر بالغ الأهمية للتطبيقات التي تتطلب المراقبة بمرور الوقت، مثل تتبع السيارات في حركة المرور. في الواقع، يمكن YOLO11 تتبع المركبات بدقة، وتتبع كل سيارة للمساعدة في تقدير سرعتها في الوقت الفعلي. وهذا يجعل تتبع الأجسام عنصراً أساسياً في أنظمة مثل مراقبة حركة المرور.

الشكل 5. يمكن استخدام دعم YOLO11لتتبع الأجسام لتقدير السرعة.

‍

اكتشاف المربعات المحدودة الموجهة (OBB) باستخدام YOLO11

الأجسام في العالم الحقيقي ليست دائماً متحاذية بشكل مثالي - يمكن أن تكون مائلة أو مائلة أو موضوعة في زوايا غريبة. على سبيل المثال، في صور الأقمار الصناعية، غالبًا ما تظهر السفن والمباني في صور الأقمار الصناعية بشكل مستدير.

تستخدم الطرق التقليدية للكشف عن الأجسام المربعات المستطيلة الثابتة التي لا تتكيف مع اتجاه الجسم، مما يجعل من الصعب التقاط هذه الأشكال المدورة بدقة. يحل اكتشاف المربع المحدود الموجه (OBB) هذه المشكلة باستخدام المربعات التي تدور لتتناسب بشكل مريح حول الجسم، وتحاذي زاويته لاكتشاف أكثر دقة.

فيما يتعلق بمراقبة الموانئ، يمكن أن يساعد دعم YOLO11للكشف عن ثنائي الفينيل متعدد البروم ثنائي الفينيل متعدد البروم في تحديد وتتبع السفن بدقة بغض النظر عن اتجاهها، مما يضمن مراقبة كل سفينة تدخل الميناء أو تغادره بشكل صحيح. يوفر هذا الاكتشاف الدقيق معلومات في الوقت الفعلي عن مواقع السفن وتحركاتها، وهو أمر بالغ الأهمية لإدارة الموانئ المزدحمة ومنع التصادمات.

الشكل 6. الكشف عن القوارب باستخدام كشف OBB و YOLO11.

‍

تقدير الوضعية و YOLO11: تتبع النقاط الرئيسية

تقدير الوضعية هو أسلوب رؤية حاسوبية يتتبع النقاط الرئيسية، مثل المفاصل أو الأطراف أو غيرها من العلامات، لفهم كيفية حركة الجسم. بدلاً من التعامل مع الجسم أو الجسم بأكمله كوحدة واحدة كاملة، تقوم هذه الطريقة بتقسيمه إلى أجزائه الرئيسية. وهذا يجعل من الممكن تحليل الحركات والإيماءات والتفاعلات بالتفصيل.

أحد التطبيقات الشائعة لهذه التقنية هو تقدير وضع الإنسان. فمن خلال تتبع مواضع أجزاء الجسم المختلفة في الوقت الفعلي، توفر هذه التقنية صورة واضحة لكيفية حركة الشخص. يمكن استخدام هذه المعلومات لمجموعة متنوعة من الأغراض، بدءاً من التعرف على الإيماءات ومراقبة النشاط إلى تحليل الأداء في الرياضة.

وبالمثل، في إعادة التأهيل البدني، يمكن للمعالجين استخدام تقدير الوضع البشري و YOLO11 لمراقبة حركات المرضى أثناء التمارين. يساعد ذلك على التأكد من أن كل حركة تتم بشكل صحيح مع تتبع التقدم المحرز مع مرور الوقت.

الشكل 7. يمكن لـ YOLO11 مراقبة التمرين باستخدام تقدير الوضعية.

‍

استكشاف كيفية دعم YOLO11 لمهام الرؤية الحاسوبية المختلفة

والآن بعد أن استكشفنا جميع مهام الرؤية الحاسوبية التي يدعمها YOLO11 بالتفصيل، دعنا نستعرض كيفية دعم YOLO11 لها.

إن YOLO11 ليس مجرد نموذج واحد - إنه مجموعة من النماذج المتخصصة، كل منها مصمم لمهمة رؤية حاسوبية محددة. وهذا يجعل YOLO11 أداة متعددة الاستخدامات يمكن تكييفها مع مجموعة واسعة من التطبيقات. يمكنك أيضًا ضبط هذه النماذج على مجموعات بيانات مخصصة لمعالجة التحديات الفريدة لمشاريعك.

فيما يلي متغيرات نموذجYOLO11 التي تم تدريبها مسبقاً على مهام رؤية محددة:

YOLO11: يقوم هذا النموذج باكتشاف وتسمية كائنات متعددة في الوقت الفعلي، مما يجعله مثاليًا للتعرف البصري عالي السرعة.
YOLO11: يركز هذا المتغير على التجزئة باستخدام أقنعة تفصيلية لفصل الأجسام عن خلفياتها.
YOLO11: صُمم هذا النموذج للكشف عن الأجسام المدورة من خلال رسم مربعات محددة تتماشى مع اتجاه كل جسم.
YOLO11: يصنف هذا المتغير الصور من خلال تعيين تسمية فئة واحدة بناءً على المحتوى الكلي.
YOLO11 هذا النموذج النقاط الرئيسية في الجسم لتتبع وضعية الجسم ووضعيات الأطراف والحركة.

يتوفر كل متغير بأحجام مختلفة، مما يسمح للمستخدمين باختيار التوازن المناسب بين السرعة والدقة لاحتياجاتهم الخاصة.

الوجبات الرئيسية

تعمل مهام الرؤية الحاسوبية على تغيير الطريقة التي تفهم بها الآلات العالم وتتفاعل معه. فمن خلال تقسيم الصور ومقاطع الفيديو إلى عناصر رئيسية، تسهّل هذه التقنيات تحليل الأشياء والحركات والتفاعلات بالتفصيل.

بدءاً من تحسين السلامة المرورية والأداء الرياضي إلى تبسيط العمليات الصناعية، يمكن لنماذج مثل YOLO11 أن توفر رؤى في الوقت الفعلي تدفع الابتكار. مع استمرار تطور الذكاء الاصطناعي المرئي في التطور، من المرجح أن يلعب دوراً متزايد الأهمية في كيفية تفسيرنا للبيانات المرئية واستخدامنا لها كل يوم.

انضم إلى مجتمعنا وقم بزيارة مستودع GitHub الخاص بنا لمشاهدة الذكاء الاصطناعي أثناء العمل. استكشف خيارات الترخيص لدينا واكتشف المزيد عن الذكاء الاصطناعي في الزراعة والرؤية الحاسوبية في التصنيع على صفحات الحلول الخاصة بنا.

كل ما تحتاج إلى معرفته عن مهام رؤية الكمبيوتر

ما هي مهام الرؤية الحاسوبية؟