تعرّف على كيفية عمل مهام الرؤية الحاسوبية مثل تتبع الأجسام، وتجزئة المثيلات، وتصنيف الصور، وكيف يدعمهاYOLO11 Ultralytics YOLO11 .
بفضل الكاميرات والتطورات في مجال الذكاء الاصطناعي (AI)، أصبحت أجهزة الكمبيوتر والآلات الآن قادرة على رؤية العالم بطريقة مشابهة لما يراه البشر. على سبيل المثال، يمكنها التعرف على الأشخاص وتتبع الأشياء وحتى فهم سياق ما يحدث في الفيديو.
على وجه التحديد، الرؤية الحاسوبية هي فرع من فروع الذكاء الاصطناعي الذي يمكّن الآلات من فهم وتفسير المعلومات المرئية من العالم من حولها. تنطوي الرؤية الحاسوبية على مجموعة متنوعة من المهام، كل منها مصمم لاستخراج نوع معين من المعلومات من الصور أو مقاطع الفيديو. على سبيل المثال، يساعد اكتشاف الأجسام على تحديد العناصر المختلفة في الصورة وتحديد موقعها، بينما تساعد مهام أخرى مثل التتبع والتجزئة وتقدير الوضعيات الآلات على فهم الحركة والأشكال والمواضع بدقة أكبر.
تعتمد مهمة الرؤية الحاسوبية المستخدمة في تطبيق معين على نوع الرؤى التي تحتاجها. نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11 تدعم العديد من مهام الرؤية الحاسوبية المختلفة، مما يجعلها خيارًا موثوقًا لبناء أنظمة ذكاء اصطناعي للرؤية في العالم الحقيقي.
في هذا الدليل، سنلقي نظرة فاحصة على مهام الرؤية الحاسوبية التي تدعمها نماذج مثل YOLO11. سنستكشف كيفية عمل كل مهمة وكيفية استخدامها في مختلف الصناعات. لنبدأ!
تهدف مهام الرؤية الحاسوبية إلى محاكاة قدرات الرؤية البشرية بطرق مختلفة. يمكن أن تساعد هذه المهام الآلات على اكتشاف الأجسام وتتبع حركاتها وتقدير أوضاعها وحتى تحديد العناصر الفردية في الصور ومقاطع الفيديو. وعادةً ما يتم تمكين مهام الرؤية الحاسوبية من خلال نماذج تقسم البيانات المرئية إلى أجزاء أصغر حتى تتمكن من تفسير ما يحدث بشكل أوضح.
تدعم نماذج الذكاء الاصطناعي للرؤية مثل نماذج Ultralytics YOLO مهام متعددة، مثل الكشف والتتبع والتجزئة في إطار عمل واحد. وبفضل هذا التنوع في الاستخدام، يسهل اعتماد نماذج YOLO11 لمجموعة متنوعة من حالات الاستخدام.
ومن الأمثلة الجيدة على ذلك في التحليلات الرياضية. يمكن استخدام YOLO11 لاكتشاف كل لاعب في الملعب باستخدام خاصية اكتشاف الأجسام، ثم يمكنه متابعتهم طوال المباراة باستخدام تتبع الأجسام. وفي الوقت نفسه، يمكن أن تساعد قدرات YOLO11 في تقدير الوضعية في تحليل حركات اللاعبين وتقنياتهم، ويمكن أن يساعد تجزئة المثيل في فصل كل لاعب عن الخلفية، مما يضيف دقة إلى التحليل.
تُنشئ مهام الرؤية الحاسوبية YOLO11 هذه معًا صورة كاملة لما يحدث أثناء اللعبة، مما يمنح الفرق رؤى أعمق حول أداء اللاعبين والتكتيكات والاستراتيجية العامة.
والآن بعد أن ألقينا نظرة على ماهية مهام الرؤية الحاسوبية، دعونا نتعمق في فهم كل مهمة مدعومة من YOLO11 بمزيد من التفصيل، باستخدام أمثلة واقعية.
عندما تنظر إلى صورة ما، يمكن لمعظم الناس بسهولة معرفة ما إذا كانت الصورة تُظهر كلباً أو جبلاً أو إشارة مرور، لأننا تعلمنا جميعاً كيف تبدو هذه الأشياء عادةً. يساعد تصنيف الصور الآلات على فعل الشيء نفسه من خلال تعليمها كيفية تصنيف الصورة وتسميتها بناءً على الكائن الرئيسي فيها - سواء كانت "سيارة" أو "موزة" أو "أشعة سينية مع كسر". وتساعد هذه التسمية أنظمة الرؤية الحاسوبية على فهم المحتوى المرئي حتى تتمكن من الاستجابة أو اتخاذ القرارات وفقاً لذلك.
أحد التطبيقات المثيرة للاهتمام لمهمة الرؤية الحاسوبية هذه هو مراقبة الحياة البرية. يمكن استخدام تصنيف الصور لتحديد أنواع الحيوانات المختلفة من الصور الملتقطة في البرية. ومن خلال تصنيف الصور تلقائيًا، يمكن للباحثين تتبع مجموعات الحيوانات ومراقبة أنماط الهجرة وتحديد الأنواع المهددة بالانقراض بسهولة أكبر لدعم جهود الحفاظ على البيئة.
على الرغم من أن تصنيف الصور مفيد في الحصول على فكرة عامة عما تحتويه الصورة، إلا أنه لا يعيّن سوى تسمية واحدة للصورة بأكملها. في الحالات التي تتطلب معلومات مفصّلة، مثل الموقع الدقيق وهوية الأجسام المتعددة، يصبح اكتشاف الأجسام أمراً ضرورياً.
اكتشاف الكائنات هو عملية تحديد الكائنات الفردية وتحديد موقعها داخل الصورة، وغالبًا ما يتم ذلك عن طريق رسم مربعات محددة حولها. يؤديYOLO11 Ultralytics YOLO11 أداءً جيدًا بشكل خاص في اكتشاف الكائنات في الوقت الفعلي، مما يجعله مثاليًا لمجموعة كبيرة من التطبيقات.
خذ، على سبيل المثال، حلول الرؤية الحاسوبية المستخدمة في متاجر البيع بالتجزئة لتخزين الأرفف. يمكن أن يساعد اكتشاف الأجسام في عدّ الفواكه والخضروات وغيرها من الأصناف، مما يضمن جرداً دقيقاً. وفي الحقول الزراعية، يمكن للتقنية نفسها مراقبة نضج المحاصيل لمساعدة المزارعين على تحديد أفضل وقت للحصاد، وحتى التمييز بين المنتجات الناضجة وغير الناضجة.
يستخدم الكشف عن الكائنات المربعات المحدودة لتحديد الكائنات في الصورة وتحديد موقعها، ولكنه لا يلتقط أشكالها الدقيقة. وهنا يأتي دور تجزئة المثيل. بدلاً من رسم مربع حول كائن ما، يتتبع تجزئة المثيل مخططه الدقيق.
يمكنك التفكير في الأمر على هذا النحو: بدلاً من مجرد الإشارة إلى أن "هناك تفاحة في هذه المنطقة"، فإنه يحدد بعناية شكل التفاحة الدقيق ويملأه. تساعد هذه العملية التفصيلية أنظمة الذكاء الاصطناعي على فهم حدود الجسم بوضوح، خاصةً عندما تكون الأجسام قريبة من بعضها البعض.
يمكن تطبيق تجزئة المثيل على العديد من التطبيقات، بدءًا من عمليات فحص البنية التحتية إلى المسوحات الجيولوجية. على سبيل المثال، يمكن تحليل البيانات المستمدة من المسوحات الجيولوجية باستخدام YOLO11 لتجزئة الشقوق أو الشذوذات السطحية الكبيرة والصغيرة على حد سواء. من خلال رسم حدود دقيقة حول هذه التشوهات، يمكن للمهندسين تحديد المشكلات ومعالجتها قبل بدء المشروع.
حتى الآن، تركز مهام الرؤية الحاسوبية التي نظرنا إليها على ما يوجد في صورة واحدة. ومع ذلك، عندما يتعلق الأمر بمقاطع الفيديو، نحتاج إلى رؤى تتجاوز الإطار الواحد. يمكن استخدام مهمة تتبع الكائنات لهذا الغرض.
يمكن لقدرة YOLO11 على تتبع جسم معين، مثل شخص أو سيارة، أثناء تحركه عبر سلسلة من إطارات الفيديو. حتى إذا تغيرت زاوية الكاميرا أو ظهرت أجسام أخرى، يستمر النظام في تتبع الهدف نفسه.
وهذا أمر بالغ الأهمية للتطبيقات التي تتطلب المراقبة بمرور الوقت، مثل تتبع السيارات في حركة المرور. في الواقع، يمكن YOLO11 تتبع المركبات بدقة، وتتبع كل سيارة للمساعدة في تقدير سرعتها في الوقت الفعلي. وهذا يجعل تتبع الأجسام عنصراً أساسياً في أنظمة مثل مراقبة حركة المرور.
الأجسام في العالم الحقيقي ليست دائماً متحاذية بشكل مثالي - يمكن أن تكون مائلة أو مائلة أو موضوعة في زوايا غريبة. على سبيل المثال، في صور الأقمار الصناعية، غالبًا ما تظهر السفن والمباني في صور الأقمار الصناعية بشكل مستدير.
تستخدم الطرق التقليدية للكشف عن الأجسام المربعات المستطيلة الثابتة التي لا تتكيف مع اتجاه الجسم، مما يجعل من الصعب التقاط هذه الأشكال المدورة بدقة. يحل اكتشاف المربع المحدود الموجه (OBB) هذه المشكلة باستخدام المربعات التي تدور لتتناسب بشكل مريح حول الجسم، وتحاذي زاويته لاكتشاف أكثر دقة.
فيما يتعلق بمراقبة الموانئ، يمكن أن يساعد دعم YOLO11للكشف عن ثنائي الفينيل متعدد البروم ثنائي الفينيل متعدد البروم في تحديد وتتبع السفن بدقة بغض النظر عن اتجاهها، مما يضمن مراقبة كل سفينة تدخل الميناء أو تغادره بشكل صحيح. يوفر هذا الاكتشاف الدقيق معلومات في الوقت الفعلي عن مواقع السفن وتحركاتها، وهو أمر بالغ الأهمية لإدارة الموانئ المزدحمة ومنع التصادمات.
تقدير الوضعية هو أسلوب رؤية حاسوبية يتتبع النقاط الرئيسية، مثل المفاصل أو الأطراف أو غيرها من العلامات، لفهم كيفية حركة الجسم. بدلاً من التعامل مع الجسم أو الجسم بأكمله كوحدة واحدة كاملة، تقوم هذه الطريقة بتقسيمه إلى أجزائه الرئيسية. وهذا يجعل من الممكن تحليل الحركات والإيماءات والتفاعلات بالتفصيل.
أحد التطبيقات الشائعة لهذه التقنية هو تقدير وضع الإنسان. فمن خلال تتبع مواضع أجزاء الجسم المختلفة في الوقت الفعلي، توفر هذه التقنية صورة واضحة لكيفية حركة الشخص. يمكن استخدام هذه المعلومات لمجموعة متنوعة من الأغراض، بدءاً من التعرف على الإيماءات ومراقبة النشاط إلى تحليل الأداء في الرياضة.
وبالمثل، في إعادة التأهيل البدني، يمكن للمعالجين استخدام تقدير الوضع البشري و YOLO11 لمراقبة حركات المرضى أثناء التمارين. يساعد ذلك على التأكد من أن كل حركة تتم بشكل صحيح مع تتبع التقدم المحرز مع مرور الوقت.
والآن بعد أن استكشفنا جميع مهام الرؤية الحاسوبية التي يدعمها YOLO11 بالتفصيل، دعنا نستعرض كيفية دعم YOLO11 لها.
إن YOLO11 ليس مجرد نموذج واحد - إنه مجموعة من النماذج المتخصصة، كل منها مصمم لمهمة رؤية حاسوبية محددة. وهذا يجعل YOLO11 أداة متعددة الاستخدامات يمكن تكييفها مع مجموعة واسعة من التطبيقات. يمكنك أيضًا ضبط هذه النماذج على مجموعات بيانات مخصصة لمعالجة التحديات الفريدة لمشاريعك.
فيما يلي متغيرات نموذجYOLO11 التي تم تدريبها مسبقاً على مهام رؤية محددة:
يتوفر كل متغير بأحجام مختلفة، مما يسمح للمستخدمين باختيار التوازن المناسب بين السرعة والدقة لاحتياجاتهم الخاصة.
تعمل مهام الرؤية الحاسوبية على تغيير الطريقة التي تفهم بها الآلات العالم وتتفاعل معه. فمن خلال تقسيم الصور ومقاطع الفيديو إلى عناصر رئيسية، تسهّل هذه التقنيات تحليل الأشياء والحركات والتفاعلات بالتفصيل.
بدءاً من تحسين السلامة المرورية والأداء الرياضي إلى تبسيط العمليات الصناعية، يمكن لنماذج مثل YOLO11 أن توفر رؤى في الوقت الفعلي تدفع الابتكار. مع استمرار تطور الذكاء الاصطناعي المرئي في التطور، من المرجح أن يلعب دوراً متزايد الأهمية في كيفية تفسيرنا للبيانات المرئية واستخدامنا لها كل يوم.
انضم إلى مجتمعنا وقم بزيارة مستودع GitHub الخاص بنا لمشاهدة الذكاء الاصطناعي أثناء العمل. استكشف خيارات الترخيص لدينا واكتشف المزيد عن الذكاء الاصطناعي في الزراعة والرؤية الحاسوبية في التصنيع على صفحات الحلول الخاصة بنا.