Yolo فيجن شنتشن
شنتشن
انضم الآن

فهم دور FPS في الرؤية الحاسوبية

أبيرامي فينا

4 دقائق قراءة

20 مارس، 2025

تعرف على سبب أهمية FPS في الرؤية الحاسوبية وكيف يؤثر على الكشف عن الكائنات في الوقت الفعلي وتحليلات الفيديو والتطبيقات المدعومة بالذكاء الاصطناعي.

تعتبر مشاهدة إعادة عرض بالبطيئة للحظة رياضية مفضلة لديك، حيث تكون كل التفاصيل واضحة، مختلفة تمامًا عن مشاهدة لقطات المراقبة التي تبدو عادةً متقطعة ويصعب متابعتها. التفصيل التقني الرئيسي وراء هذه الاختلافات هو FPS أو الإطارات في الثانية، والذي يشير إلى عدد الإطارات المعروضة في الثانية في الفيديو. ينتج عن FPS الأعلى حركة سلسة ونابضة بالحياة، بينما يمكن أن يؤدي FPS الأقل إلى لقطات متقطعة وأقل تفصيلاً.

يؤثر هذا المفهوم بشكل مباشر على رؤية الحاسوب، وهو فرع من فروع الذكاء الاصطناعي يسمح للآلات بتفسير وتحليل البيانات المرئية بطريقة مماثلة لكيفية قيام البشر بذلك. في رؤية الحاسوب، يعني ارتفاع FPS أن الأنظمة يمكنها التقاط المزيد من المعلومات كل ثانية، مما يحسن دقة اكتشاف الكائنات وتتبعها في الوقت الفعلي.

في هذه المقالة، سوف نستكشف الجوانب التقنية للإطارات في الثانية وكيف ترتبط بتطبيقات الرؤية الحاسوبية. هيا بنا نبدأ!

ماذا يعني FPS في مجال رؤية الحاسوب؟

لنفترض أنك تلعب لعبة سباق: عند 60 إطارًا في الثانية، تشعر أن كل منعطف سلس وسريع الاستجابة، ولكن عند 20 إطارًا في الثانية، تتأخر عناصر التحكم، مما يجعل من الصعب تفادي العقبات. ببساطة، يمكنك التفكير في FPS على أنه عدد الصور الثابتة التي يتم عرضها كل ثانية. المزيد من الصور في الثانية تجعل الحركة تبدو سلسة وطبيعية، في حين أن عددًا أقل من الصور يمكن أن يجعلها تبدو متقطعة.

كما هو الحال في الألعاب، يعد FPS جزءًا أساسيًا من تطبيقات رؤية الكمبيوتر. يتيح ارتفاع معدل الإطارات في الثانية إمكانية track الأجسام باستخدام الذكاء الاصطناعي للرؤية بسلاسة، بينما يمكن أن يؤدي انخفاض معدل الإطارات في الثانية إلى فقدان التفاصيل. 

على سبيل المثال، في التحليلات الرياضية، تحتاج الكاميرات التي تعمل بالذكاء الاصطناعي إلى معدل FPS أعلى لتتمكن من track التمريرات السريعة وحركات اللاعبين ومسارات الكرة. قد يؤدي انخفاض معدل الإطارات في الثانية إلى تفويت فرصة التقاط تلامس مهم من القدم إلى الكرة أو تغيير سريع في الاتجاه، مما يؤثر على دقة التحليل. 

وبالمثل، في مجال مراقبة حركة المرور، تعتمد الأنظمة على FPS عالية في الثانية detect المركبات المسرعة وتغييرات الحارات في الوقت الفعلي. ويعتمد اختيار FPS المناسب على المتطلبات المحددة لكل تطبيق من تطبيقات الرؤية الحاسوبية، والموازنة بين الأداء والكفاءة والوضوح البصري.

__wf_reserved_inherit
الشكل 1. مقارنة معدلات الإطارات المختلفة.

الجوانب التقنية للإطارات في الثانية في رؤية الكمبيوتر

الآن بعد أن ناقشنا ما هو FPS وكيف يتم استخدامه في الرؤية الحاسوبية، دعنا نتعمق في جوانبه التقنية - بدءًا بكيفية حساب FPS للفيديو. 

بقسمة العدد الإجمالي للإطارات على المدة بالثانية تحصل على FPS للفيديو. على سبيل المثال، إذا كان الفيديو يحتوي على 96 إطارًا على مدى 4 ثوانٍ، فيتم حساب 24 إطارًا في الثانية - ما يعني عرض 24 صورة كل ثانية - بينما ينتج عن 32 إطارًا على مدى 4 ثوانٍ 8 إطارات في الثانية. مكتبات Python مثل OpenCV لاستخراج البيانات الوصفية للفيديو، وحساب الإطارات، وحساب FPS تلقائيًا، مما يسهّل عملية تحليل الفيديو.

__wf_reserved_inherit
الشكل 2. 24 إطارًا في الثانية مقابل 8 إطارات في الثانية مقابل 4 إطارات في الثانية.

العوامل المؤثرة على FPS للفيديو

ومع ذلك، فإن حساب الإطارات في الثانية وحده لا يكفي لاتخاذ قرارات فنية عند تطوير حلول الرؤية الحاسوبية. من المهم أيضًا مراعاة العوامل المختلفة التي يمكن أن تؤثر على معدل الإطارات الفعال، مثل قدرات الأجهزة وتحسينات البرامج والظروف البيئية. 

إليك نظرة فاحصة على هذه العوامل:

  • إمكانيات الأجهزة: يمكن لجودة مستشعر الكاميرا وقوة معالجة الجهاز تحديد عدد الإطارات التي يتم التقاطها كل ثانية. تعني الأجهزة الأفضل عادةً دعم معدل إطارات أعلى وفيديو أكثر سلاسة.
  • تحسينات البرامج: تساعد برامج ترميز الفيديو ومعالجته الفعالة على استخراج وتحليل الإطارات بسرعة. وهذا يضمن معالجة الفيديو دون تأخيرات غير ضرورية.
  • الظروف البيئية: تؤثر الإضاءة والحركة في المشهد على مدى وضوح التقاط الإطارات. يمكن أن تؤدي الإضاءة الجيدة والحركة المعتدلة إلى تحسين FPS، بينما قد تتطلب الظروف السيئة FPS أعلى للحفاظ على الوضوح.
  • احتياجات التخزين: يلتقط معدل الإطارات الأعلى (FPS) المزيد من الإطارات في الثانية، مما يؤدي إلى أحجام ملفات أكبر. هذا يزيد من متطلبات التخزين ويتطلب معالجة أسرع للبيانات لضمان تشغيل سلس.

استكشاف الإطارات في الثانية (FPS) في تطبيقات الرؤية الحاسوبية.

نماذج الذكاء الاصطناعي مثل Ultralytics YOLO11 التي تدعم مهام الرؤية الحاسوبية في الوقت الحقيقي يمكن استخدامها لتحليل مقاطع الفيديو بمعدلات إطارات عالية. هذه القدرة في الوقت الحقيقي أمر بالغ الأهمية لتطبيقات مثل القيادة الذاتية والمراقبة والروبوتات، حيث يمكن أن تؤدي حتى التأخيرات الصغيرة إلى أخطاء كبيرة. 

دعنا نستعرض بعض تطبيقات Vision AI الواقعية حيث يكون معدل الإطارات العالي في الثانية ضروريًا للدقة والأداء. 

معدل إطارات أعلى لحلول المراقبة والأمن

تستخدم أنظمة المراقبة التي تراقب المناطق ذات الازدحام المروري الشديد مثل الطرق السريعة معدل إطارات مرتفع (FPS) لالتقاط التفاصيل الدقيقة، مما يضمن توثيق المركبات سريعة الحركة بوضوح. هذا الوضوح ضروري لأنظمة التعرف التلقائي على لوحات الأرقام (ANPR)، والتي تعتمد على لقطات عالية الجودة لتحديد المركبات بدقة.

في مثل هذه الأنظمة، يمكن استخدام نماذج مثل YOLO11 detect لوحات السيارات مباشرةً من موجز الفيديو. وبمجرد اكتشاف اللوحة، يتم استخدام نظام التعرف الضوئي على الحروف (OCR)، الذي يحول صور النص إلى أحرف يمكن قراءتها آلياً، لقراءة تفاصيل اللوحة. وتتيح هذه العملية إمكانية التعرف السريع والدقيق على المركبة، مما يعزز من إنفاذ قوانين المرور والأمن العام.

__wf_reserved_inherit
الشكل 3. استخدام YOLO11 detect لوحات السيارات.

فهم متطلبات FPS للأنظمة المستقلة

تخيل سيارة ذاتية القيادة تقف عند إشارة توقف، وتحلل محيطها بعناية لتقرر ما إذا كان بإمكانها المضي قدمًا بأمان. يجب أن تتخذ هذه السيارة قرارات شبه فورية، الأمر الذي يتطلب التقاط ومعالجة البيانات المرئية في الوقت الفعلي. 

إذا كانت السيارة ذاتية القيادة مزوّدة بكاميرات يمكنها التقاط لقطات بمعدل إطارات في الثانية أعلى، فإنها تتلقى تدفقاً أكثر استمرارية وتفصيلاً للصور. تمكّن هذه المدخلات البصرية المحسّنة السيارة من detect العوائق والمشاة والمركبات الأخرى بسرعة. كما يتيح للسيارة إمكانية الاستجابة السريعة لأي تغييرات في بيئتها.

إذا كانت الكاميرات تعالج الصور بمعدل إطارات أقل في الثانية (FPS)، فقد تتلقى السيارة عرضًا متقطعًا وأقل تفصيلاً. قد يؤخر ذلك وقت استجابتها، مما يزيد من خطر فقدان المعلومات الهامة واحتمال المساس بالسلامة.

العلاقة بين FPS وتحليلات الرياضة

يعد التقاط كل حركة بدقة أمرًا بالغ الأهمية في الألعاب الرياضية، حيث يمكن أن تحدث القرارات في جزء من الثانية فرقًا كبيرًا بين الفوز والخسارة. تتيح لنا التكنولوجيا التي تدعم معدل إطارات أعلى في الثانية (FPS) تسجيل كل التفاصيل الصغيرة في الحركة، ويمكن للمدربين والمحللين والرياضيين مراجعة اللعب ببطء دون فقدان أي شيء. كما أنه يساعد الحكام على اتخاذ قرارات أكثر دقة في رياضات مثل التنس وكرة القدم والكريكيت من خلال توفير رؤية واضحة للإجراءات إطارًا بإطار.

على سبيل المثال، حللت دراسة مثيرة للاهتمام حول الكرة الطائرة كيف أن استخدام FPS أعلى يحسن تقييم الأداء. أدت زيادة FPS من 30 إلى 240 إلى تحسين وضوح الحركة وتتبع الكائن بشكل كبير. كما تحسنت دقة تحليل الارتفاع، مما ساعد المدربين على فهم وضع اليد ونقاط اتصال الكرة وآليات القفز بشكل أكثر دقة. علاوة على ذلك، وجدت الدراسة أن FPS الأعلى يقلل من ضبابية الحركة، مما يجعل عمليات الإرسال وردود الفعل الدفاعية أسهل في التحليل. 

__wf_reserved_inherit
الشكل 4. مقارنة FPS منخفض وعالي فيما يتعلق بوضوح الحركة.

عندما يكون استخدام FPS منخفضًا فعالاً في تحليلات الفيديو

لا تتطلب جميع تطبيقات الرؤية الحاسوبية تسجيل لقطات بمعدل FPS أعلى. في كثير من الحالات، يكون معدل FPS أقل كافيًا لتحقيق نتائج دقيقة، اعتمادًا على المهمة. فيما يلي بعض المجالات الرئيسية التي يفضل فيها معدل FPS أقل:

  • المعالجة والتحليل اللاحق دون اتصال بالإنترنت: بالنسبة لتطبيقات مثل مراقبة حركة المرور وتحليل الحشود، ليس من الضروري دائمًا التقاط كل إطار بمعدل إطارات مرتفع (FPS). يمكن لمعدل إطارات أقل أن يوفر بيانات كافية لتحليل أنماط الحركة، مثل تدفق المركبات وكثافة المشاة واتجاهات الازدحام. من خلال تقليل الإطارات الزائدة، يقلل هذا النهج من متطلبات التخزين والحمل الحسابي مع الحفاظ على دقة التحليلات.
  • المراقبة البيئية بفاصل زمني: لتتبع التغيرات البطيئة مثل نمو النبات، أو تقدم البناء، أو حركة الأنهار الجليدية، يكفي التقاط إطار كل بضع دقائق أو مرة واحدة في اليوم، مما يوثق التحولات طويلة الأجل بشكل فعال مع توفير مساحة التخزين.
  • البيئات محدودة الموارد: في مراقبة الحياة البرية والأمن عن بعد، يساعد معدل الإطارات المنخفض على الحفاظ على عمر البطارية والتخزين. يمكن للكاميرات التي يتم تشغيلها بالحركة والتي تعمل بمعدل 5-10 إطارات في الثانية التقاط الأحداث الأساسية لفترات طويلة، مما يجعلها مثالية للتركيبات خارج الشبكة.

اختيار معدل الإطارات المناسب لتطبيقات التعلم العميق

يتطلب تحديد معدل الإطارات الأمثل (FPS) موازنة الأداء مع قيود النظام. فيما يلي بعض الاعتبارات التي يجب وضعها في الاعتبار عند تحسين معدل الإطارات في الثانية لتطبيقات التعلم العميق:

  • موازنة الأداء والموارد: تعمل FPS الأعلى على تحسين الاستجابة ولكنها تزيد أيضًا من متطلبات الطاقة والمعالجة. يمكن أن يساعد تعديل FPS ديناميكيًا، باستخدام استيفاء الإطارات، وتحسين الأجهزة في الحفاظ على الأداء السلس دون زيادة تحميل النظام.
  • احتياجات خاصة بالتطبيق: التطبيقات المختلفة لها متطلبات مختلفة للإطارات في الثانية (FPS). يجب أن تستخدم الأجهزة التي تعمل بالبطارية معدل إطارات أقل للحفاظ على الطاقة، بينما تحتاج الأنظمة في الوقت الفعلي مثل الطائرات بدون طيار والمركبات ذاتية القيادة إلى معدل إطارات أعلى للحصول على استجابات سريعة ودقيقة.
  • الاختبار والتحسين: يجب اختبار إعدادات FPS بشكل مثالي في ظل ظروف الإضاءة والحركة المختلفة. يساعد تقييم زمن الوصول ومقارنة مستويات FPS جنبًا إلى جنب في تحديد أفضل توازن بين الاستجابة وجودة الصورة وكفاءة الموارد.

الابتكارات المستقبلية وتحسين FPS لنماذج الذكاء الاصطناعي

التطورات في الذكاء الاصطناعي وتحسين الأجهزة تجعل معدلات الإطارات الأعلى أكثر قابلية للتحقيق، حتى في البيئات محدودة الموارد. على سبيل المثال، يمكن للصناعات مثل السينما والرياضة والروبوتات الاستفادة من إدارة أكثر ذكاءً لمعدل الإطارات، حيث تقوم الأنظمة بضبط FPS ديناميكيًا بناءً على تعقيد الحركة وقوة المعالجة. يعمل استيفاء الإطارات المدفوع بالذكاء الاصطناعي أيضًا على تحسين سلاسة الفيديو عن طريق إنشاء إطارات إضافية في الوقت الفعلي.

في هذه الأثناء، تم تحقيق إنجاز جديد من NVIDIA يدفع بأداء FPS إلى أبعد من ذلك. يقدم DLSS 4 (التعلُّم العميق الفائق لأخذ العينات) توليد إطارات متعددة، والذي يستخدم الذكاء الاصطناعي للتنبؤ وإنشاء إطارات إضافية. وهذا يعزز معدلات الإطارات بما يصل إلى 8 أضعاف مع تقليل عبء العمل على النظام.

من خلال السماح للذكاء الاصطناعي بمعالجة جزء من العرض، يجعل DLSS 4 المرئيات أكثر سلاسة دون الضغط الإضافي على الأجهزة، مما يحسن الأداء والكفاءة.

النقاط الرئيسية

FPS هو أكثر من مجرد مقياس للمرئيات السلسة؛ فهو يقود عملية اتخاذ القرار في الوقت الحقيقي في مجال الذكاء الاصطناعي والرؤية الحاسوبية. يلتقط كل إطار في الفيديو بيانات مهمة، مما يمكّن الآلات من track الأجسام وتحليل الحركة والاستجابة للبيئات الديناميكية. سواء كانت سيارات ذاتية القيادة تتجنب العقبات أو أنظمة المراقبة التي تكتشف التهديدات على الفور، فإن الدقة والكفاءة في إطار الثانية الصحيحة تضمن الدقة والكفاءة.

لا يقتصر مستقبل FPS على زيادة معدلات الإطارات فحسب، بل يتعلق أيضًا بتحسينها بذكاء. سيجعل هذا التطور أنظمة الرؤية الحاسوبية أسرع وأكثر ابتكارًا وأكثر كفاءة في استخدام الموارد في مختلف الصناعات.

هل تود معرفة المزيد عن الذكاء الاصطناعي؟ استكشف مستودع GitHub الخاص بنا وانضم إلى مجتمعنا. هل أنت مستعد لبدء مشاريع الرؤية الحاسوبية الخاصة بك؟ تفقد خيارات الترخيص الخاصة بنا. تعرف على كيف تعمل الرؤية الحاسوبية في الرعاية الصحية على تحسين الكفاءة واستكشف تأثير الذكاء الاصطناعي في التصنيع من خلال زيارة صفحات الحلول الخاصة بنا!

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا