تعرف على سبب أهمية FPS في الرؤية الحاسوبية وكيف يؤثر على الكشف عن الكائنات في الوقت الفعلي وتحليلات الفيديو والتطبيقات المدعومة بالذكاء الاصطناعي.

تعرف على سبب أهمية FPS في الرؤية الحاسوبية وكيف يؤثر على الكشف عن الكائنات في الوقت الفعلي وتحليلات الفيديو والتطبيقات المدعومة بالذكاء الاصطناعي.
تعتبر مشاهدة إعادة عرض بالبطيئة للحظة رياضية مفضلة لديك، حيث تكون كل التفاصيل واضحة، مختلفة تمامًا عن مشاهدة لقطات المراقبة التي تبدو عادةً متقطعة ويصعب متابعتها. التفصيل التقني الرئيسي وراء هذه الاختلافات هو FPS أو الإطارات في الثانية، والذي يشير إلى عدد الإطارات المعروضة في الثانية في الفيديو. ينتج عن FPS الأعلى حركة سلسة ونابضة بالحياة، بينما يمكن أن يؤدي FPS الأقل إلى لقطات متقطعة وأقل تفصيلاً.
يؤثر هذا المفهوم بشكل مباشر على رؤية الحاسوب، وهو فرع من فروع الذكاء الاصطناعي يسمح للآلات بتفسير وتحليل البيانات المرئية بطريقة مماثلة لكيفية قيام البشر بذلك. في رؤية الحاسوب، يعني ارتفاع FPS أن الأنظمة يمكنها التقاط المزيد من المعلومات كل ثانية، مما يحسن دقة اكتشاف الكائنات وتتبعها في الوقت الفعلي.
في هذه المقالة، سوف نستكشف الجوانب التقنية للإطارات في الثانية وكيف ترتبط بتطبيقات الرؤية الحاسوبية. هيا بنا نبدأ!
لنفترض أنك تلعب لعبة سباق: عند 60 إطارًا في الثانية، تشعر أن كل منعطف سلس وسريع الاستجابة، ولكن عند 20 إطارًا في الثانية، تتأخر عناصر التحكم، مما يجعل من الصعب تفادي العقبات. ببساطة، يمكنك التفكير في FPS على أنه عدد الصور الثابتة التي يتم عرضها كل ثانية. المزيد من الصور في الثانية تجعل الحركة تبدو سلسة وطبيعية، في حين أن عددًا أقل من الصور يمكن أن يجعلها تبدو متقطعة.
تمامًا كما هو الحال في الألعاب، يعد FPS جزءًا أساسيًا من تطبيقات رؤية الكمبيوتر. إن FPS الأعلى يجعل من الممكن تتبع الكائنات باستخدام Vision AI بسلاسة، في حين أن FPS الأقل يمكن أن يؤدي إلى فقدان التفاصيل.
على سبيل المثال، في تحليلات الرياضة، تحتاج الكاميرات المدعومة بالذكاء الاصطناعي إلى معدل إطارات أعلى (FPS) لتتمكن من تتبع التمريرات السريعة وحركات اللاعبين ومسارات الكرة. قد يؤدي معدل الإطارات الأقل إلى فقدان الاتصال المهم بين القدم والكرة أو تغيير سريع في الاتجاه، مما يؤثر على دقة التحليل.
وبالمثل، في مراقبة حركة المرور، تعتمد الأنظمة على معدل إطارات مرتفع في الثانية (FPS) لاكتشاف المركبات المسرعة وتغييرات المسار في الوقت الفعلي. يعتمد اختيار معدل الإطارات المناسب على المتطلبات المحددة لكل تطبيق من تطبيقات رؤية الكمبيوتر، مع الموازنة بين الأداء والكفاءة والوضوح البصري.
الآن بعد أن ناقشنا ما هو FPS وكيف يتم استخدامه في الرؤية الحاسوبية، دعنا نتعمق في جوانبه التقنية - بدءًا بكيفية حساب FPS للفيديو.
يمنحك تقسيم العدد الإجمالي للإطارات على المدة بالثواني FPS لمقطع فيديو. على سبيل المثال، إذا كان مقطع فيديو يحتوي على 96 إطارًا على مدار 4 ثوانٍ، فإنه يتم حسابه على أنه 24 FPS - مما يعني عرض 24 صورة كل ثانية - بينما ينتج عن 32 إطارًا على مدار 4 ثوانٍ 8 FPS. يمكن استخدام مكتبات Python مثل OpenCV لاستخراج بيانات تعريف الفيديو، وعد الإطارات، وحساب FPS تلقائيًا، مما يبسط عملية تحليل الفيديو.
ومع ذلك، فإن حساب الإطارات في الثانية وحده لا يكفي لاتخاذ قرارات فنية عند تطوير حلول الرؤية الحاسوبية. من المهم أيضًا مراعاة العوامل المختلفة التي يمكن أن تؤثر على معدل الإطارات الفعال، مثل قدرات الأجهزة وتحسينات البرامج والظروف البيئية.
إليك نظرة فاحصة على هذه العوامل:
يمكن استخدام نماذج الذكاء الاصطناعي مثل Ultralytics YOLO11 التي تدعم مهام الرؤية الحاسوبية في الوقت الفعلي لتحليل مقاطع الفيديو بمعدلات إطارات عالية. هذه القدرة في الوقت الفعلي ضرورية لتطبيقات مثل القيادة الذاتية والمراقبة والروبوتات، حيث يمكن أن تؤدي التأخيرات الصغيرة إلى أخطاء كبيرة.
دعنا نستعرض بعض تطبيقات Vision AI الواقعية حيث يكون معدل الإطارات العالي في الثانية ضروريًا للدقة والأداء.
تستخدم أنظمة المراقبة التي تراقب المناطق ذات الازدحام المروري الشديد مثل الطرق السريعة معدل إطارات مرتفع (FPS) لالتقاط التفاصيل الدقيقة، مما يضمن توثيق المركبات سريعة الحركة بوضوح. هذا الوضوح ضروري لأنظمة التعرف التلقائي على لوحات الأرقام (ANPR)، والتي تعتمد على لقطات عالية الجودة لتحديد المركبات بدقة.
في مثل هذه الأنظمة، يمكن استخدام نماذج مثل YOLO11 لاكتشاف لوحات الترخيص مباشرة من بث الفيديو. بمجرد اكتشاف اللوحة، يتم استخدام التعرف الضوئي على الأحرف (OCR)، الذي يحول صور النص إلى أحرف قابلة للقراءة آليًا، لقراءة تفاصيل اللوحة. تتيح هذه العملية تحديدًا سريعًا ودقيقًا للمركبة، مما يعزز إنفاذ قوانين المرور والأمن العام.
تخيل سيارة ذاتية القيادة تقف عند إشارة توقف، وتحلل محيطها بعناية لتقرر ما إذا كان بإمكانها المضي قدمًا بأمان. يجب أن تتخذ هذه السيارة قرارات شبه فورية، الأمر الذي يتطلب التقاط ومعالجة البيانات المرئية في الوقت الفعلي.
إذا كانت السيارة ذاتية القيادة مزودة بكاميرات يمكنها التقاط لقطات بمعدل إطارات أعلى في الثانية (FPS)، فإنها تتلقى دفقًا أكثر استمرارية وتفصيلاً من الصور. يتيح هذا الإدخال المرئي المحسن للسيارة اكتشاف العوائق والمشاة والمركبات الأخرى بسرعة. وهذا يجعل من الممكن للمركبة أن تتفاعل على الفور مع أي تغييرات في بيئتها.
إذا كانت الكاميرات تعالج الصور بمعدل إطارات أقل في الثانية (FPS)، فقد تتلقى السيارة عرضًا متقطعًا وأقل تفصيلاً. قد يؤخر ذلك وقت استجابتها، مما يزيد من خطر فقدان المعلومات الهامة واحتمال المساس بالسلامة.
يعد التقاط كل حركة بدقة أمرًا بالغ الأهمية في الألعاب الرياضية، حيث يمكن أن تحدث القرارات في جزء من الثانية فرقًا كبيرًا بين الفوز والخسارة. تتيح لنا التكنولوجيا التي تدعم معدل إطارات أعلى في الثانية (FPS) تسجيل كل التفاصيل الصغيرة في الحركة، ويمكن للمدربين والمحللين والرياضيين مراجعة اللعب ببطء دون فقدان أي شيء. كما أنه يساعد الحكام على اتخاذ قرارات أكثر دقة في رياضات مثل التنس وكرة القدم والكريكيت من خلال توفير رؤية واضحة للإجراءات إطارًا بإطار.
على سبيل المثال، حللت دراسة مثيرة للاهتمام حول الكرة الطائرة كيف أن استخدام FPS أعلى يحسن تقييم الأداء. أدت زيادة FPS من 30 إلى 240 إلى تحسين وضوح الحركة وتتبع الكائن بشكل كبير. كما تحسنت دقة تحليل الارتفاع، مما ساعد المدربين على فهم وضع اليد ونقاط اتصال الكرة وآليات القفز بشكل أكثر دقة. علاوة على ذلك، وجدت الدراسة أن FPS الأعلى يقلل من ضبابية الحركة، مما يجعل عمليات الإرسال وردود الفعل الدفاعية أسهل في التحليل.
لا تتطلب جميع تطبيقات الرؤية الحاسوبية تسجيل لقطات بمعدل FPS أعلى. في كثير من الحالات، يكون معدل FPS أقل كافيًا لتحقيق نتائج دقيقة، اعتمادًا على المهمة. فيما يلي بعض المجالات الرئيسية التي يفضل فيها معدل FPS أقل:
يتطلب تحديد معدل الإطارات الأمثل (FPS) موازنة الأداء مع قيود النظام. فيما يلي بعض الاعتبارات التي يجب وضعها في الاعتبار عند تحسين معدل الإطارات في الثانية لتطبيقات التعلم العميق:
التطورات في الذكاء الاصطناعي وتحسين الأجهزة تجعل معدلات الإطارات الأعلى أكثر قابلية للتحقيق، حتى في البيئات محدودة الموارد. على سبيل المثال، يمكن للصناعات مثل السينما والرياضة والروبوتات الاستفادة من إدارة أكثر ذكاءً لمعدل الإطارات، حيث تقوم الأنظمة بضبط FPS ديناميكيًا بناءً على تعقيد الحركة وقوة المعالجة. يعمل استيفاء الإطارات المدفوع بالذكاء الاصطناعي أيضًا على تحسين سلاسة الفيديو عن طريق إنشاء إطارات إضافية في الوقت الفعلي.
وفي الوقت نفسه، فإن الاختراق الأخير من NVIDIA يدفع أداء FPS إلى أبعد من ذلك. يقدم DLSS 4 (Deep Learning Super Sampling) إنشاء متعدد الإطارات، والذي يستخدم الذكاء الاصطناعي للتنبؤ بالإطارات الإضافية وإنشائها. هذا يعزز معدلات الإطارات بما يصل إلى 8 مرات مع تقليل عبء العمل على النظام.
من خلال السماح للذكاء الاصطناعي بمعالجة جزء من العرض، يجعل DLSS 4 المرئيات أكثر سلاسة دون الضغط الإضافي على الأجهزة، مما يحسن الأداء والكفاءة.
إن FPS هي أكثر من مجرد مقياس للمرئيات السلسة؛ فهي تدفع اتخاذ القرارات في الوقت الفعلي في الذكاء الاصطناعي ورؤية الكمبيوتر. يلتقط كل إطار في الفيديو بيانات مهمة، مما يمكّن الآلات من تتبع الكائنات وتحليل الحركة والاستجابة للبيئات الديناميكية. سواء كانت سيارات ذاتية القيادة تتجنب العقبات أو أنظمة مراقبة تكتشف التهديدات على الفور، فإن FPS المناسبة تضمن الدقة والكفاءة.
لا يقتصر مستقبل FPS على زيادة معدلات الإطارات فحسب، بل يتعلق أيضًا بتحسينها بذكاء. سيجعل هذا التطور أنظمة الرؤية الحاسوبية أسرع وأكثر ابتكارًا وأكثر كفاءة في استخدام الموارد في مختلف الصناعات.
هل تود معرفة المزيد عن الذكاء الاصطناعي؟ استكشف مستودع GitHub الخاص بنا وانضم إلى مجتمعنا. هل أنت مستعد لبدء مشاريع الرؤية الحاسوبية الخاصة بك؟ تفقد خيارات الترخيص الخاصة بنا. تعرف على كيف تعمل الرؤية الحاسوبية في الرعاية الصحية على تحسين الكفاءة واستكشف تأثير الذكاء الاصطناعي في التصنيع من خلال زيارة صفحات الحلول الخاصة بنا!