تعرف على سبب أهمية FPS في الرؤية الحاسوبية وكيف يؤثر على الكشف عن الكائنات في الوقت الفعلي وتحليلات الفيديو والتطبيقات المدعومة بالذكاء الاصطناعي.
تعرف على سبب أهمية FPS في الرؤية الحاسوبية وكيف يؤثر على الكشف عن الكائنات في الوقت الفعلي وتحليلات الفيديو والتطبيقات المدعومة بالذكاء الاصطناعي.
تعتبر مشاهدة إعادة عرض بالبطيئة للحظة رياضية مفضلة لديك، حيث تكون كل التفاصيل واضحة، مختلفة تمامًا عن مشاهدة لقطات المراقبة التي تبدو عادةً متقطعة ويصعب متابعتها. التفصيل التقني الرئيسي وراء هذه الاختلافات هو FPS أو الإطارات في الثانية، والذي يشير إلى عدد الإطارات المعروضة في الثانية في الفيديو. ينتج عن FPS الأعلى حركة سلسة ونابضة بالحياة، بينما يمكن أن يؤدي FPS الأقل إلى لقطات متقطعة وأقل تفصيلاً.
يؤثر هذا المفهوم بشكل مباشر على رؤية الحاسوب، وهو فرع من فروع الذكاء الاصطناعي يسمح للآلات بتفسير وتحليل البيانات المرئية بطريقة مماثلة لكيفية قيام البشر بذلك. في رؤية الحاسوب، يعني ارتفاع FPS أن الأنظمة يمكنها التقاط المزيد من المعلومات كل ثانية، مما يحسن دقة اكتشاف الكائنات وتتبعها في الوقت الفعلي.
في هذه المقالة، سوف نستكشف الجوانب التقنية للإطارات في الثانية وكيف ترتبط بتطبيقات الرؤية الحاسوبية. هيا بنا نبدأ!
لنفترض أنك تلعب لعبة سباق: عند 60 إطارًا في الثانية، تشعر أن كل منعطف سلس وسريع الاستجابة، ولكن عند 20 إطارًا في الثانية، تتأخر عناصر التحكم، مما يجعل من الصعب تفادي العقبات. ببساطة، يمكنك التفكير في FPS على أنه عدد الصور الثابتة التي يتم عرضها كل ثانية. المزيد من الصور في الثانية تجعل الحركة تبدو سلسة وطبيعية، في حين أن عددًا أقل من الصور يمكن أن يجعلها تبدو متقطعة.
كما هو الحال في الألعاب، يعد FPS جزءًا أساسيًا من تطبيقات رؤية الكمبيوتر. يتيح ارتفاع معدل الإطارات في الثانية إمكانية track الأجسام باستخدام الذكاء الاصطناعي للرؤية بسلاسة، بينما يمكن أن يؤدي انخفاض معدل الإطارات في الثانية إلى فقدان التفاصيل.
على سبيل المثال، في التحليلات الرياضية، تحتاج الكاميرات التي تعمل بالذكاء الاصطناعي إلى معدل FPS أعلى لتتمكن من track التمريرات السريعة وحركات اللاعبين ومسارات الكرة. قد يؤدي انخفاض معدل الإطارات في الثانية إلى تفويت فرصة التقاط تلامس مهم من القدم إلى الكرة أو تغيير سريع في الاتجاه، مما يؤثر على دقة التحليل.
وبالمثل، في مجال مراقبة حركة المرور، تعتمد الأنظمة على FPS عالية في الثانية detect المركبات المسرعة وتغييرات الحارات في الوقت الفعلي. ويعتمد اختيار FPS المناسب على المتطلبات المحددة لكل تطبيق من تطبيقات الرؤية الحاسوبية، والموازنة بين الأداء والكفاءة والوضوح البصري.

الآن بعد أن ناقشنا ما هو FPS وكيف يتم استخدامه في الرؤية الحاسوبية، دعنا نتعمق في جوانبه التقنية - بدءًا بكيفية حساب FPS للفيديو.
بقسمة العدد الإجمالي للإطارات على المدة بالثانية تحصل على FPS للفيديو. على سبيل المثال، إذا كان الفيديو يحتوي على 96 إطارًا على مدى 4 ثوانٍ، فيتم حساب 24 إطارًا في الثانية - ما يعني عرض 24 صورة كل ثانية - بينما ينتج عن 32 إطارًا على مدى 4 ثوانٍ 8 إطارات في الثانية. مكتبات Python مثل OpenCV لاستخراج البيانات الوصفية للفيديو، وحساب الإطارات، وحساب FPS تلقائيًا، مما يسهّل عملية تحليل الفيديو.

ومع ذلك، فإن حساب الإطارات في الثانية وحده لا يكفي لاتخاذ قرارات فنية عند تطوير حلول الرؤية الحاسوبية. من المهم أيضًا مراعاة العوامل المختلفة التي يمكن أن تؤثر على معدل الإطارات الفعال، مثل قدرات الأجهزة وتحسينات البرامج والظروف البيئية.
إليك نظرة فاحصة على هذه العوامل:
نماذج الذكاء الاصطناعي مثل Ultralytics YOLO11 التي تدعم مهام الرؤية الحاسوبية في الوقت الحقيقي يمكن استخدامها لتحليل مقاطع الفيديو بمعدلات إطارات عالية. هذه القدرة في الوقت الحقيقي أمر بالغ الأهمية لتطبيقات مثل القيادة الذاتية والمراقبة والروبوتات، حيث يمكن أن تؤدي حتى التأخيرات الصغيرة إلى أخطاء كبيرة.
دعنا نستعرض بعض تطبيقات Vision AI الواقعية حيث يكون معدل الإطارات العالي في الثانية ضروريًا للدقة والأداء.
تستخدم أنظمة المراقبة التي تراقب المناطق ذات الازدحام المروري الشديد مثل الطرق السريعة معدل إطارات مرتفع (FPS) لالتقاط التفاصيل الدقيقة، مما يضمن توثيق المركبات سريعة الحركة بوضوح. هذا الوضوح ضروري لأنظمة التعرف التلقائي على لوحات الأرقام (ANPR)، والتي تعتمد على لقطات عالية الجودة لتحديد المركبات بدقة.
في مثل هذه الأنظمة، يمكن استخدام نماذج مثل YOLO11 detect لوحات السيارات مباشرةً من موجز الفيديو. وبمجرد اكتشاف اللوحة، يتم استخدام نظام التعرف الضوئي على الحروف (OCR)، الذي يحول صور النص إلى أحرف يمكن قراءتها آلياً، لقراءة تفاصيل اللوحة. وتتيح هذه العملية إمكانية التعرف السريع والدقيق على المركبة، مما يعزز من إنفاذ قوانين المرور والأمن العام.

تخيل سيارة ذاتية القيادة تقف عند إشارة توقف، وتحلل محيطها بعناية لتقرر ما إذا كان بإمكانها المضي قدمًا بأمان. يجب أن تتخذ هذه السيارة قرارات شبه فورية، الأمر الذي يتطلب التقاط ومعالجة البيانات المرئية في الوقت الفعلي.
إذا كانت السيارة ذاتية القيادة مزوّدة بكاميرات يمكنها التقاط لقطات بمعدل إطارات في الثانية أعلى، فإنها تتلقى تدفقاً أكثر استمرارية وتفصيلاً للصور. تمكّن هذه المدخلات البصرية المحسّنة السيارة من detect العوائق والمشاة والمركبات الأخرى بسرعة. كما يتيح للسيارة إمكانية الاستجابة السريعة لأي تغييرات في بيئتها.
إذا كانت الكاميرات تعالج الصور بمعدل إطارات أقل في الثانية (FPS)، فقد تتلقى السيارة عرضًا متقطعًا وأقل تفصيلاً. قد يؤخر ذلك وقت استجابتها، مما يزيد من خطر فقدان المعلومات الهامة واحتمال المساس بالسلامة.
يعد التقاط كل حركة بدقة أمرًا بالغ الأهمية في الألعاب الرياضية، حيث يمكن أن تحدث القرارات في جزء من الثانية فرقًا كبيرًا بين الفوز والخسارة. تتيح لنا التكنولوجيا التي تدعم معدل إطارات أعلى في الثانية (FPS) تسجيل كل التفاصيل الصغيرة في الحركة، ويمكن للمدربين والمحللين والرياضيين مراجعة اللعب ببطء دون فقدان أي شيء. كما أنه يساعد الحكام على اتخاذ قرارات أكثر دقة في رياضات مثل التنس وكرة القدم والكريكيت من خلال توفير رؤية واضحة للإجراءات إطارًا بإطار.
على سبيل المثال، حللت دراسة مثيرة للاهتمام حول الكرة الطائرة كيف أن استخدام FPS أعلى يحسن تقييم الأداء. أدت زيادة FPS من 30 إلى 240 إلى تحسين وضوح الحركة وتتبع الكائن بشكل كبير. كما تحسنت دقة تحليل الارتفاع، مما ساعد المدربين على فهم وضع اليد ونقاط اتصال الكرة وآليات القفز بشكل أكثر دقة. علاوة على ذلك، وجدت الدراسة أن FPS الأعلى يقلل من ضبابية الحركة، مما يجعل عمليات الإرسال وردود الفعل الدفاعية أسهل في التحليل.

لا تتطلب جميع تطبيقات الرؤية الحاسوبية تسجيل لقطات بمعدل FPS أعلى. في كثير من الحالات، يكون معدل FPS أقل كافيًا لتحقيق نتائج دقيقة، اعتمادًا على المهمة. فيما يلي بعض المجالات الرئيسية التي يفضل فيها معدل FPS أقل:
يتطلب تحديد معدل الإطارات الأمثل (FPS) موازنة الأداء مع قيود النظام. فيما يلي بعض الاعتبارات التي يجب وضعها في الاعتبار عند تحسين معدل الإطارات في الثانية لتطبيقات التعلم العميق:
التطورات في الذكاء الاصطناعي وتحسين الأجهزة تجعل معدلات الإطارات الأعلى أكثر قابلية للتحقيق، حتى في البيئات محدودة الموارد. على سبيل المثال، يمكن للصناعات مثل السينما والرياضة والروبوتات الاستفادة من إدارة أكثر ذكاءً لمعدل الإطارات، حيث تقوم الأنظمة بضبط FPS ديناميكيًا بناءً على تعقيد الحركة وقوة المعالجة. يعمل استيفاء الإطارات المدفوع بالذكاء الاصطناعي أيضًا على تحسين سلاسة الفيديو عن طريق إنشاء إطارات إضافية في الوقت الفعلي.
في هذه الأثناء، تم تحقيق إنجاز جديد من NVIDIA يدفع بأداء FPS إلى أبعد من ذلك. يقدم DLSS 4 (التعلُّم العميق الفائق لأخذ العينات) توليد إطارات متعددة، والذي يستخدم الذكاء الاصطناعي للتنبؤ وإنشاء إطارات إضافية. وهذا يعزز معدلات الإطارات بما يصل إلى 8 أضعاف مع تقليل عبء العمل على النظام.
من خلال السماح للذكاء الاصطناعي بمعالجة جزء من العرض، يجعل DLSS 4 المرئيات أكثر سلاسة دون الضغط الإضافي على الأجهزة، مما يحسن الأداء والكفاءة.
FPS هو أكثر من مجرد مقياس للمرئيات السلسة؛ فهو يقود عملية اتخاذ القرار في الوقت الحقيقي في مجال الذكاء الاصطناعي والرؤية الحاسوبية. يلتقط كل إطار في الفيديو بيانات مهمة، مما يمكّن الآلات من track الأجسام وتحليل الحركة والاستجابة للبيئات الديناميكية. سواء كانت سيارات ذاتية القيادة تتجنب العقبات أو أنظمة المراقبة التي تكتشف التهديدات على الفور، فإن الدقة والكفاءة في إطار الثانية الصحيحة تضمن الدقة والكفاءة.
لا يقتصر مستقبل FPS على زيادة معدلات الإطارات فحسب، بل يتعلق أيضًا بتحسينها بذكاء. سيجعل هذا التطور أنظمة الرؤية الحاسوبية أسرع وأكثر ابتكارًا وأكثر كفاءة في استخدام الموارد في مختلف الصناعات.
هل تود معرفة المزيد عن الذكاء الاصطناعي؟ استكشف مستودع GitHub الخاص بنا وانضم إلى مجتمعنا. هل أنت مستعد لبدء مشاريع الرؤية الحاسوبية الخاصة بك؟ تفقد خيارات الترخيص الخاصة بنا. تعرف على كيف تعمل الرؤية الحاسوبية في الرعاية الصحية على تحسين الكفاءة واستكشف تأثير الذكاء الاصطناعي في التصنيع من خلال زيارة صفحات الحلول الخاصة بنا!