استكشف الفرق بين الاستدلال في الوقت الحقيقي والاستدلال على دفعات عند استخدام Ultralytics YOLO11 لتطبيقات الرؤية الحاسوبية المختلفة.
إذا كنت قد شاهدت سيارة ذاتية القيادة أثناء القيادة، فقد شاهدت الاستدلال بالذكاء الاصطناعي في الوقت الفعلي. عادةً ما تستخدم السيارة ذاتية القيادة الكاميرات وأجهزة الاستشعار والذكاء الاصطناعي لمعالجة البيئة المحيطة بها واتخاذ قرارات فورية تقريباً. ومع ذلك، عندما لا تكون هناك حاجة إلى استجابات سريعة، يمكن أن يكون الاستدلال في الوقت الحقيقي ثقيل الموارد.
الخيار الأفضل في هذه الحالات هو الاستدلال على دفعات. فبدلاً من معالجة البيانات بشكل مستمر في الوقت الفعلي، يمكن للاستدلال الدفعي معالجة مجموعات كبيرة من البيانات على فترات زمنية مجدولة. يساعد هذا النهج في توفير الموارد وتقليل استهلاك الطاقة وخفض تكاليف البنية التحتية.
على سبيل المثال، في تطبيقات الرؤية الحاسوبية، نماذج مثل Ultralytics YOLO11 لمهام في الوقت الحقيقي مثل اكتشاف الكائنات وتجزئة المثيل. ومع ذلك، يمكن أن تكون معالجة كميات كبيرة من البيانات المرئية في الوقت الفعلي أمرًا صعبًا.
يمكن تشغيل YOLO11 على البيانات المرئية على دفعات باستخدام الاستدلال على دفعات، مما يقلل من الضغط على النظام ويحسن الكفاءة دون التضحية بالأداء. وهذا يجعل من الأسهل نشر حلول الذكاء الاصطناعي المرئي على نطاق واسع دون إرهاق الأجهزة أو زيادة التكاليف.
في هذه المقالة، سنستكشف في هذه المقالة الاستدلال الدفعي وفوائده، وكيف يمكن تطبيق الاستدلال الدفعي باستخدام YOLO11 في تطبيقات الرؤية الحاسوبية. لنبدأ!
يمكنك التفكير في الاستدلال الدفعي على أنه معالجة مهمة كبيرة دفعة واحدة بدلاً من معالجتها قطعة تلو الأخرى عند ورودها. فبدلاً من معالجة البيانات باستمرار في الوقت الفعلي، يتيح لك الاستدلال الدفعي معالجة مجموعات كبيرة من البيانات على فترات زمنية محددة. هذا النهج أكثر كفاءة عندما لا تكون الاستجابات الفورية ضرورية، مما يساعد على توفير موارد الحوسبة وتقليل استخدام الطاقة وخفض التكاليف.
عندما يتعلق الأمر برؤية الكمبيوتر، هناك بعض التطبيقات التي يكون فيها زمن الاستجابة المنخفض أمرًا حيويًا. يشير الكمون المنخفض إلى الحد الأدنى من التأخير بين تلقي المدخلات (مثل صورة أو إطار فيديو) واستجابة النظام. على سبيل المثال، في المراقبة الأمنية في الوقت الفعلي، حتى التأخير البسيط يمكن أن يؤدي إلى مخاطر تتعلق بالسلامة.
ومع ذلك، في العديد من سيناريوهات الرؤية الحاسوبية الأخرى، لا يكون وقت الاستجابة المنخفض بنفس الأهمية. هذا هو المكان الذي يتألق فيه الاستدلال على الدُفعات - عندما لا يحتاج النظام إلى الاستجابة الفورية. يعمل الاستدلال على الدُفعات عن طريق تغذية البيانات المرئية لنموذج الرؤية الحاس وبية في مجموعات أو دفعات، مما يمكّن النظام من معالجة مجموعات البيانات الكبيرة دفعة واحدة بدلاً من معالجتها بشكل مستمر في الوقت الفعلي.
فيما يلي نظرة فاحصة على الخطوات المتبعة في الاستدلال الدفعي:
والآن بعد أن غطينا ما هو الاستدلال الدفعي وكيف يختلف عن الاستدلال في الوقت الحقيقي، دعونا نلقي نظرة فاحصة على وقت استخدامه.
الاستدلال الدفعي مثالي لتحليل البيانات التاريخية. لنفترض أن لديك لقطات مراقبة من محطة مترو على مدار الشهر الماضي، وتحاول تحديد أنماط معينة، مثل عدد الأشخاص الذين يدخلون ويخرجون في أوقات مختلفة من اليوم.
بدلاً من معالجة كل إطار في الوقت الفعلي، يسمح لك الاستدلال على الدُفعات بمعالجة لقطات شهر كامل على دفعات، وتحديد الأحداث أو الاتجاهات الرئيسية دون الحاجة إلى نتائج فورية. وبهذه الطريقة، يمكنك تحليل كميات كبيرة من البيانات بكفاءة أكبر واكتساب رؤى حول الأنماط طويلة المدى، دون إرباك النظام أو الحاجة إلى مراقبة مستمرة.
يعد الاستدلال على الدفعات أيضًا الحل الأمثل عندما تكون موارد النظام محدودة. من خلال تشغيل الاستدلال خارج ساعات الذروة (مثل الليل)، يمكنك توفير تكاليف الحوسبة وضمان عدم تحميل النظام فوق طاقته خلال أوقات ذروة الاستخدام. وهذا يجعلها نهجًا فعالاً وفعالاً من حيث التكلفة للشركات أو المشاريع التي تحتاج إلى معالجة مجموعات بيانات كبيرة ولكنها لا تتطلب تحليلاً في الوقت الفعلي.
تدعم حزمةUltralytics Python الاستدلال الدفعي لنماذج مثل YOLO11. باستخدام YOLO11 يمكنك بسهولة تشغيل الاستدلال الدفعي عن طريق تحديد وسيطة "دفعة"، والتي تحدد عدد الصور أو إطارات الفيديو التي تتم معالجتها في وقت واحد.
أثناء عملية الاستدلال على الدفعات، يتم إنشاء تنبؤات لجميع الصور في الدفعة في وقت واحد. بشكل افتراضي، يتم ضبط حجم الدُفعة على 1، ولكن يمكنك ضبطه على أي رقم تفضله.
على سبيل المثال، إذا تم ضبط حجم الدُفعة على 5، فسيعالج YOLO11 خمس صور أو إطارات فيديو في كل مرة ويُنشئ تنبؤات لجميع الصور الخمس دفعة واحدة. عادةً ما تؤدي أحجام الدُفعات الأكبر إلى أوقات استنتاج أسرع، حيث أن معالجة صور متعددة في دفعة واحدة أكثر كفاءة من معالجتها بشكل فردي.
بعد ذلك، دعونا نستكشف بعض حالات استخدام الرؤية الحاسوبية في العالم الحقيقي للاستدلال الدفعي.
في الأبحاث الطبية، يعد العمل مع كميات كبيرة من البيانات المرئية أمرًا شائعًا للغاية. وهنا، يمكن أن يساعد الاستدلال على دفعات العلماء على تحليل البيانات بسهولة أكبر في مجالات مثل الكيمياء وعلم الأحياء وعلم الوراثة. فبدلاً من تحليل البيانات دفعة واحدة، تتم معالجة البيانات على دفعات، مما يوفر الوقت والجهد.
على سبيل المثال، في المرافق الطبية، يمكن أن يكون الاستدلال على الدُفعات مفيدًا بشكل خاص لتحليل مجموعات كبيرة من الصور الطبية مثل التصوير بالرنين المغناطيسي أو الأشعة المقطعية. يمكن للمستشفيات جمع هذه الفحوصات على مدار اليوم ومعالجتها على دفعات خلال الليل.
يسمح هذا النهج للمستشفيات بالاستفادة من أجهزتها وموظفيها بشكل أفضل، وتقليل التكاليف التشغيلية، وضمان مراجعة جميع عمليات المسح بطريقة متسقة وموحدة. كما أنه مفيد أيضاً للمشاريع البحثية الكبيرة والدراسات طويلة الأمد، حيث يكون من الضروري التعامل مع كميات هائلة من البيانات.
تستخدم السيارات ذاتية القيادة تقنيات الذكاء الاصطناعي مثل الرؤية الحاسوبية لمعالجة العالم من حولها. بمساعدة النماذج المتقدمة مثل YOLO11 يمكن للأنظمة الموجودة على متن السيارة التعرف على المركبات الأخرى وخطوط المسارات وعلامات الطريق والأشخاص في الشارع. في حين أن الاستدلال في الوقت الحقيقي أمر بالغ الأهمية على الطريق، تعتمد تقنية القيادة الذاتية أيضاً بشكل كبير على الاستدلال على دفعات خلف الكواليس.
بعد أن تكمل السيارة رحلة، يمكن معالجة البيانات التي تجمعها، مثل ساعات من لقطات الكاميرا وقراءات المستشعرات وعمليات المسح باستخدام نظام LIDAR، في وقت لاحق على دفعات كبيرة. وهذا يتيح للمهندسين إمكانية تحديث نماذج الذكاء الاصطناعي للسيارة وتعزيز سلامة النظام وتحسين قدرته على التعامل مع ظروف القيادة المختلفة.
كما يتم استخدام الاستدلال على دفعات في محاكاة القيادة الذاتية لاختبار كيفية تفاعل السيارات ذاتية القيادة في مواقف مختلفة، مثل التنقل في التقاطعات المزدحمة أو الاستجابة لحركات المشاة غير المتوقعة. يوفر هذا النهج الوقت ويقلل التكاليف ويجنب المخاطر المرتبطة باختبار كل سيناريو في الحياة الواقعية.
وبالمثل، بالنسبة لمتاجر البيع بالتجزئة، يمكن أن يؤدي الاستدلال على الدُفعات باستخدام نماذج الرؤية الحاسوبية مثل YOLO11 إلى تعزيز الكفاءة التشغيلية بشكل كبير. على سبيل المثال، يمكن لأنظمة الكاميرات في المتاجر التقاط آلاف الصور على مدار اليوم، والتي يمكن معالجتها بعد ذلك على دفعات خلال الليل.
يسمح ذلك للمتاجر بتحليل ما يحدث في المتجر، مثل سلوك العملاء وأنماط حركة المرور وتفاعلات المنتجات، دون الحاجة إلى المعالجة في الوقت الفعلي، وهو ما قد يمثل تحديًا للمتاجر الصغيرة.
ومن الأمثلة الأخرى المثيرة للاهتمام استخدام الاستدلال الدفعي لإنشاء خرائط حرارية تصور المناطق التي تشهد نشاطًا مرتفعًا ومنخفضًا للزبائن داخل المتجر. من خلال تحليل هذه الخرائط الحرارية، يمكن لتجار التجزئة تحديد المناطق التي تجذب أكبر عدد من الزبائن وأي أجزاء المتجر قد تحتاج إلى مزيد من الاهتمام أو تحسين وضع المنتج. يمكن أن تساعد هذه البيانات تجار التجزئة على اتخاذ قرارات أفضل بشأن تخطيط المتجر وتحديد مواقع المنتجات وحتى الاستراتيجيات الترويجية لتحسين تجربة العملاء والمبيعات.
فيما يلي بعض الفوائد الرئيسية التي يمكن أن يجلبها الاستدلال الدفعي لمختلف الصناعات:
في حين أن هناك العديد من المزايا لاستخدام الاستدلال الدفعيّ، إلا أن هناك أيضًا بعض القيود التي يجب مراعاتها. فيما يلي بعض العوامل التي يجب وضعها في الاعتبار:
يعد الاستدلال على دفعات طريقة فعالة لمعالجة كميات كبيرة من البيانات المرئية التي لا تتطلب نتائج فورية. فبدلاً من تحليل كل صورة في الوقت الفعلي، فإنه يعالجها على دفعات في أوقات مجدولة، مثل الليل.
هذه الطريقة فعّالة من حيث التكلفة وتقلل من العبء الحسابي وتوفر نتائج دقيقة. من مساعدة المتاجر في إدارة المخزون إلى مساعدة الأطباء في تحليل المسح الطبي وتعزيز تقنيات السيارات ذاتية القيادة، يجعل الاستدلال على الدُفعات رؤية الكمبيوتر أكثر سهولة وبأسعار معقولة وعملية للتطبيقات في العالم الحقيقي.
هل أنت مستعد للتعمق في الذكاء الاصطناعي؟ استكشف مستودع GitHub الخاص بنا، وتواصل مع مجتمعنا، واطلع على خيارات الترخيص لدينا لبدء رحلتك في مجال الرؤية الحاسوبية. تعرّف على المزيد حول الابتكارات مثل الذكاء الاصطناعي في التصنيع والرؤية الحاسوبية في مجال الخدمات اللوجستية على صفحات الحلول الخاصة بنا.