صمم iOS أكثر ذكاءً باستخدام أفضل نماذج الكشف عن الأجسام. تعرف على النماذج التي توفر أداءً سريعًا ودقيقًا في الوقت الفعلي على iOS مثل iPhone وiPad.
صمم iOS أكثر ذكاءً باستخدام أفضل نماذج الكشف عن الأجسام. تعرف على النماذج التي توفر أداءً سريعًا ودقيقًا في الوقت الفعلي على iOS مثل iPhone وiPad.
أصبحت Android آيفون من الضروريات اليومية. يستخدمها الناس للتسوق، والتنقل، والتقاط الصور، ومسح المنتجات ضوئيًا، والتفاعل مع التطبيقات على مدار اليوم.
مع النمو السريع للذكاء الاصطناعي، أصبحت العديد من الهواتف الذكية تضم الآن ميزات قادرة على فهم الصور ومقاطع الفيديو التي تلتقطها كاميرا الجهاز. وتعتمد القدرة على تشغيل هذه الميزات بكفاءة إلى حد كبير على الأجهزة الأساسية.
على سبيل المثال، في منظومة أبل، تعمل أجهزة مثل آيفون وآيباد وماك بشرائح «أبل سيليكون»، بما في ذلك سلسلة A وسلسلة M. وتدمج تصميمات «النظام على الرقاقة» (SoC) هذه وحدات المعالجة المركزية (CPU) ووحدات معالجة الرسومات (GPU) ومسرعات التعلم الآلي المخصصة، مما يتيح إجراء عمليات الاستدلال على الجهاز لأحمال عمل الذكاء الاصطناعي.
وعلى وجه الخصوص، تتحقق قدرات تحليل الصور بفضل «الرؤية الحاسوبية»، وهو مجال من مجالات الذكاء الاصطناعي يتيح للآلات تفسير وفهم المعلومات المرئية المستمدة من الصور ومقاطع الفيديو باستخدام مهام مثل «اكتشاف الكائنات».
وعلى وجه التحديد، تقوم نماذج الكشف عن الكائنات بتحليل الصور وتحديد الكائنات من خلال رسم مربعات محيطة بها. ويمكن تحسين هذه النماذج لتعمل بكفاءة على الأجهزة المحمولة، مثل شرائح Apple Silicon، مما يتيح إجراء التحليل البصري في الوقت الفعلي مباشرةً على iOS .

في هذا المقال، سنتعرف على بعض أفضل نماذج الكشف عن الأجسام المستخدمة في تطوير iOS سريعة تعمل في الوقت الفعلي. هيا بنا نبدأ!
تساعد ميزة "الكشف عن الكائنات" التطبيقات على التعرف على الكائنات الموجودة في الصورة وتحديد مواقعها. فعندما تقوم إحدى التطبيقات بمعالجة صورة مدخلة، يمكن لنموذج الكشف عن الكائنات تحليل المشهد وتحديد الكائنات المختلفة عن طريق وضع مربعات محيطة بها وتعيين تسميات لها.
تعتمد معظم أنظمة الكشف عن الأجسام على الشبكات العصبية القادرة على التعرف على الأنماط في بيانات التدريب. وفيما يتعلق بمهام معالجة الصور، تتعلم هذه النماذج التمثيلات البصرية من خلال تحليل المعلومات على مستوى البكسل المستمدة من مجموعات بيانات تدريب ضخمة.
غالبًا ما تُستخدم الشبكات العصبية التلافيفية (CNN) كأساس لنماذج الكشف عن الأجسام. وتُعد الشبكات العصبية التلافيفية مثالية للتنبؤات المتعلقة بالصور لأنها تتعلم السمات البصرية الهرمية مثل الحواف والأشكال والأنسجة، مما يساعد النموذج على التعرف على الأجسام الموجودة داخل المشهد.
كما يبحث الباحثون في استخدام البنى القائمة على المحولات في مهام الرؤية الحاسوبية. حيث تقوم هذه النماذج بتحليل العلاقات بين المناطق المختلفة في الصورة، وتستخلص معلومات سياقية أوسع نطاقاً من المشهد بأكمله.
بصرف النظر عن نوع بنية النموذج، تُعد الكفاءة عاملاً حاسماً في عملية الكشف عن الكائنات على iOS . ونظراً لأن هذه النماذج تعمل مباشرةً على الأجهزة المحمولة، فإنها يتعين عليها معالجة الصور بسرعة مع الاعتماد على موارد حاسوبية محدودة.
تحافظ النماذج الفعالة على زمن انتقال منخفض وتدعم الكشف عن الكائنات في الوقت الفعلي في تطبيقات الأجهزة المحمولة، لا سيما عند تحليل المدخلات المستمرة من الكاميرا.
قبل أن نستعرض بعضًا من أفضل نماذج الكشف عن الأجسام iOS، دعونا نتوقف قليلاً ونفهم ما الذي يجعل النموذج مناسبًا لتطبيقات الأجهزة المحمولة.
إن النموذج المثالي للكشف عن الأجسام في iOS هو الذي يحقق التوازن بين الأداء والكفاءة والموثوقية. وفيما يلي بعض العوامل الرئيسية التي تحدد معالم النموذج القوي المخصص iOS :
بعد ذلك، دعونا نلقي نظرة على بعض نماذج الكشف عن الكائنات الأكثر استخدامًا iOS .
تُعد YOLO Ultralytics مجموعة شهيرة من نماذج الكشف عن الأجسام المصممة لتطبيقات الرؤية الحاسوبية في الوقت الفعلي. وعلى مر السنين، Ultralytics نماذج رؤية مثل Ultralytics YOLOv5و Ultralytics YOLOv8، Ultralytics YOLO11، وأحدث نموذج متطور، Ultralytics .
أدخل كل إصدار جديد تحسينات في دقة الكشف وكفاءة النموذج وأداء التشغيل. وقد جعلت هذه التحديثاتYOLO Ultralytics YOLO أكثر ملاءمة للأجهزة الطرفية مثل الهواتف الذكية.

تتمثل إحدى المزايا الرئيسية لاستخدامYOLO Ultralytics YOLO في iOS في CoreML الذي توفره Python Ultralytics Python . تساعد هذه المكتبة مفتوحة المصدر المطورين على تدريبYOLO Ultralytics YOLO واختبارها وتصديرها من خلال سير عمل بسيط.
تدعم الحزمة تصدير النماذج المدربة إلى CoreML وهو تنسيق التعلم الآلي الخاص بشركة Apple والمستخدم لنشر النماذج على iOS . وبعد التصدير، يمكن دمج CoreML في أحد التطبيقات وتشغيله مباشرةً على الجهاز باستخدام مكونات الأجهزة مثل CPU GPU) ومحرك Apple Neural Engine.

وهذا يسهل على المطورين دمج ميزة الكشف عن الكائنات في الوقت الفعلي في iOS مع الحفاظ على استدلال النموذج داخل الجهاز.
بالإضافة إلى النماذج نفسها، يوفر Ultralytics مجموعة من الخيارات التي تسهل نشر YOLO على شرائح Apple Silicon.
على سبيل المثال، أطلقت Ultralytics Ultralytics ، التي تجمع بين إدارة مجموعات البيانات وتدريب النماذج والتحقق من صحتها ونشرها في بيئة واحدة. ويقلل هذا المسار الموحد من الحاجة إلى استخدام أدوات متعددة، كما يساعد على تبسيط المسار من مرحلة التجريب إلى التطبيقات العملية.
كجزء من المنصة، يمكن تصدير النماذج المدربة إلى صيغ متعددة، بما في ذلك CoreML Apple. وهذا يتيح تصديرYOLO Ultralytics YOLO لإجراء الاستدلال على الجهاز ببضع نقرات فقط.
بالإضافة إلى إمكانيات التصدير، Ultralytics نسخة مفتوحة المصدر من لغة Swift (لغة البرمجة الخاصة بشركة Apple والمستخدمة في تطوير iOS ) iOS. ويشمل ذلك iOS YOLO جاهز للاستخدام iOS ومكتوب بلغة Swift، يوضح كيفية دمج CoreML وتشغيلها على مدخلات الكاميرا واستخدامها في الكشف عن الأجسام في الوقت الفعلي.
فيما يلي بعض الخصائص الرئيسية الأخرى التي تجعلYOLO Ultralytics خيارًا ممتازًا لتطوير iOS :
EfficientDet هي بنية للكشف عن الأجسام طورها باحثون في Google 2019. وقد صُممت لتحقيق التوازن بين دقة الكشف والكفاءة الحسابية، مما يجعلها مناسبة للبيئات ذات الموارد المحدودة.
تتمثل إحدى الأفكار الرئيسية وراء EfficientDet في طريقة توسيع نطاق تُعرف باسم «التوسيع المركب». فبدلاً من زيادة جزء واحد فقط من النموذج، مثل عمق الشبكة أو دقة الصورة، تعمل هذه الطريقة على توسيع نطاق مكونات متعددة للبنية في آن واحد.
من خلال ضبط هذه العناصر في آن واحد، يحافظ النموذج على أداء مستقر سواء تم تهيئته لتحقيق دقة عالية أو تم تحسينه لتطبيقات خفيفة الوزن.
تتوفر هذه البنية في عدة إصدارات، تتراوح من EfficientDet-D0 إلى EfficientDet-D7. وقد صُممت النماذج الأصغر حجماً لتوفير استدلال أسرع واستهلاك أقل للموارد، بينما تركز الإصدارات الأكبر حجماً على تحقيق دقة اكتشاف أعلى.
MobileNet SSD هو نموذج خفيف الوزن للكشف عن الأجسام، صُمم ليعمل بكفاءة على الأجهزة المحمولة وأجهزة الحافة. وقد اكتسب شعبية في حوالي عام 2017.
يجمع هذا النموذج بين الهيكل الأساسي لـ MobileNet، الذي يركز على استخراج السمات بكفاءة، ونهج SSD (كاشف اللقطة الواحدة) لاكتشاف الكائنات. وتقوم طريقة SSD باكتشاف الكائنات وإنشاء مربعات تحديد في مرحلة معالجة أمامية واحدة.
يحافظ هذا التصميم على سرعة النموذج وبساطته نسبياً، وهو أمر مفيد للتطبيقات التي تتطلب نتائج استشعار سريعة. غالباً ما يُستخدم MobileNet SSD في الحالات التي تكون فيها أحجام النماذج الأصغر وسرعات الاستدلال الأعلى أمراً مهماً.
تقلل بنية MobileNet من حجم العمليات الحسابية المطلوبة، مما يسهل تشغيل النموذج على الأجهزة ذات القدرة المحدودة على المعالجة. ورغم أن MobileNet SSD قد لا تحقق نفس مستوى الدقة الذي توفره بعض بنى الكشف الأحدث، إلا أنها لا تزال تقدم أداءً جيدًا في العديد من مهام الكشف عن الكائنات الشائعة.
CenterNet هو نموذج للكشف عن الأجسام يعمل على تحديد الأجسام من خلال توقع نقاط مركزها. وقد تم طرحه في عام 2019.
بدلاً من إنشاء العديد من المناطق المرشحة، يقوم النموذج بتحديد مركز الكائن ثم توقع حجم المربع المحيط به. ويؤدي هذا النهج إلى تبسيط عملية الكشف وتقليل عدد الخطوات التي تتطلبها عملية الاستدلال.

يمكن استخدام CenterNet في مهام الكشف في الوقت الفعلي، وهو معروف ببنيته البسيطة نسبيًا مقارنة ببعض أجهزة الكشف متعددة المراحل. وتُستخدم المتغيرات المختلفة، مثل CenterNet المزودة بهياكل ResNet الأساسية، بشكل شائع في تطبيقات الرؤية الحاسوبية المختلفة.
بفضل تصميمه الفعال، يُعد CenterNet مناسبًا للأنظمة التي تتطلب الكشف السريع عن الأجسام، بما في ذلك التطبيقات التي تعمل على iOS .
NanoDet هو نموذج خفيف الوزن لاكتشاف الأجسام، صُمم للتطبيقات التي تعمل في الوقت الفعلي على أجهزة الحافة والأجهزة المحمولة. وقد تم طرحه في عام 2020 بهدف توفير اكتشاف فعال للأجسام مع الحفاظ على حجم النموذج ومتطلباته الحسابية عند مستويات منخفضة للغاية.
يستخدم النموذج بنية كشف أحادية المرحلة، مما يمكّنه من توقع مواقع الكائنات وفئاتها خلال مرور واحد عبر الشبكة. ويضمن هذا التصميم سرعة النموذج وملاءمته للأنظمة ذات الموارد المادية المحدودة.
يستخدم NanoDet بنية أساسية مدمجة ورأس كشف مُحسَّن لتقليل عدد المعلمات والعمليات الحسابية المطلوبة أثناء عملية الاستدلال. وتساعد هذه الخيارات التصميمية في الحفاظ على دقة كشف معقولة مع إعطاء الأولوية للسرعة والكفاءة.
غالبًا ما يعتمد اختيار نموذج للكشف عن الأجسام iOS على المتطلبات المحددة لحالة الاستخدام. ونظرًا لأن هذه النماذج تعمل مباشرةً على الأجهزة مثل iPhone وiPad، فإن هناك عدة عوامل تؤثر على الخيار الأنسب.
فيما يلي بعض النقاط المهمة التي يجب أخذها في الاعتبار:
توفر نماذج الكشف عن الأجسام إمكانات متطورة في مجال الرؤية الحاسوبية لتطبيقات الهواتف الذكية. تعمل هذه النماذج مباشرةً على iOS ، مما يتيح للتطبيقات تحليل الصور ومقاطع الفيديو الملتقطة بكاميرا الجهاز في الوقت الفعلي. ومن خلال اختيار النموذج المناسب، يمكن للمطورين إنشاء تطبيقات هواتف ذكية سريعة الاستجابة تعتمد على الرؤية الحاسوبية وتقدم أداءً موثوقًا به في الوقت الفعلي.
انضم إلى مجتمعنا المتنامي واستكشف مستودع GitHub الخاص بنا للحصول على موارد عملية في مجال الذكاء الاصطناعي. لبدء البناء باستخدام الذكاء الاصطناعي البصري اليوم، استكشف خيارات الترخيص المتاحة لدينا. تعرف على كيفية قيام الذكاء الاصطناعي في مجال الزراعة بتحويل الزراعة وكيفية قيام الذكاء الاصطناعي البصري في مجال الروبوتات بتشكيل المستقبل من خلال زيارة صفحات الحلول الخاصة بنا.
ابدأ رحلتك مع مستقبل تعلم الآلة