تعرّف على كيفية إنشاء تطبيقات طائرات بدون طيار مدعومة بالذكاء الاصطناعي باستخدام Ultralytics YOLO11 مما يتيح اكتشاف الأجسام في الوقت الفعلي ومهام الرؤية الحاسوبية القائمة على الطائرات بدون طيار.
قد يبدو التسوق داخل المتجر والتسوق عبر الإنترنت متشابهين، لكنهما يعتمدان على لوجستيات مختلفة. فالمتاجر تحتاج إلى إعادة تخزين الأرفف، بينما تعتمد الطلبات عبر الإنترنت على توصيل الطلبات إلى باب المنزل. وبفضل التطورات التكنولوجية، يتم إعادة تشكيل تجربتي التسوق بالتوازي معًا.
على سبيل المثال، يحدث تحول كبير في عمليات التسليم. فالطائرات بدون طيار التي تعمل بالذكاء الاصطناعي تعمل على تغيير كيفية وصول المنتجات إلى منازلنا. من المتوقع أن تتعامل هذه الطائرات الذكية بدون طيار مع حوالي 808 مليون عملية تسليم في العقد المقبل، مما يحول السماء إلى أحدث طريق توصيل للتجارة اليومية.
تستخدم طائرات التوصيل بدون طيار الذكاء الاصطناعي (AI) والرؤية الحاسوبية، وهو مجال فرعي من الذكاء الاصطناعي يُستخدم لتحليل البيانات المرئية، للتنقل والمناورة حول العقبات. نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11 يمكن أن تساعد الطائرات بدون طيار على اكتشاف الأجسام وتتبعها في الوقت الفعلي، مما يسمح لها بفهم بيئتها والتفاعل معها بشكل أفضل.
تعمل شركات مثل Meituan وDJI بالفعل على دمج الرؤية الحاسوبية في طائراتها بدون طيار. في الواقع، أدى الاعتماد السريع على الطائرات بدون طيار في مختلف الصناعات إلى ارتفاع سوق الطائرات بدون طيار القائمة على الذكاء الاصطناعي إلى 206.9 مليار دولار بحلول عام 2031.
في هذه المقالة، سنلقي نظرة فاحصة على كيفية استخدام نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11 في التطبيقات القائمة على الطائرات بدون طيار مثل عمليات التسليم بالطائرات بدون طيار. سنستعرض مثالاً يوضح كيف يمكن تطوير هذه التقنيات واختبارها قبل استخدامها في سيناريوهات العالم الحقيقي.
يتمثل أحد الأجزاء الرئيسية لطائرات التوصيل بدون طيار في قدرتها على اكتشاف المنازل أثناء تنقلها. لإعادة إنشاء هذه القدرة وفهم كيفية عملها، سنقوم بتدريب نموذج رؤية حاسوبية يمكنه تحديد المنازل في اللقطات التي تلتقطها طائرة بدون طيار. سنقوم بتدريب YOLO11 خصيصاً لهذا الغرض، والذي يتضمن ضبط نموذج YOLO11 المدرب مسبقاً للتعرف على المنازل واكتشافها باستخدام أمثلة مصنفة.
للقيام بذلك، سنحتاج إلى بيانات فيديو عالية الجودة من طائرة بدون طيار. ومن المثير للاهتمام، حتى بدون الوصول إلى طائرة بدون طيار حقيقية، لا يزال بإمكاننا إنشاء لقطات جوية واقعية. دعونا نلقي نظرة على كيفية ذلك.
Google Earth Studio عبارة عن أداة رسوم متحركة على الويب يمكن للمستخدمين استخدامها لإنشاء محتوى ثابت ومتحرك باستخدام صور الأقمار الصناعية والصور ثلاثية الأبعاد من Google Earth. يمكننا استخدامه لإنشاء لقطات جوية واقعية.
الخطوة الأولى هي فتح Google Earth Studio وإنشاء مشروع، كما هو موضح أدناه.
ستحتاج إلى حساب Google لتسجيل الدخول.
بمجرد تسجيل الدخول، يمكنك اختيار موقع لفيديو الطائرة بدون طيار الاصطناعية. باستخدام شريط البحث في الزاوية العلوية اليسرى من الصفحة، يمكنك البحث عن المواقع. بالنسبة لهذا البرنامج التعليمي، سنختار كندا. أيضًا، نظرًا لأننا سنقوم بتدريب نموذج لاكتشاف المنازل، يجب أن يحتوي فيديو الطائرة بدون طيار على منظر جوي للمنازل.
بعد ذلك، يمكننا تعيين الإطارين الزمنيين الأول والأخير لالتقاط حركة لقطة الطائرة بدون طيار الاصطناعية. بمجرد اختيار موقع بداية لقطة الطائرة بدون طيار، اضبط الإطار الأول باستخدام الماسات الزرقاء، كما هو موضح أدناه.
بعد ذلك، يمكننا اختيار الإطار الأخير لتحديد وجهة الطائرة بدون طيار. سيساعدنا ذلك في إنشاء تأثير متحرك للقطات الطائرة بدون طيار. للقيام بذلك، حرك الشريط (المظلل أدناه) إلى اليمين إلى وقت محدد من أجل إنشاء التأثير المتحرك للقطات الطائرة بدون طيار. مرة أخرى، استخدم الماسات الزرقاء لتعيين النقطة الأخيرة.
أخيراً، يمكنك حفظ هذا المشروع وعرضه بالنقر على الزر الأحمر "تقديم" في الزاوية العلوية اليمنى من الصفحة. سيمنحك هذا إخراج الفيديو النهائي للقطات الطائرة بدون طيار، مما يؤدي إلى إنشاء لقطات فيديو اصطناعية لطائرة بدون طيار بنجاح.
الآن بعد أن أنشأنا لقطات فيديو اصطناعية لطائرة بدون طيار، فإن الخطوة التالية هي تسمية المنازل الموجودة فيه أو وضع تعليقات توضيحية عليها. سنحتاج أيضًا إلى فصل الإطارات الفردية للفيديو.
للبدء في ذلك، سنقوم بتثبيت LabelImg. LabelImg هي أداة مفتوحة المصدر لتوسيم الصور. يمكنك تثبيتها مباشرةً من الطرفية باستخدام أداة تثبيت الحزمة pip عن طريق تشغيل الأمر التالي: "pip install labelImg".
بعد التثبيت، يمكنك تشغيل الأداة باستخدام الأمر 'labelImg' على جهازك الطرفي أو موجه الأوامر. سينقلك هذا إلى الصفحة الموضحة أدناه.
وفي الوقت نفسه، يمكننا إما استخدام محول فيديو إلى صورة عبر الإنترنت أو أداة تسمى FFmpeg لتقسيم الفيديو إلى إطارات. FFFmpeg عبارة عن مجموعة من المكتبات والأدوات لمعالجة محتوى الوسائط المتعددة مثل الصوت والفيديو والترجمة والبيانات الوصفية ذات الصلة.
يمكنك استخدام الأمر الطرفي التالي لفصل كل إطار من لقطات فيديو الطائرة بدون طيار:
ffmpeg -i input_video.mp4 -vf fps=1 frame_%04d.jpg
بمجرد أن نفصل إطارات لقطات الطائرة بدون طيار، يمكننا البدء في تسمية الأجسام (المنازل) الموجودة فيها. من خلال التنقل إلى مجلد الصور من خلال أداة LabelImg، يمكننا تسمية الكائنات في كل صورة. تأكد من حفظ كل صورة مصنفة والتحقق منها. بعد وضع التعليقات التوضيحية على الصور، يمكننا الآن الانتقال إلى تدريب YOLO11 باستخدام هذه البيانات.
قبل أن نبدأ تدريب YOLO11 سننظم صورنا وتسمياتنا. ابدأ بإنشاء مجلدين: أحدهما باسم "تدريب" والآخر "صالح". قسّم صورك بين هذين المجلدين. داخل كلٍ منهما، قم بإنشاء مجلدات فرعية منفصلة للصور وملفات التسمية المقابلة لها (بتنسيق نصي)، كما هو موضح أدناه.
بعد ذلك، يمكننا البدء في تدريب نموذج YOLO11 على النحو التالي:
from ultralytics import YOLO
# Load a YOLO11 model
model = YOLO("yolo11n.pt") # choose your model, e.g., YOLO11 nano
# Train the model with your data and settings
model.train(data="data.yaml", epochs=100, imgsz=640)
يمكن الآن استخدام نموذج YOLO11 المُدرَّب لإجراء تنبؤات من خلال عملية تُسمى الاستدلال. تتضمن عملية الاستدلال استخدام نموذج لتحليل البيانات الجديدة غير المرئية بناءً على ما تعلّمه أثناء التدريب. في هذه الحالة، يمكن استخدام النموذج للعثور على كائنات محددة، مثل المنازل، في الصور أو مقاطع الفيديو وتسميتها من خلال رسم مربعات محددة حولها.
لتشغيل تنبؤ، يمكنك استخدام نموذج YOLO11 المُدرَّب على فيديو مُدخَل باستخدام شيفرة Python التالية. في هذا المثال، سنستخدم في هذا المثال نفس فيديو الطائرة بدون طيار الاصطناعي الذي تم استخدامه للتدريب، ولكن يمكنك استخدام أي ملف فيديو آخر إذا كنت تفضل ذلك.
# Import library
from ultralytics import YOLO
# Load the YOLO model
model = YOLO("best.pt") # Choose your custom-trained model
# Predict the results from the model
results = model.predict(source="path/to/original/video.mp4", show=True, save=True)
بعد تشغيل هذا الرمز، سيتم حفظ ملف الفيديو الناتج مع التنبؤات والمربعات المحدودة.
إن اكتشاف المنازل لتوصيل الطرود بالطائرات بدون طيار هو مجرد مثال واحد فقط على كيفية تطبيق رؤية الكمبيوتر و YOLO11 . فيما يلي بعض الاستخدامات الواقعية الأخرى للرؤية الحاسوبية و YOLO11 والطائرات بدون طيار:
تُغيّر الطائرات بدون طيار المدعومة بالذكاء الاصطناعي التي تعمل بالكمبيوتر العديد من الصناعات، من توصيل الطرود إلى المساعدة في حالات الطوارئ والزراعة. في هذا الدليل، استعرضنا في هذا الدليل كيفية إنشاء فيديو لطائرة اصطناعية بدون طيار، وتسمية الأجسام الموجودة فيه، وتدريب YOLO11 واستخدامه للكشف عن المنازل.
إن تطبيق اكتشاف الأجسام على لقطات الطائرات بدون طيار يجعل هذه الطائرات أكثر ذكاءً، مما يسمح لها بالتعرف على الأجسام وتتبعها تلقائياً في الوقت الحقيقي. مع تحسن التكنولوجيا، من المرجح أن تلعب الطائرات بدون طيار التي تعتمد على الذكاء الاصطناعي دوراً أكبر في توصيل الطلبات بشكل أسرع، وتحسين الأمن، والمساعدة في الاستجابة للكوارث.
انضم إلى مجتمعنا واستكشف مستودع GitHub الخاص بنا لمعرفة المزيد عن الذكاء الاصطناعي في مجال الرؤية الحاسوبية وتحقق من خيارات الترخيص لدينا لبدء مشاريع الرؤية الحاسوبية الخاصة بك. هل أنت مهتم بالابتكارات مثل الذكاء الاصطناعي في التصنيع أو الرؤية الحاسوبية في صناعة السيارات؟ تفضل بزيارة صفحات الحلول الخاصة بنا لاكتشاف المزيد.