تعرّف على كيفية تمكين YOLOE من العثور على الأجسام باستخدام موجه أو صورة بسيطة. يتيح لك رؤية حاسوبية أكثر ذكاءً وسرعة دون إعادة تدريب أو ضبط النماذج.
يُعد اكتشاف الأجسام مهمة أساسية في مجال الرؤية الحاسوبية، حيث يكون الهدف هو تحديد الأجسام في الصور أو مقاطع الفيديو وتحديد موقعها. وهو جزء أساسي من الرؤية الحاسوبية، وهو مجال من مجالات الذكاء الاصطناعي (AI) الذي يمكّن الآلات من فهم البيانات المرئية وتفسيرها. على سبيل المثال، يمكن أن يساعد اكتشاف الأجسام في تحديد سيارة في صورة أو تحديد موقع شخص في مقطع فيديو.
واحدة من أشهر سلاسل النماذج التي تدعم مهام الرؤية الحاسوبية مثل اكتشاف الأجسام هي سلسلة نماذج YOLO (أنت تنظر مرة واحدة فقط). صُممت نماذج YOLO من أجل السرعة والدقة، وقد تحسنت نماذج YOLO باستمرار بمرور الوقت. على سبيل المثال، أحد أحدث الإصدارات Ultralytics YOLO11أداءً جيدًا في مواقف العالم الحقيقي، حيث يقدم نتائج دقيقة حتى في البيئات الأكثر تعقيدًا.
ولتعزيز هذا التقدم، يهدف نموذج جديد يسمى YOLOE إلى توسيع قدرات نماذج YOLO . على عكس النماذج التقليدية التي تتطلب إعادة التدريب للتعرف على الأجسام الجديدة، يمكن لنموذج YOLOE أن يتبع نصاً بسيطاً أو صورة بسيطة لاكتشاف الأجسام التي لم يرها من قبل، مما يجعله أكثر قدرة على التكيف مع البيئات المتغيرة.
في هذه المقالة، سنلقي نظرة فاحصة على ما يجعل YOLOE فريدًا من نوعه، وكيف يمكن مقارنته بنماذج YOLO السابقة، وكيف يمكنك البدء في استخدامه اليوم. لنبدأ!
YOLOE هو نموذج للرؤية الحاسوبية يرتقي برصد الأجسام خطوة إلى الأمام. تم تقديمه في مارس 2025 من قبل باحثين في جامعة تسينغهوا. ما يميز YOLOE عن النماذج التقليدية هو استخدامه للكشف عن المفردات المفتوحة.
بينما يتم تدريب معظم النماذج على التعرّف على قائمة ثابتة من الأشياء، يسمح لك YOLOOE بتحديد ما تبحث عنه باستخدام وصف قصير أو مثال صورة. على سبيل المثال، إذا كنت تبحث عن "حقيبة ظهر خضراء"، يمكنك إما كتابة هذا الوصف أو عرض صورة للنموذج، وسيحدد YOLOE موقعها داخل المشهد.
بالإضافة إلى ذلك، حتى بدون أي موجه، يمكن لـ YOLOE اكتشاف العديد من الأشياء اليومية من تلقاء نفسه. تُسمى هذه القدرة على التعرف على الأشياء التي لم يسبق له رؤيتها من قبل اكتشاف اللقطة الصفرية. وهي مفيدة بشكل خاص في البيئات الديناميكية التي قد تتغير فيها المهمة أو الأشياء ذات الأهمية بشكل غير متوقع.
يدعم YOLOE مجموعة واسعة من الميزات المصممة لتحسين أدائه في التطبيقات الواقعية. وبفضل قدرته على التعامل مع كل من المدخلات المنظمة وغير المنظمة، يفتح YOLOE إمكانيات جديدة لاكتشاف الكائنات وتجزئتها.
فيما يلي بعض الميزات الرئيسية التي يقدمها النموذج:
والآن بعد أن أصبح لدينا فهم أفضل لماهية YOLOE، دعنا نلقي نظرة على بعض النماذج في عائلة YOLO التي تتشابه مع YOLO .
مع تقدم رؤية الكمبيوتر، تطورت نماذج YOLO أيضاً. على سبيل المثال Ultralytics YOLOv8 دعمًا لمهام جديدة مثل التجزئة والتصنيف، بينما ركزت الإصدارات اللاحقة، مثل Ultralytics YOLO11 على تحسين الدقة والأداء لمجموعة واسعة من المهام.
بالإضافة إلى ذلك، تم إصدار YOLO في يناير 2024 وقدّم إمكانية استخدام المطالبات المكتوبة، مما يتيح للمستخدمين وصف الأشياء التي يريدون العثور عليها. على الرغم من أن YOLO كان خيارًا رائعًا لاكتشاف اللقطة الصفرية، إلا أنه كان يفتقر إلى ميزات مثل تجزئة المثيل ودعم المطالبات المرئية.
يعتمد YOLOE على YOLO من خلال إضافة هذه الإمكانيات، وتحسين المرونة والأداء، وتقديم أداة أكثر تأثيرًا لتطبيقات الرؤية الحاسوبية الواقعية.
سواءً كنت ترغب في اكتشاف كائنات معينة أو استكشاف كل شيء في الصورة، فإن بدء استخدام YOLOE بسيط. هذا النموذج مدعوم من حزمة Ultralytics Python مما يجعل من السهل دمجه في مشاريعك. بعد ذلك، دعنا نتعرف على كيفية استخدامه.
الخطوة الأولى هي تثبيت حزمةUltralytics Python باستخدام مدير حزم مثل "pip". يمكنك القيام بذلك عن طريق تشغيل الأمر "pip install ultralytics" في جهازك الطرفي أو موجه الأوامر.
بمجرد تثبيت الحزمة، سيكون لديك كل ما تحتاجه لتحميل النموذج، وإجراء التنبؤات، وتجربة أوضاع الكشف المختلفة. إذا واجهت أي مشاكل أثناء التثبيت، فإن وثائق Ultralytics الرسمية تقدم قسمًا مفيدًا لاستكشاف الأخطاء وإصلاحها.
هناك عدة طرق مختلفة لاستخدام YOLOE لتشغيل التنبؤات. يعني تشغيل التنبؤات استخدام النموذج المُدرَّب لتحديد وتحديد موقع الكائنات داخل الصور أو مقاطع الفيديو. تتيح لك هذه الطرق المختلفة تخصيص كيفية تفاعلك مع النموذج بناءً على احتياجاتك الخاصة.
لنناقش كل طريقة من هذه الطرق، واحدة تلو الأخرى.
يستطيع YOLOE اكتشاف الأجسام بناءً على وصف نصي قصير. على سبيل المثال، إذا كنت تبحث عن حصان متحرك، يمكنك استخدام مطالبة مثل "حصان يمشي".
للبدء، قم أولًا بتحميل نموذج YOLOE المُدرَّب مسبقًا وقم بتعيين المطالبة (وصف ما تريد أن يبحث عنه النموذج) كما هو موضح في مقتطف الكود أدناه.
from ultralytics import YOLOE
model = YOLOE("yoloe-11l-seg.pt")
prompt = ["horse walking"]
model.set_classes(prompt, model.get_text_pe(prompt))
بمجرد تعيين النموذج والموجه الخاص بك، يمكنك تشغيل النموذج على صورة أو فيديو. استبدل مسار الملف في الكود بمسار ملف الصورة أو الفيديو:
results = model.predict("path/to/your/image.jpg")
results[0].show()
سيعرض هذا الصورة مع الكائن المكتشف محددًا بوضوح بناءً على مطالبتك. يمكنك تغيير المطالبة للبحث عن كائنات مختلفة، مثل "حقيبة حمراء" أو "دراجة" أو "حمار وحشي"، اعتمادًا على ما تبحث عنه.
وبالمثل، يمكنك استخدام صورة لمطالبة YOLOE باستخدام حزمة Ultralytics Python . في وضع المطالبة المرئية، يستخدم النموذج الصورة للعثور على عناصر متشابهة المظهر في مشهد آخر. هذا مفيد بشكل خاص للأشياء التي يصعب وصفها أو تفتقر إلى تسميات واضحة.
لاستكشاف الكود الخاص بذلك بمزيد من التفصيل، يمكنك الاطلاع على وثائقUltralytics .
في بعض الحالات، قد لا تعرف ما الذي تبحث عنه بالضبط، أو قد لا تبحث عن كائن معين. وهنا يأتي دور الوضع الخالي من المطالبات.
باستخدام هذا الخيار، لا تحتاج إلى كتابة وصف أو تقديم مثال للصورة. يقوم YOLOE ببساطة بتحليل الصور من تلقاء نفسه ويكتشف كل ما يمكنه التعرف عليه، مثل الأشخاص أو الحيوانات أو الأثاث أو الأشياء اليومية.
إنها طريقة مفيدة لاستكشاف مشهد ما دون إعطاء النموذج أي تعليمات محددة. سواء أكنت تفحص غرفة مزدحمة أو تستعرض لقطات بها الكثير من النشاط، يمنحك الوضع الخالي من المطالبات نظرة سريعة على ما هو موجود في الصورة.
يمكنك استخدام التعليمات البرمجية التالية لتشغيل YOLOE في الوضع الخالي من المطالبات. أولاً، يتم تحميل النموذج، ثم يعالج الصورة ويكتشف الكائنات الموجودة فيها تلقائيًا. أخيرًا، يتم عرض النتائج، ويتم تمييز الأجسام المكتشفة.
تأكد من استبدال مسار الملف بالمسار الفعلي لصورتك.
from ultralytics import YOLOE
model = YOLOE("yoloe-11l-seg-pf.pt")
results = model.predict("path/to/image.jpg")
results[0].show()
الصورة الموضّحة أدناه هي مثال على ما يمكن لـ YOLOE اكتشافه في الوضع الخالي من المطالبات.
تجعل قدرة YOLOE على الاستجابة لكل من المطالبات النصية والصور أداة موثوقة للتطبيقات في الوقت الفعلي. تُعد مرونته مفيدة بشكل خاص في البيئات سريعة الوتيرة حيث يكون التوقيت والدقة ضروريين.
دعنا نستكشف بعض الأمثلة الواقعية لكيفية استخدام YOLOE.
في المطارات المزدحمة، قد يكون تحديد موقع أمتعة معينة أمراً صعباً، خاصةً عند التعامل مع الحقائب المفقودة. يمكن لـ YOLOE تبسيط هذه العملية من خلال المساعدة في مسح مقاطع الفيديو المباشرة وتحديد العناصر بسرعة بناءً على مطالبات بسيطة مثل "حقيبة حمراء".
إذا كانت الحقيبة مفقودة أو في غير مكانها، يمكن للموظفين تغيير المطالبة بسهولة للبحث عن عنصر مختلف، مثل "حقيبة سوداء". يمكن لهذه القدرة على التكيف الفوري أن تساعد موظفي المطار على تحديد موقع الأمتعة الصحيحة بسرعة دون مراجعة ساعات طويلة من اللقطات أو إعادة تدريب النموذج، مما يجعل التعامل مع الأمتعة وحل مشكلات الأمتعة المفقودة أسرع وأكثر كفاءة.
غالبًا ما تتضمن لقطات المراقبة للأماكن العامة، مثل الأسواق والمقاهي المزدحمة، مزيجًا من الأشخاص والأشياء والأنشطة التي تتغير على مدار اليوم. يمكن ل YOLOE تحليل هذه اللقطات في الوقت الفعلي باستخدام الوضع الخالي من المطالبات، حيث يكتشف تلقائيًا عناصر مثل الحقائب أو الطاولات أو الدراجات دون الحاجة إلى تعليمات محددة.
وهذا مفيد بشكل خاص لفرق الأمن لاكتشاف الأشياء غير المراقبة أو تتبع حركة الحشود. تسهّل قدرة YOLOE على اكتشاف العديد من الأشياء في وقت واحد إدارة الأماكن العامة أثناء الفعاليات أو الفترات المزدحمة، مما يساعد الفرق على البقاء على اطلاع واستجابة.
فيما يلي بعض الفوائد الرئيسية لاستخدام YOLOE في تطبيقات الرؤية الحاسوبية:
ومع ذلك، هناك بعض القيود التي يجب وضعها في الاعتبار عند استخدام YOLOE. فيما يلي بعض العوامل التي يجب أخذها في الاعتبار:
يُضفي YOLOE مزيدًا من المرونة على الرؤية الحاسوبية من خلال السماح للمستخدمين بتوجيه الاكتشاف باستخدام النص أو مطالبات الصورة. وهو يعمل بشكل جيد في مواقف العالم الحقيقي حيث تتغير المشاهد بسرعة، ولا تكون إعادة التدريب خيارًا متاحًا.
من مناولة الأمتعة إلى مراقبة الأماكن العامة، تتكيف YOLOE مع المهام الجديدة بسهولة. مع زيادة إمكانية الوصول إلى الذكاء الاصطناعي، تساعد نماذج مثل YOLOE المزيد من الصناعات على استخدام تكنولوجيا الرؤية بطرق عملية وفعالة.
انضم إلى مجتمعنا واستكشف مستودع GitHub الخاص بنا لمعرفة المزيد عن ابتكارات الذكاء الاصطناعي. اكتشف أحدث التطورات في مجالات مثل الذكاء الاصطناعي في مجال البيع بالتجزئة والرؤية الحاسوبية في مجال الرعاية الصحية على صفحات الحلول الخاصة بنا. اطّلع على خيارات الترخيص لدينا وابدأ في استخدام الرؤية الحاسوبية اليوم!