تعرف على كيف يتيح لك YOLOE العثور على الكائنات باستخدام مطالبة بسيطة أو صورة. فهو يتيح رؤية حاسوب أذكى وأسرع دون إعادة تدريب النماذج أو ضبطها بدقة.
تعرف على كيف يتيح لك YOLOE العثور على الكائنات باستخدام مطالبة بسيطة أو صورة. فهو يتيح رؤية حاسوب أذكى وأسرع دون إعادة تدريب النماذج أو ضبطها بدقة.
اكتشاف الأجسام هو مهمة رئيسية في رؤية الحاسوب، حيث الهدف هو تحديد وتحديد مواقع الأجسام في الصور أو مقاطع الفيديو. إنه جزء أساسي من رؤية الحاسوب، وهو مجال من مجالات الذكاء الاصطناعي (AI) الذي يمكّن الآلات من فهم وتفسير البيانات المرئية. على سبيل المثال، يمكن أن يساعد اكتشاف الأجسام في تحديد سيارة في صورة أو اكتشاف شخص في بث فيديو.
إحدى السلاسل الأكثر شهرة من النماذج التي تدعم مهام رؤية الكمبيوتر مثل الكشف عن الكائنات هي سلسلة نماذج YOLO (أنت تنظر مرة واحدة فقط). تم تصميم نماذج YOLO للسرعة والدقة، وقد تحسنت باستمرار بمرور الوقت. على سبيل المثال، أحد أحدث الإصدارات، Ultralytics YOLO11، يعمل بشكل جيد في المواقف الواقعية، مما يوفر نتائج دقيقة حتى في البيئات الأكثر تعقيدًا.
للمضي قدمًا بهذا التقدم، يهدف نموذج جديد يسمى YOLOE إلى توسيع قدرات نماذج YOLO. على عكس النماذج التقليدية التي تتطلب إعادة التدريب للتعرف على كائنات جديدة، يمكن لـ YOLOE اتباع مطالبات نصية أو صور بسيطة لاكتشاف الكائنات التي لم يرها من قبل، مما يجعلها أكثر قابلية للتكيف مع البيئات المتغيرة.
في هذه المقالة، سنلقي نظرة فاحصة على ما الذي يجعل YOLOE فريدًا، وكيف تتم مقارنته بنماذج YOLO السابقة، وكيف يمكنك البدء في استخدامه اليوم. هيا بنا نبدأ!
YOLOE هو نموذج رؤية حاسوبية يأخذ الكشف عن الكائنات خطوة إلى الأمام. تم تقديمه في مارس 2025 من قبل باحثين في جامعة تسينغهوا. ما يميز YOLOE عن النماذج التقليدية هو استخدامه للكشف عن المفردات المفتوحة.
في حين يتم تدريب معظم النماذج على التعرف على قائمة ثابتة من الكائنات، يسمح لك YOLOE بتحديد ما تبحث عنه باستخدام وصف قصير أو صورة مثال. على سبيل المثال، إذا كنت تبحث عن “حقيبة ظهر خضراء”، فيمكنك إما كتابة هذا الوصف أو عرض صورة للنموذج، وسيقوم YOLOE بتحديد موقعها داخل المشهد.
بالإضافة إلى ذلك، حتى بدون أي مطالبة، يمكن لـ YOLOE اكتشاف العديد من الأشياء اليومية بمفرده. تسمى هذه القدرة على التعرف على الأشياء التي لم يرها من قبل اكتشاف الصفر (zero-shot detection). إنه مفيد بشكل خاص في البيئات الديناميكية حيث قد تتغير المهمة أو الأشياء موضع الاهتمام بشكل غير متوقع.

يدعم YOLOE مجموعة واسعة من الميزات المصممة لتحسين أدائه في التطبيقات الواقعية. وبفضل قدرته على التعامل مع كل من المدخلات المنظمة وغير المنظمة، يفتح YOLOE إمكانيات جديدة لاكتشاف الكائنات وتجزئتها.
فيما يلي بعض الميزات الرئيسية التي يقدمها النموذج:
الآن بعد أن أصبح لدينا فهم أفضل لما هو YOLOE، دعنا نلقي نظرة على بعض النماذج في عائلة YOLO المماثلة.
مع تقدم الرؤية الحاسوبية، تطورت أيضًا نماذج YOLO. على سبيل المثال، Ultralytics YOLOv8 جلبت دعمًا لمهام جديدة مثل التجزئة والتصنيف، بينما ركزت الإصدارات اللاحقة، مثل Ultralytics YOLO11، على تحسين الدقة والأداء لمجموعة واسعة من المهام.
أيضًا، تم إصدار YOLO-World في يناير 2024 وقدم القدرة على استخدام مطالبات مكتوبة، مما يتيح للمستخدمين وصف الكائنات التي يريدون العثور عليها. في حين أن YOLO-World كان خيارًا رائعًا للكشف بدون تدريب مسبق (zero-shot detection)، إلا أنه كان يفتقر إلى ميزات مثل تجزئة المثيلات (instance segmentation) ودعم المطالبات المرئية.
يعتمد YOLOE على YOLO-World بإضافة هذه القدرات، وتحسين المرونة والأداء، وتقديم أداة أكثر تأثيرًا لتطبيقات الرؤية الحاسوبية الواقعية.

سواء كنت ترغب في اكتشاف كائنات معينة أو استكشاف كل شيء في صورة ما، فإن البدء بـ YOLOE أمر بسيط. هذه النموذج مدعوم بحزمة Ultralytics Python، مما يجعله سهل الاندماج في مشاريعك. بعد ذلك، دعنا ننتقل إلى كيفية استخدامه.
تتمثل الخطوة الأولى في تثبيت حزمة Ultralytics Python باستخدام مدير الحزم مثل ‘pip.’ يمكنك القيام بذلك عن طريق تشغيل الأمر “pip install ultralytics” في جهازك الطرفي أو موجه الأوامر.
بمجرد تثبيت الحزمة، سيكون لديك كل ما تحتاجه لتحميل النموذج وإجراء التنبؤات وتجربة أوضاع الكشف المختلفة. إذا واجهت أي مشكلات أثناء التثبيت، فستقدم وثائق Ultralytics الرسمية قسمًا مفيدًا لاستكشاف الأخطاء وإصلاحها.
هناك عدة طرق مختلفة لاستخدام YOLOE لتشغيل التنبؤات. يعني تشغيل التنبؤات استخدام النموذج المدرب لتحديد وتحديد مواقع الكائنات داخل الصور أو مقاطع الفيديو. تتيح لك هذه الطرق المختلفة تخصيص كيفية التفاعل مع النموذج بناءً على احتياجاتك الخاصة.
دعنا نناقش كل طريقة من هذه الطرق، واحدة تلو الأخرى.
يمكن لـ YOLOE اكتشاف الكائنات بناءً على وصف نصي قصير. على سبيل المثال، إذا كنت تبحث عن حصان يتحرك، فيمكنك استخدام مطالبة مثل "حصان يمشي".
للبدء، قم أولاً بتحميل نموذج YOLOE المدرب مسبقًا، وعيّن مطالبتك (وصف ما تريد أن يبحث عنه النموذج) كما هو موضح في مقتطف الشفرة أدناه.
from ultralytics import YOLOE
model = YOLOE("yoloe-11l-seg.pt")
prompt = ["horse walking"]
model.set_classes(prompt, model.get_text_pe(prompt))بمجرد تعيين النموذج والمطالبة، يمكنك تشغيل النموذج على صورة أو مقطع فيديو. استبدل مسار الملف في التعليمات البرمجية بمسار ملف الصورة أو الفيديو الخاص بك:
results = model.predict("path/to/your/image.jpg")
results[0].show()سيؤدي هذا إلى عرض الصورة مع الكائن الذي تم اكتشافه بوضوح بناءً على مطالبتك. يمكنك تغيير المطالبة للبحث عن كائنات مختلفة، مثل "حقيبة حمراء" أو "دراجة هوائية" أو "حمار وحشي"، اعتمادًا على ما تبحث عنه.

وبالمثل، يمكنك استخدام صورة لمطالبة YOLOE بحزمة Ultralytics Python. في وضع المطالبة المرئية، يستخدم النموذج الصورة للعثور على عناصر ذات مظهر مشابه في مشهد آخر. هذا مفيد بشكل خاص للكائنات التي يصعب وصفها أو تفتقر إلى تسميات واضحة.
لاستكشاف الكود الخاص بذلك بمزيد من التفصيل، يمكنك الاطلاع على وثائق Ultralytics.
في بعض الحالات، قد لا تعرف بالضبط ما الذي تبحث عنه، أو قد لا تبحث عن كائن معين. هذا هو المكان الذي يكون فيه الوضع الخالي من المطالبات مفيدًا.
باستخدام هذا الخيار، لا تحتاج إلى كتابة وصف أو تقديم صورة مثال. يقوم YOLOE ببساطة بتحليل الصور بمفرده و يكتشف كل ما يمكنه التعرف عليه، مثل الأشخاص أو الحيوانات أو الأثاث أو الأشياء اليومية.
إنها طريقة مفيدة لاستكشاف مشهد دون إعطاء النموذج أي تعليمات محددة. سواء كنت تقوم بمسح غرفة مزدحمة أو مراجعة لقطات بها الكثير من النشاط، فإن الوضع الخالي من المطالبات يمنحك نظرة سريعة على ما هو موجود في الصورة.
يمكنك استخدام الكود التالي لتشغيل YOLOE في وضع عدم المطالبة. أولاً، يتم تحميل النموذج، ثم يعالج الصورة ويكتشف الكائنات الموجودة فيها تلقائيًا. أخيرًا، يتم عرض النتائج، ويتم تمييز الكائنات المكتشفة.
تأكد من استبدال مسار الملف بالمسار الفعلي لصورتك.
from ultralytics import YOLOE
model = YOLOE("yoloe-11l-seg-pf.pt")
results = model.predict("path/to/image.jpg")
results[0].show()الصورة الموضحة أدناه هي مثال لما يمكن أن يكتشفه YOLOE في الوضع الخالي من المطالبات.

إن قدرة YOLOE على الاستجابة للمطالبات النصية والصورية تجعله أداة موثوقة للتطبيقات في الوقت الفعلي. تعتبر مرونته مفيدة بشكل خاص في البيئات سريعة الخطى حيث يكون التوقيت والدقة ضروريين.
دعنا نستكشف بعض الأمثلة الواقعية لكيفية استخدام YOLOE.
في المطارات المزدحمة، قد يكون تحديد موقع أمتعة معينة أمرًا صعبًا، خاصة عند التعامل مع الحقائب المفقودة. يمكن لـ YOLOE تبسيط هذه العملية من خلال المساعدة في فحص مقاطع الفيديو الحية وتحديد العناصر بسرعة بناءً على مطالبات بسيطة مثل "حقيبة حمراء".
إذا كانت الحقيبة مفقودة أو في غير مكانها، يمكن للموظفين بسهولة تغيير الأمر للبحث عن عنصر مختلف، مثل "حقيبة سوداء". يمكن أن تساعد هذه القدرة على التكيف الفوري موظفي المطار في تحديد موقع الأمتعة المناسبة بسرعة دون مراجعة ساعات طويلة من اللقطات أو إعادة تدريب النموذج، مما يجعل مناولة الأمتعة وحل مشكلات الأمتعة المفقودة أسرع وأكثر كفاءة.
غالبًا ما تتضمن لقطات المراقبة للأماكن العامة، مثل الأسواق والمقاهي المزدحمة، مزيجًا من الأشخاص والأشياء والأنشطة التي تتغير على مدار اليوم. يمكن لـ YOLOE تحليل هذه اللقطات في الوقت الفعلي باستخدام وضع عدم الحاجة إلى مطالبات، واكتشاف العناصر تلقائيًا مثل الحقائب أو الطاولات أو الدراجات دون الحاجة إلى تعليمات محددة.

هذا مفيد بشكل خاص لفرق الأمن لاكتشاف العناصر غير المراقبة أو تتبع حركة الحشود. إن قدرة YOLOE على اكتشاف كائنات متعددة في وقت واحد تجعل من السهل إدارة الأماكن العامة خلال الأحداث أو الفترات المزدحمة، مما يساعد الفرق على البقاء على اطلاع واستجابة.
فيما يلي بعض الفوائد الرئيسية لاستخدام YOLOE لتطبيقات رؤية الكمبيوتر:
مع ذلك، هناك بعض القيود التي يجب وضعها في الاعتبار عند استخدام YOLOE. فيما يلي بعض العوامل التي يجب مراعاتها:
يوفر YOLOE مزيدًا من المرونة للرؤية الحاسوبية من خلال السماح للمستخدمين بتوجيه الكشف باستخدام مطالبات نصية أو صور. إنه يعمل بشكل جيد في المواقف الواقعية حيث تتغير المشاهد بسرعة، وإعادة التدريب ليست خيارًا.
من معالجة الأمتعة إلى مراقبة الأماكن العامة، يتكيف YOLOE مع المهام الجديدة بسهولة. مع تزايد إمكانية الوصول إلى الذكاء الاصطناعي، تساعد نماذج مثل YOLOE المزيد من الصناعات على استخدام تكنولوجيا الرؤية بطرق عملية وفعالة.
انضم إلى مجتمعنا واستكشف مستودع GitHub الخاص بنا لمعرفة المزيد حول ابتكارات الذكاء الاصطناعي. اكتشف أحدث التطورات في مجالات مثل الذكاء الاصطناعي في البيع بالتجزئة و الرؤية الحاسوبية في الرعاية الصحية في صفحات الحلول الخاصة بنا. تحقق من خيارات الترخيص الخاصة بنا وابدأ في استخدام الرؤية الحاسوبية اليوم!