Computer Vision (CV)
استكشف أساسيات رؤية الكمبيوتر (CV). تعلم كيف تتيح Ultralytics YOLO26 ومنصة Ultralytics الكشف عن الكائنات، والتقسيم، والمزيد.
رؤية الحاسوب (CV) هي مجال متطور من الذكاء الاصطناعي (AI) يُمكّن الحواسيب والأنظمة من استخلاص معلومات ذات مغزى من الصور الرقمية، ومقاطع الفيديو، وغيرها من المدخلات البصرية. في حين تتمتع الرؤية البشرية بالقدرة الفطرية على إدراك وفهم المحيط لحظياً، يجب تدريب الحواسيب على التعرف على الأنماط وتفسير البكسلات. ومن خلال الاستفادة من تعلم الآلة (ML) وتحديداً خوارزميات التعلم العميق (DL)، يمكن لأنظمة رؤية الحاسوب أخذ البيانات البصرية، ومعالجتها، وتقديم توصيات أو اتخاذ إجراءات بناءً على تلك المعلومات.
Link to this sectionكيف تعمل رؤية الحاسوب#
في جوهرها، يرى الحاسوب الصورة كمصفوفة من القيم الرقمية التي تمثل البكسلات. تعتمد رؤية الحاسوب الحديثة بشكل كبير على الشبكات العصبية التلافيفية (CNNs)، المصممة لمحاكاة نمط اتصال الخلايا العصبية في الدماغ البشري. تتعلم هذه الشبكات تحديد تسلسل هرمي للميزات - بدءاً من الحواف والأنسجة البسيطة وصولاً إلى الأشكال والأجسام المعقدة - من خلال عملية تُسمى استخراج الميزات.
لكي تعمل هذه النماذج بفعالية، فإنها تتطلب كميات هائلة من بيانات التدريب. على سبيل المثال، للتعرف على سيارة، يحتاج النموذج إلى معالجة آلاف الصور المصنفة للسيارات في ظروف مختلفة. تعمل أدوات مثل منصة Ultralytics على تبسيط سير العمل هذا، مما يسمح للمستخدمين بتصنيف مجموعات البيانات، وتدريب النماذج في السحابة، ونشرها بكفاءة.
Link to this sectionالمهام الأساسية في رؤية الحاسوب#
رؤية الحاسوب ليست وظيفة واحدة بل مجموعة من المهام المميزة، حيث تحل كل منها مشكلة محددة:
- تصنيف الصور: تُعين هذه المهمة تصنيفاً (تسمية) للصورة بأكملها، لتجيب على سؤال: "ماذا يوجد في هذه الصورة؟" (مثال: التمييز بين قطة وكلب).
- اكتشاف الأجسام: وبالانتقال خطوة أبعد، يحدد الاكتشاف أجساماً متميزة داخل الصورة ويرسم صندوق إحاطة حولها. وهذا أمر بالغ الأهمية لعد العناصر أو تحديد مواقع ميزات معينة.
- تجزئة الأنماط (Instance Segmentation): توفر هذه المهمة قناعاً دقيقاً على مستوى البكسل لكل جسم مكتشف، مما يفصل بين النسخ الفردية لنفس التصنيف. وهي ضرورية للتطبيقات التي تتطلب دقة عالية، مثل تحليل الصور الطبية.
- تقدير الوضعية (Pose Estimation): تتضمن هذه المهمة اكتشاف نقاط رئيسية محددة على جسم ما، مثل مفاصل جسم الإنسان، لتتبع الحركة ووضعية الجسد.
Link to this sectionتطبيقات العالم الحقيقي#
تمتد فائدة رؤية الحاسوب لتشمل كل قطاع صناعي تقريباً، حيث تقوم بأتمتة المهام التي كانت تتطلب سابقاً عيوناً بشرية.
- التصنيع ومراقبة الجودة: في البيئات الصناعية، غالباً ما يُشار إلى رؤية الحاسوب بـ رؤية الآلة. تُستخدم لأتمتة فحص الجودة، حيث تكتشف العيوب الدقيقة في المنتجات على خط التجميع بشكل أسرع وأكثر دقة من المفتشين البشر. على سبيل المثال، يسمح الذكاء الاصطناعي في التصنيع بمراقبة المعدات في الوقت الفعلي لمنع الأعطال.
- النقل الذاتي: تعتمد السيارات ذاتية القيادة بالكامل على رؤية الحاسوب للملاحة بأمان. ومن خلال معالجة المدخلات من الكاميرات ومستشعرات LiDAR، تقوم هذه المركبات بتنفيذ اكتشاف الأجسام ثلاثي الأبعاد للتعرف على المشاة، والمركبات الأخرى، وإشارات المرور في الوقت الفعلي. وهذا يعد مكوناً حاسماً لتحقيق مستويات عالية من أتمتة المركبات.
- الرعاية الصحية والتشخيص: يستخدم أخصائيو الأشعة رؤية الحاسوب للمساعدة في تحديد الشذوذ في صور الأشعة السينية، والرنين المغناطيسي، والأشعة المقطعية. يساعد الذكاء الاصطناعي في الرعاية الصحية في الكشف المبكر عن الأمراض، مثل تحديد الأورام، من خلال تسليط الضوء على مناطق الاهتمام التي قد تغفل عنها العين المجردة.
Link to this sectionرؤية الحاسوب مقابل معالجة الصور#
من المهم التمييز بين رؤية الحاسوب ومعالجة الصور، على الرغم من أنهما غالباً ما يعملان معاً.
- معالجة الصور تتضمن التلاعب بالصورة لتحسينها أو استخراج معلومات منها (مثال: ضبط السطوع، أو التباين، أو تطبيق مرشحات مثل تلك الموجودة في Adobe Photoshop). وعادةً ما يكون المخرج صورة أخرى.
- رؤية الحاسوب تأخذ صورة كمدخل وتُخرج معلومات أو تفسيراً (مثال: "يوجد ثلاثة أشخاص في هذه الغرفة"). تستخدم رؤية الحاسوب تقنيات معالجة الصور لإعداد الصور للتحليل بواسطة الشبكات العصبية.
Link to this sectionتنفيذ رؤية الحاسوب باستخدام Python#
جعلت المكتبات الحديثة تنفيذ نماذج رؤية حاسوب قوية أمراً متاحاً. يوضح المثال أدناه كيفية تحميل نموذج YOLO26 المتطور لاكتشاف الأجسام في صورة باستخدام حزمة ultralytics.
from ultralytics import YOLO
# Load the YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")
# Run inference on a standard example image
# The model identifies objects and their locations
results = model("https://ultralytics.com/images/bus.jpg")
# Display the resulting image with bounding boxes
results[0].show()يستخدم هذا البرنامج النصي البسيط نموذجاً مدرباً مسبقاً لتنفيذ مهام استنتاج معقدة، مما يبرهن على سهولة الوصول إلى أدوات الذكاء الاصطناعي الحديثة. بالنسبة للمطورين الذين يتطلعون إلى ما هو أبعد من الصور الثابتة، تعمل رؤية الحاسوب أيضاً على تشغيل فهم الفيديو وأنظمة التتبع في الوقت الفعلي المستخدمة في الأمن وتحليلات الرياضة. من خلال التكامل مع مكتبات مثل OpenCV، يمكن للمطورين بناء تطبيقات شاملة تلتقط العالم البصري، وتعالجه، وتحلله.






