مسرد المصطلحات

الرؤية الحاسوبية (CV)

أطلق العنان لإمكانات الذكاء الاصطناعي مع الرؤية الحاسوبية! استكشف دورها في اكتشاف الأجسام والرعاية الصحية والسيارات ذاتية القيادة وغيرها. تعرّف على المزيد الآن!

الرؤية الحاسوبية (CV) هو مجال من مجالات الذكاء الاصطناعي (AI) الذي يدرب أجهزة الكمبيوتر على تفسير وفهم العالم المرئي. وباستخدام الصور الرقمية من الكاميرات ومقاطع الفيديو ونماذج التعلم العميق، يمكن للآلات تحديد وتصنيف الأشياء بدقة ومن ثم التفاعل مع ما "تراه". والهدف هو تمكين أجهزة الكمبيوتر من محاكاة الرؤية البشرية، وهي مهمة تنطوي على معالجة وتحليل كميات هائلة من البيانات المرئية لفهمها. وقد نما هذا المجال بسرعة بفضل التقدم في مجال التعلم العميق وتوافر مجموعات البيانات الكبيرة.

كيف تعمل الرؤية الحاسوبية

تعمل الرؤية الحاسوبية من خلال تطبيق خوارزميات التعلم الآلي (ML) على البيانات المرئية. فبدلاً من برمجتها بشكل صريح للتعرف على كائن ما، يتعلم نموذج السيرة الذاتية التعرف على الأنماط من آلاف أو ملايين الصور المصنفة. على سبيل المثال، لتدريب نموذج ما على التعرف على القطط، يتم تغذيته بعدد لا يُحصى من صور القطط حتى يتمكن من تعلم تمييز سمات القط من تلقاء نفسه.

تعتمد السيرة الذاتية الحديثة اعتمادًا كبيرًا على نماذج التعلّم العميق، وخاصةً الشبكات العصبية التلافيفية (CNNs). شبكة CNN هي نوع من الشبكات العصبية الفعالة للغاية في معالجة بيانات الصور. وهي تعمل من خلال تطبيق مرشحات (أو نواة) على صورة ما لإنشاء خرائط ميزات تبرز الخصائص المهمة مثل الحواف والأنسجة والأشكال. تعمل هذه الشبكات على تشغيل العديد من مهام الرؤية الحاسوبية الشائعة، مما يمكّن الآلات من تحليل المعلومات المرئية بدقة متزايدة.

الرؤية الحاسوبية مقابل معالجة الصور

على الرغم من ارتباطهما الوثيق، إلا أن الرؤية الحاسوبية ومعالجة الصور ليستا متماثلتين. معالجة الصور هي مجموعة فرعية من السيرة الذاتية تركز على معالجة الصور الرقمية لتحسينها أو استخراج معلومات مفيدة. وتتضمن عمليات مثل زيادة وضوح الصورة أو تشويشها أو ترشيحها. في المقابل، تذهب الرؤية الحاسوبية إلى أبعد من ذلك من خلال السعي إلى تفسير وفهم محتوى الصورة. على سبيل المثال، قد تُستخدم معالجة الصور لتحسين جودة الصورة، بينما تُستخدم الرؤية الحاسوبية لتحديد الأشخاص والأشياء والمشهد داخل الصورة. يمكنك معرفة المزيد عن هذا التمييز في هذه النظرة العامة المفصلة عن معالجة الصور الرقمية.

المهام الرئيسية في الرؤية الحاسوبية

تشمل الرؤية الحاسوبية العديد من المهام الرئيسية التي تسمح للآلات بتحليل البيانات المرئية وتفسيرها:

  • اكتشاف الأجسام: يتضمن ذلك تحديد الكائنات داخل الصورة أو الفيديو وتحديد موقعها. يقوم نموذج مثل Ultralytics YOLO برسم مربع محدّد حول كل كائن مكتشف وتعيين تسمية فئة له.
  • تصنيف الصور: تتضمن هذه المهمة تعيين تسمية واحدة لصورة كاملة من مجموعة محددة مسبقًا من الفئات. على سبيل المثال، تصنيف صورة على أنها تحتوي على "قطة" أو "كلب".
  • تجزئة الصور: على عكس اكتشاف الكائنات، يصنف التجزئة كل بكسل في الصورة. يوفر فهمًا أكثر تفصيلاً لمحتوى الصورة. وتتضمن المهام الفرعية تجزئة المثيل والتجزئة الدلالية.
  • تقدير الوضعية: يُستخدم لتحديد موضع واتجاه الشخص أو الجسم في الفضاء. يُستخدم على نطاق واسع في علم الروبوتات والواقع المعزز وتحليل النشاط البشري.
  • تتبُّع الأجسام: تتضمن هذه المهمة تتبع كائن واحد أو أكثر بمرور الوقت في تسلسل فيديو. وهي ضرورية لتطبيقات مثل المراقبة والملاحة المستقلة.

التطبيقات الواقعية

تنتشر تطبيقات الرؤية الحاسوبية بشكل متزايد في مختلف القطاعات:

الأدوات وأطر العمل

أصبح تطوير نماذج الرؤية الحاسوبية ونشرها أسهل بفضل الأدوات والأطر المختلفة. مكتبات مثل PyTorch (قم بزيارة الموقع الرسمي ل PyTorch) و TensorFlow (قم بزيارة الموقع الرسمي ل TensorFlow) هي الأساس لبناء النماذج. توفر المكتبات مفتوحة المصدر مثل OpenCV مجموعة كبيرة من الوظائف للرؤية الحاسوبية في الوقت الحقيقي.

تعمل المنصات مثل Ultralytics HUB على تبسيط دورة حياة مشروع السيرة الذاتية بالكامل، بدءًا من إدارة مجموعات البيانات وتدريب النماذج المخصصة وحتى النشر. كما يساعد استخدام التنسيقات الموحدة مثل ONNX على ضمان قابلية التشغيل البيني بين الأطر المختلفة. ومع نضوج هذه التقنيات، ستستمر في دفع عجلة الابتكار في مختلف القطاعات.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون ونمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة