التعرف على الصور
اكتشف كيف يمكّن التعرف على الصور الذكاء الاصطناعي من تصنيف المرئيات وفهمها، مما يدفع الابتكار في الرعاية الصحية والبيع بالتجزئة والأمن والمزيد.
التعرف على الصور هو مجال واسع من الرؤية الحاسوبية التي تمكن الآلات من تحديد وتفسير الكائنات والأشخاص والأماكن والإجراءات داخل الصور أو مقاطع الفيديو الرقمية. إنها تقنية أساسية تدعم عددًا لا يحصى من التطبيقات، من فتح هاتفك بوجهك إلى تمكين المركبات ذاتية القيادة للتنقل في البيئات المعقدة. في جوهرها، يستخدم التعرف على الصور التعلم الآلي (ML) وخوارزميات التعلم العميق (DL) لتحليل وحدات البكسل واستخراج الأنماط ذات المعنى، وتقليد القدرة البشرية على فهم المعلومات المرئية.
التعرف على الصور مقابل المهام ذات الصلة
في حين يتم استخدام مصطلح التعرف على الصور بشكل تبادلي غالبًا، إلا أنه مصطلح عام يشمل العديد من المهام الأكثر تحديدًا. من المهم تمييزه عن المجالات الفرعية الخاصة به:
- تصنيف الصور: هذا هو أبسط شكل من أشكال التعرف على الصور. وهو ينطوي على تعيين تسمية واحدة لصورة كاملة من مجموعة محددة مسبقًا من الفئات. على سبيل المثال، قد يصنف النموذج صورة على أنها تحتوي على "قطة" أو "كلب" أو "سيارة". الناتج هو تسمية واحدة للصورة بأكملها.
- اكتشاف الكائنات: مهمة أكثر تقدمًا، فاكتشاف الكائنات لا يصنف الكائنات داخل الصورة فحسب، بل يحدد موقعها أيضًا، عادةً عن طريق رسم مربع إحاطة حول كل كائن. تستخدم السيارة ذاتية القيادة، على سبيل المثال، اكتشاف الكائنات لتحديد وتحديد موقع المشاة والمركبات الأخرى وإشارات المرور.
- تجزئة الصور (Image Segmentation): تتجاوز هذه المهمة خطوة أخرى من خلال تحديد البكسلات الدقيقة التي تنتمي إلى كل كائن في الصورة. فهي تنشئ قناعًا تفصيليًا لكل كائن، وهو أمر بالغ الأهمية للتطبيقات التي تتطلب فهمًا عميقًا لشكل الكائن وحدوده، كما هو الحال في تحليل الصور الطبية (medical image analysis).
كيف يعمل التعرف على الصور؟
تعتمد تقنية التعرف على الصور الحديثة بشكل أساسي على الشبكات العصبية الالتفافية (CNNs)، وهي نوع من الشبكات العصبية فعالة بشكل خاص في معالجة البيانات الشبيهة بالشبكة مثل الصور. تتضمن العملية عادةً ما يلي:
- جمع البيانات: يتم جمع مجموعة بيانات كبيرة من الصور المصنفة. تشمل الأمثلة الشهيرة ImageNet و COCO.
- تدريب النموذج: يتم تدريب CNN على مجموعة البيانات هذه. أثناء التدريب، تتعلم الشبكة تحديد الأنماط - من الحواف والقوام البسيطة إلى أجزاء الكائنات المعقدة - من خلال عملية تسمى استخراج الميزات. يتم تعديل أوزان النموذج لتقليل الفرق بين تنبؤاته والتسميات الحقيقية.
- الاستدلال: بمجرد التدريب، يمكن للنموذج إجراء تنبؤات على صور جديدة وغير مرئية. تسمى عملية تطبيق نموذج مدرب الاستدلال.
تطبيقات واقعية
أصبح التعرف على الصور جزءًا لا يتجزأ من العديد من الصناعات:
- الرعاية الصحية: في الذكاء الاصطناعي في الرعاية الصحية، يساعد التعرف على الصور أخصائيي الأشعة على اكتشاف الأورام والكسور وغيرها من التشوهات في الأشعة السينية والتصوير بالرنين المغناطيسي والتصوير المقطعي المحوسب. على سبيل المثال، يمكن تدريب النماذج على مجموعات بيانات من الصور الطبية لتحديد أورام المخ بدقة عالية، مما يساعد الأطباء في إجراء تشخيصات أسرع.
- البيع بالتجزئة: يستخدم تجار التجزئة التعرف على الصور لـ إدارة المخزون من خلال جعل الكاميرات تراقب الرفوف لاكتشاف متى تنخفض المنتجات. ميزات البحث المرئي على مواقع التجارة الإلكترونية، والتي تسمح للعملاء بتحميل صورة للعثور على منتجات مماثلة، هي تطبيق شائع آخر. يمكنك معرفة المزيد حول هذا في صفحتنا الخاصة بـ الذكاء الاصطناعي في مجال البيع بالتجزئة.
الأدوات والتدريب
غالبًا ما يتضمن تطوير تطبيقات التعرف على الصور استخدام مكتبات وأطر عمل متخصصة. تشمل التقنيات الرئيسية ما يلي: