Image Recognition
تعلم كيف يستخدم التعرف على الصور الذكاء الاصطناعي والتعلم العميق لتحديد البيانات المرئية. استكشف تطبيقات العالم الحقيقي وانشر Ultralytics YOLO26 للحصول على نتائج متطورة.
يعد التعرف على الصور تقنية أساسية ضمن المجال الأوسع لـ رؤية الحاسوب (CV)، والتي تمكّن أنظمة البرمجيات من تحديد الكائنات والأشخاص والأماكن والنصوص داخل الصور الرقمية. من خلال تحليل محتوى البكسل لصورة أو إطار فيديو، تحاول هذه التقنية محاكاة قدرات الإدراك البصري للعين والعقل البشريين. وبفضل الذكاء الاصطناعي (AI)، يعمل التعرف على الصور على تحويل البيانات المرئية غير المهيكلة إلى معلومات مهيكلة وقابلة للتنفيذ، مما يشكل حجر الأساس للأتمتة في صناعات تتراوح من الرعاية الصحية إلى النقل ذاتي القيادة.
Link to this sectionالآليات والتقنيات الأساسية#
تجاوزت أنظمة التعرف على الصور الحديثة البرمجة التقليدية القائمة على القواعد لتعتمد بشكل كبير على خوارزميات التعلم العميق (DL). البنية الأكثر انتشاراً المستخدمة لهذه المهام هي الشبكة العصبية التلافيفية (CNN). تعالج CNN الصور كشبكة من القيم - التي تمثل عادة قنوات الألوان الأحمر والأخضر والأزرق (RGB) - وتمررها عبر طبقات متعددة من العمليات الرياضية.
خلال هذه العملية، تقوم الشبكة بـ استخراج الميزات. قد تكتشف الطبقات الأولية أنماطاً هندسية بسيطة مثل الحواف أو الزوايا، بينما تقوم الطبقات الأعمق بتجميع هذه الأنماط للتعرف على هياكل معقدة مثل العيون أو العجلات أو الأوراق. ولتحقيق دقة عالية، تتطلب هذه النماذج كميات هائلة من بيانات التدريب المصنفة. تساعد مجموعات البيانات العامة واسعة النطاق، مثل ImageNet، النماذج على تعلم الاحتمالية الإحصائية بأن ترتيباً مرئياً معيناً يتوافق مع مفهوم مثل "قطة" أو "دراجة" أو "علامة قف".
Link to this sectionتمييز التعرف عن المفاهيم ذات الصلة#
على الرغم من أن مصطلح "التعرف على الصور" يُستخدم غالباً كمصطلح شامل، إلا أنه يختلف عن مهام رؤية الحاسوب المحددة الأخرى. يعد فهم هذه الفروق الدقيقة أمراً بالغ الأهمية لاختيار النموذج المناسب لمشروع ما:
- التعرف مقابل تصنيف الصور: التصنيف هو مهمة تعيين تسمية واحدة لصورة كاملة (مثل تسمية صورة بـ "شاطئ"). التعرف هو القدرة الأوسع التي تمكّن النظام من فهم المحتوى.
- التعرف مقابل اكتشاف الكائنات: بينما يحدد التعرف ما هو موجود في الصورة، يحدد الاكتشاف أين يقع. ترسم خوارزميات الاكتشاف مربع إحاطة حول كل كائن، مما يفصله عن الخلفية.
- التعرف مقابل تجزئة المثيلات: يأخذ هذا التعرف خطوة إضافية من خلال تحديد حدود البكسل الدقيقة للكائن، بدلاً من مجرد مربع. وهذا أمر بالغ الأهمية للتطبيقات التي تتطلب قياسات دقيقة، مثل تحليل الصور الطبية الحيوية.
Link to this sectionتطبيقات العالم الحقيقي#
تمتد فائدة التعرف على الصور فعلياً إلى كل قطاع يتم فيه إنشاء بيانات مرئية.
- التشخيص الطبي: في الرعاية الصحية، تساعد خوارزميات التعرف أطباء الأشعة من خلال تحليل التصوير الطبي مثل الأشعة السينية والرنين المغناطيسي. يمكن لأدوات مثل الذكاء الاصطناعي في الأشعة تحديد الشذوذ مثل الأورام أو الكسور بشكل أسرع وأحياناً بدقة أكبر من الملاحظة البشرية وحدها.
- البيع بالتجزئة والمخزون: تستخدم المتاجر الذكية التعرف لتتبع المنتجات أثناء التقاطها من الأرفف، مما يتيح أنظمة دفع آلية. وبالمثل، تستخدمها روبوتات المستودعات لتحديد الطرود وفرزها.
- الأمن والتحكم في الوصول: تتيح أنظمة التعرف على الوجه الوصول الآمن إلى الهواتف الذكية والمباني عن طريق التحقق من الهوية مقابل قاعدة بيانات لتضمينات الوجه المخزنة.
Link to this sectionتنفيذ التعرف على الصور باستخدام YOLO26#
بالنسبة للمطورين والباحثين، أصبح تنفيذ التعرف على الصور أكثر سهولة بشكل ملحوظ مع نماذج متطورة مثل YOLO26، الذي يدعم التصنيف والاكتشاف والتجزئة بشكل أصلي. يوضح المثال التالي كيفية إجراء التعرف (تحديداً اكتشاف الكائنات) على صورة باستخدام حزمة ultralytics بلغة Python.
from ultralytics import YOLO
# Load a pre-trained YOLO26 model (n for nano, fastest speed)
model = YOLO("yolo26n.pt")
# Run inference on an image to recognize and locate objects
# The source can be a file path, URL, or webcam (source=0)
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results with bounding boxes and labels
results[0].show()بالنسبة للفرق التي تتطلع إلى تصنيف مجموعات البيانات الخاصة بها وتدريب نماذج مخصصة في السحابة، توفر منصة Ultralytics بيئة مبسطة لإدارة دورة الحياة الكاملة لمشروع التعرف على الصور، بدءاً من جمع البيانات وحتى النشر.
Link to this sectionالاتجاهات المستقبلية#
مع زيادة قدرة الحوسبة، يتطور التعرف على الصور إلى فهم الفيديو، حيث تقوم الأنظمة بتحليل السياق الزمني عبر الإطارات. علاوة على ذلك، يسمح دمج الذكاء الاصطناعي التوليدي للأنظمة ليس فقط بالتعرف على الصور ولكن أيضاً بإنشاء أوصاف نصية مفصلة لها، مما يسد الفجوة بين معالجة اللغات الطبيعية (NLP) والرؤية.






