استعدوا لـ YOLO Vision 2025!
25 سبتمبر، 2025
10:00 — 18:00 بتوقيت بريطانيا الصيفي
حدث هجين
مؤتمر Yolo Vision 2024
مسرد المصطلحات

ImageNet

اكتشف ImageNet، مجموعة البيانات الرائدة التي تغذي تطورات رؤية الكمبيوتر بأكثر من 14 مليون صورة، مما يدعم أبحاث الذكاء الاصطناعي والنماذج والتطبيقات.

ImageNet عبارة عن مجموعة بيانات ضخمة متاحة للجمهور تضم أكثر من 14 مليون صورة تم شرحها يدويًا للإشارة إلى الكائنات التي تصورها. يتم تنظيمها وفقًا لـ تسلسل WordNet، وتحتوي على أكثر من 20000 فئة، مع فئة نموذجية، مثل "بالون" أو "فراولة"، تتكون من عدة مئات من الصور. لقد كان هذا التجميع الواسع والمتنوع فعالاً في تطوير مجالات رؤية الكمبيوتر (CV) و التعلم العميق (DL)، حيث يعمل كمعيار لتدريب النماذج وقياس أدائها.

كان إنشاء ImageNet بواسطة باحثين في جامعة ستانفورد لحظة محورية بالنسبة إلى الذكاء الاصطناعي (AI). قبل ImageNet، كانت مجموعات البيانات غالبًا ما تكون صغيرة جدًا بحيث لا يمكن تدريب الشبكات العصبونية (NN) المعقدة بشكل فعال، مما يؤدي إلى مشاكل مثل التجاوز. وفرت ImageNet المقياس المطلوب لتدريب النماذج العميقة، مما مهد الطريق لثورة الذكاء الاصطناعي الحديثة. يمكنك معرفة المزيد من خلال قراءة ورقة بحث ImageNet الأصلية.

تحدي Imagenet للتعرف البصري واسع النطاق (ILSVRC)

تضخم تأثير ImageNet من خلال تحدي ImageNet للتعرف البصري واسع النطاق (ILSVRC)، وهي مسابقة سنوية أقيمت في الفترة من 2010 إلى 2017. أصبح هذا التحدي معيارًا حاسمًا لتقييم أداء خوارزميات رؤية الكمبيوتر. في عام 2012، حققت شبكة عصبية التفافية (CNN) تسمى AlexNet فوزًا رائدًا، متفوقةً بشكل كبير على جميع النماذج السابقة. أظهر هذا النجاح قوة التعلم العميق وحسابات وحدة معالجة الرسومات (GPU)، مما أثار موجة من الابتكار في هذا المجال. كان ILSVRC محركًا رئيسيًا في تطوير العديد من البنى الحديثة، ويمكنك معرفة كيفية أداء نماذج اليوم على مختلف المعايير في مواقع مثل Papers with Code.

تطبيقات Imagenet في العالم الحقيقي

يتمثل الاستخدام الأساسي لـ ImageNet في كونه مصدرًا للنماذج المدربة مسبقًا. من خلال تدريب نموذج على مجموعة البيانات الواسعة هذه، فإنه يتعلم التعرف على مجموعة غنية من الميزات المرئية. يمكن بعد ذلك نقل هذه المعرفة إلى مهام جديدة وأكثر تحديدًا. تُعرف هذه التقنية باسم التعلم بالنقل.

  1. تحليل التصوير الطبي: يمكن ضبط دقة نموذج مدرب مسبقًا على ImageNet، مثل نموذج Ultralytics YOLO، على مجموعة بيانات أصغر بكثير ومتخصصة من الفحوصات الطبية للكشف عن حالات معينة مثل الأورام. يوفر التدريب الأولي على ImageNet أساسًا قويًا للفهم البصري العام، وهو أمر بالغ الأهمية لتحقيق دقة عالية في مهام تحليل الصور الطبية حيث تكون البيانات المصنفة نادرة. هذا تطبيق رئيسي للذكاء الاصطناعي في الرعاية الصحية.
  2. التعرف على منتجات البيع بالتجزئة: في البيع بالتجزئة، يمكن تكييف النماذج لتحديد آلاف المنتجات المختلفة على الرف لإدارة المخزون الآلية. بدلاً من التدريب من البداية، يمكن تكييف نموذج مدرب مسبقًا على ImageNet بسرعة مع المنتجات المحددة لمتجر ما. هذا يقلل من الحاجة إلى كميات هائلة من بيانات التدريب المخصصة ويسرع نشر النموذج. تستفيد العديد من حلول الذكاء الاصطناعي القوية في مجال البيع بالتجزئة من هذا النهج.

مقارنة Imagenet بالمفاهيم ذات الصلة

من المهم التمييز بين ImageNet والمصطلحات ومجموعات البيانات الأخرى ذات الصلة:

  • ImageNet مقابل مهام CV: ImageNet نفسها عبارة عن مجموعة بيانات - وهي عبارة عن مجموعة من الصور المصنفة. إنها ليست مهمة. بدلاً من ذلك، يتم استخدامه لتدريب وتقييم النماذج التي تؤدي مهام مثل تصنيف الصور، حيث يتم تعيين تسمية واحدة لصورة ما. يختلف هذا عن اكتشاف الكائنات، والذي يتضمن تحديد مواقع الكائنات باستخدام مربعات إحاطة، أو تجزئة الصور، والذي يصنف كل بكسل في الصورة.
  • ImageNet مقابل COCO: في حين أن ImageNet هو المعيار الذهبي للتصنيف، إلا أن مجموعات بيانات رؤية الكمبيوتر الأخرى أكثر ملاءمة للمهام الأخرى. على سبيل المثال، تعتبر مجموعة بيانات COCO (الكائنات الشائعة في السياق) هي المعيار المفضل للكشف عن الكائنات و تجزئة المثيلات. وذلك لأن COCO توفر تعليقات توضيحية أكثر تفصيلاً، مثل مربعات الإحاطة وأقنعة التجزئة لكل بكسل لكائنات متعددة في كل صورة. في المقابل، تحتوي معظم صور ImageNet على تسمية واحدة فقط على مستوى الصورة.

غالبًا ما يتم تدريب نماذج مثل YOLO11 مسبقًا على ImageNet لعمودها الفقري للتصنيف قبل تدريبها على COCO لمهام الكشف. تستفيد عملية التدريب متعددة المراحل هذه من نقاط القوة في كلتا مجموعتي البيانات. يمكنك معرفة كيف تقارن النماذج المختلفة على هذه المعايير في صفحات مقارنة النماذج الخاصة بنا. على الرغم من تأثيرها الكبير، تجدر الإشارة إلى أن ImageNet لديها قيود، بما في ذلك تحيزات مجموعة البيانات المعروفة التي من المهم مراعاتها من منظور أخلاقيات الذكاء الاصطناعي.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة