اكتشف ImageNet، مجموعة البيانات الرائدة التي تغذي تطورات رؤية الكمبيوتر بأكثر من 14 مليون صورة، مما يدعم أبحاث الذكاء الاصطناعي والنماذج والتطبيقات.
ImageNet عبارة عن مجموعة بيانات ضخمة متاحة للجمهور تضم أكثر من 14 مليون صورة تم شرحها يدويًا للإشارة إلى الكائنات التي تصورها. يتم تنظيمها وفقًا لـ تسلسل WordNet، وتحتوي على أكثر من 20000 فئة، مع فئة نموذجية، مثل "بالون" أو "فراولة"، تتكون من عدة مئات من الصور. لقد كان هذا التجميع الواسع والمتنوع فعالاً في تطوير مجالات رؤية الكمبيوتر (CV) و التعلم العميق (DL)، حيث يعمل كمعيار لتدريب النماذج وقياس أدائها.
كان إنشاء ImageNet بواسطة باحثين في جامعة ستانفورد لحظة محورية بالنسبة إلى الذكاء الاصطناعي (AI). قبل ImageNet، كانت مجموعات البيانات غالبًا ما تكون صغيرة جدًا بحيث لا يمكن تدريب الشبكات العصبونية (NN) المعقدة بشكل فعال، مما يؤدي إلى مشاكل مثل التجاوز. وفرت ImageNet المقياس المطلوب لتدريب النماذج العميقة، مما مهد الطريق لثورة الذكاء الاصطناعي الحديثة. يمكنك معرفة المزيد من خلال قراءة ورقة بحث ImageNet الأصلية.
تضخم تأثير ImageNet من خلال تحدي ImageNet للتعرف البصري واسع النطاق (ILSVRC)، وهي مسابقة سنوية أقيمت في الفترة من 2010 إلى 2017. أصبح هذا التحدي معيارًا حاسمًا لتقييم أداء خوارزميات رؤية الكمبيوتر. في عام 2012، حققت شبكة عصبية التفافية (CNN) تسمى AlexNet فوزًا رائدًا، متفوقةً بشكل كبير على جميع النماذج السابقة. أظهر هذا النجاح قوة التعلم العميق وحسابات وحدة معالجة الرسومات (GPU)، مما أثار موجة من الابتكار في هذا المجال. كان ILSVRC محركًا رئيسيًا في تطوير العديد من البنى الحديثة، ويمكنك معرفة كيفية أداء نماذج اليوم على مختلف المعايير في مواقع مثل Papers with Code.
يتمثل الاستخدام الأساسي لـ ImageNet في كونه مصدرًا للنماذج المدربة مسبقًا. من خلال تدريب نموذج على مجموعة البيانات الواسعة هذه، فإنه يتعلم التعرف على مجموعة غنية من الميزات المرئية. يمكن بعد ذلك نقل هذه المعرفة إلى مهام جديدة وأكثر تحديدًا. تُعرف هذه التقنية باسم التعلم بالنقل.
من المهم التمييز بين ImageNet والمصطلحات ومجموعات البيانات الأخرى ذات الصلة:
غالبًا ما يتم تدريب نماذج مثل YOLO11 مسبقًا على ImageNet لعمودها الفقري للتصنيف قبل تدريبها على COCO لمهام الكشف. تستفيد عملية التدريب متعددة المراحل هذه من نقاط القوة في كلتا مجموعتي البيانات. يمكنك معرفة كيف تقارن النماذج المختلفة على هذه المعايير في صفحات مقارنة النماذج الخاصة بنا. على الرغم من تأثيرها الكبير، تجدر الإشارة إلى أن ImageNet لديها قيود، بما في ذلك تحيزات مجموعة البيانات المعروفة التي من المهم مراعاتها من منظور أخلاقيات الذكاء الاصطناعي.