اكتشف ImageNet، مجموعة البيانات الرائدة التي تغذي التقدم في مجال الرؤية الحاسوبية مع أكثر من 14 مليون صورة، والتي تدعم أبحاث الذكاء الاصطناعي ونماذجه وتطبيقاته.
ImageNet هي مجموعة بيانات تأسيسية كبيرة جدًا تُستخدم على نطاق واسع في أبحاث الرؤية الحاسوبية وتطويرها. وهي تحتوي على أكثر من 14 مليون صورة تم شرحها يدويًا للإشارة إلى الأشياء المصورة. يتم تنظيم هذه الصور وفقًا للتسلسل الهرمي لقاعدة بيانات WordNet، وهي قاعدة بيانات معجمية كبيرة للأسماء والأفعال والصفات والأحوال English المجمعة في مجموعات من المترادفات المعرفية (synsetsets). مع وجود أكثر من 20,000 فئة، توفر ImageNet موردًا ثريًا ومتنوعًا لتدريب وتقييم نماذج التعلم الآلي (ML) ، خاصةً لمهام مثل تصنيف الصور والتعرف على الصور. وقد كان لحجمها الهائل وشروحها التفصيلية أهمية كبيرة في تطوير مجال الذكاء الاصطناعي. يمكنك معرفة المزيد حول استخدام مجموعة البيانات مع نماذج Ultralytics على صفحة توثيق مجموعة بيانات ImageNet Dataset.
كان تقديم ImageNet بمثابة لحظة محورية للتعلم العميق (DL)، خاصة في مجال الرؤية الحاسوبية. فقبل ImageNet، كان الافتقار إلى مجموعات بيانات كبيرة ومتنوعة وجيدة التسمية يشكل عائقًا كبيرًا يعيق التقدم. مكّنت مجموعات البيانات عالية الجودة مثل ImageNet من تدريب نماذج أعمق وأكثر تعقيدًا، مثل الشبكات العصبية التلافيفية (CNNs)، مما أدى إلى تحقيق اختراقات كبيرة في مهام الفهم البصري. واستخدمت مسابقة ImageNet السنوية للتعرف البصري على نطاق واسع (ILSVRC)، التي استمرت من عام 2010 إلى عام 2017، مجموعة فرعية من ImageNet وأصبحت مجموعة البيانات القياسية القياسية لتقييم تصنيف الصور وخوارزميات اكتشاف الأشياء. وقد أثرت النماذج الرائدة مثل AlexNet وResNet، التي حققت أحدث النتائج على ImageNet، تأثيرًا كبيرًا على بنيات السيرة الذاتية الحديثة وأظهرت قوة التعلم العميق على البيانات واسعة النطاق. تقدم ورقة ILSVRC الأصلية مزيدًا من التفاصيل حول التحدي وتأثيره.
يتمثل التطبيق الأساسي لشبكة ImageNet في العمل كمعيار قياسي لتقييم أداء(دقة وسرعة) نماذج وخوارزميات الرؤية الحاسوبية الجديدة، خاصةً لتصنيف الصور. يتيح اعتماده على نطاق واسع للباحثين مقارنة النتائج بشكل عادل. بالإضافة إلى القياس، تُستخدم ImageNet على نطاق واسع في نماذج ما قبل التدريب. يتضمن التدريب المسبق تدريب نموذج ما على مجموعة بيانات ImageNet الكبيرة والعامة أولاً، مما يسمح له بتعلم ميزات بصرية قوية. هذه النماذج المدرّبة مسبقًا، والتي غالبًا ما تكون متاحة من خلال أطر مثل PyTorch و TensorFlowيمكن بعد ذلك ضبطها على مجموعات بيانات أصغر وأكثر تحديدًا لمختلف المهام النهائية باستخدام التعلّم التحويلي. وهذا يقلل بشكل كبير من كمية البيانات والعمليات الحسابية اللازمة للمهمة المستهدفة وغالبًا ما يؤدي إلى أداء أفضل، خاصة عندما تكون مجموعة البيانات المستهدفة صغيرة. العديد من Ultralytics YOLO على سبيل المثال، تستفيد من استراتيجيات ما قبل التدريب. تعمل منصات مثل Ultralytics HUB على تسهيل عملية تدريب النماذج باستخدام مثل هذه التقنيات.
يمتد تأثير ImageNet إلى ما هو أبعد من البحث الأكاديمي إلى التطبيقات العملية:
من المهم التمييز بين ImageNet والمهام التي تدعمها ومجموعات البيانات الأخرى ذات الصلة:
على الرغم من تأثيرها الهائل، إلا أن ImageNet لها أيضًا قيود، بما في ذلك التحيزات المحتملة لمجموعة البيانات التي تعكس فترة جمع البيانات ومصادرها، وهو أمر مهم في أخلاقيات الذكاء الاصطناعي.