الأدلة

استكشاف أفضل مجموعات بيانات رؤية الحاسوب في 2025

انضم إلينا في نظرة فاحصة على أفضل مجموعات بيانات رؤية الحاسوب لعام 2025. تعرف على كيفية دفع مجموعات البيانات المتنوعة وعالية الجودة لحلول ذكاء رؤية اصطناعي أكثر ذكاءً.

أبأبيرامي فينا

5 min readFebruary 21, 2025

مجموعات بيانات رؤية الحاسوب لتدريب النماذج

هل تعلم أن البيانات تلعب دوراً في كل ما تفعله تقريباً في حياتك اليومية؟ فمشاهدة مقطع فيديو، أو التقاط صورة، أو التحقق من خرائط Google يساهم في التدفق المستمر للمعلومات التي تلتقطها أكثر من 75 مليار جهاز متصل. وتشكل هذه البيانات أساس الذكاء الاصطناعي (AI). في الواقع، تعتمد نماذج الرؤية الحاسوبية المتقدمة مثل Ultralytics YOLO11 على البيانات المرئية لتحديد الأنماط، وتفسير الصور، وفهم العالم من حولنا.

ومن المثير للاهتمام أن قيمة البيانات لا تتعلق بالكمية فقط. فمن الأهمية بمكان معرفة مدى جودة تنظيمها وإعدادها. إذا كانت مجموعة البيانات غير منظمة أو غير مكتملة، فقد يؤدي ذلك إلى حدوث أخطاء. ومع ذلك، عندما تكون مجموعات البيانات نظيفة ومتنوعة، فإنها تساعد نماذج الرؤية الحاسوبية على الأداء بشكل أفضل، سواء كان ذلك في التعرف على الأشياء في حشد من الناس أو تحليل العناصر المرئية المعقدة. مجموعات البيانات عالية الجودة تصنع كل الفرق.

في هذا المقال، سنستكشف أفضل مجموعات بيانات الرؤية الحاسوبية لعام 2025 ونرى كيف تساهم في بناء نماذج رؤية حاسوبية أكثر دقة وكفاءة. لنبدأ!

Link to this sectionما هي مجموعات بيانات الرؤية الحاسوبية؟#

مجموعة بيانات الرؤية الحاسوبية هي عبارة عن مجموعة من الصور أو مقاطع الفيديو التي تساعد أنظمة الرؤية الحاسوبية على تعلم وفهم والتعرف على المعلومات المرئية. تأتي مجموعات البيانات هذه مزودة بتسميات أو تعليقات توضيحية تساعد النماذج على التعرف على الأشياء والأشخاص والمشاهد والأنماط داخل البيانات.

يمكن استخدامها لتدريب نماذج الرؤية الحاسوبية، مما يساعدها على تحسين مهام مثل التعرف على الوجوه، أو اكتشاف الأشياء، أو تحليل المشاهد. وكلما كانت مجموعة البيانات أفضل - من حيث التنظيم والتنوع والدقة - كان أداء نموذج الرؤية المدعوم بالذكاء الاصطناعي أفضل، مما يؤدي إلى تقنية أكثر ذكاءً وفائدة في الحياة اليومية.

Link to this sectionكيفية بناء مجموعة بيانات للرؤية الحاسوبية#

يشبه بناء مجموعة بيانات للرؤية الحاسوبية إعداد ملاحظات دراسية لتعليم شخص ما كيفية رؤية وفهم العالم. يبدأ الأمر كله بجمع الصور ومقاطع الفيديو التي تتوافق مع التطبيق المحدد الذي تعمل على تطويره.

تتضمن مجموعة البيانات المثالية أمثلة متنوعة للأشياء محل الاهتمام، ملتقطة من زوايا مختلفة، وفي ظروف إضاءة متنوعة، وعبر خلفيات وبيئات متعددة. يضمن هذا التنوع أن نموذج الرؤية الحاسوبية يتعلم التعرف على الأنماط بدقة ويعمل بشكل موثوق في سيناريوهات العالم الحقيقي.

رسم تخطيطي لبناء مجموعة بيانات رؤية حاسوبية مثالية

شكل 1. بناء مجموعة بيانات رؤية مثالية. الصورة بواسطة المؤلف.

بعد جمع الصور ومقاطع الفيديو ذات الصلة، تكون الخطوة التالية هي تسمية البيانات. تتضمن هذه العملية إضافة وسوم، أو تعليقات توضيحية، أو أوصاف إلى البيانات حتى يتمكن الذكاء الاصطناعي من فهم محتوى كل صورة أو مقطع فيديو.

يمكن أن تتضمن التسميات أسماء الأشياء، والمواقع، والحدود، أو أي تفاصيل أخرى ذات صلة تساعد في تدريب النموذج على التعرف على المعلومات المرئية وتفسيرها بدقة. تحوّل تسمية البيانات مجموعة بسيطة من الصور إلى مجموعة بيانات منظمة يمكن استخدامها لـ تدريب نموذج رؤية حاسوبية.

Link to this sectionيتطلب تدريب النموذج بيانات عالية الجودة#

قد تتساءل عما يجعل مجموعة البيانات عالية الجودة. هناك العديد من العوامل المترابطة، مثل دقة التسمية، والتنوع، والاتساق. على سبيل المثال، إذا كان هناك العديد من الموصفين يقومون بتسمية مجموعة بيانات لـ اكتشاف الأشياء لتحديد آذان القطط، فقد يقوم أحدهم بتسميتها كجزء من الرأس بينما يقوم آخر بتسميتها بشكل منفصل كآذان. هذا التناقض يمكن أن يربك النموذج ويؤثر على قدرته على التعلم بشكل صحيح.

إليك نظرة عامة سريعة على صفات مجموعة بيانات الرؤية الحاسوبية المثالية:

تسميات واضحة: كل صورة معنونة بدقة بتسميات متسقة ودقيقة.
بيانات متنوعة: تتضمن مجموعة البيانات أشياء مختلفة، وخلفيات متنوعة، وظروف إضاءة وزوايا مختلفة لمساعدة النموذج على العمل بشكل جيد في مواقف مختلفة.
صور عالية الدقة: الصور الحادة والمفصلة تجعل من السهل على النموذج تعلم الميزات والتعرف عليها.

Link to this sectionUltralytics تدعم مجموعات بيانات متنوعة#

نماذج Ultralytics YOLO، مثل YOLO11، مصممة للعمل مع مجموعات البيانات بتنسيق ملف YOLO محدد. في حين أنه من السهل تحويل بياناتك الخاصة إلى هذا التنسيق، فإننا نوفر أيضاً خياراً خالياً من المتاعب لأولئك الذين يرغبون في بدء التجربة على الفور.

تدعم حزمة Ultralytics Python مجموعة واسعة من مجموعات بيانات الرؤية الحاسوبية، مما يسمح لك بالتعمق في المشاريع باستخدام مهام مثل اكتشاف الأشياء، أو تجزئة المثيل، أو تقدير الوضع دون أي إعداد إضافي.

يمكن للمستخدمين الوصول بسهولة إلى مجموعات بيانات جاهزة للاستخدام مثل COCO، وDOTA-v2.0، وOpen Images V7، وImageNet من خلال تحديد اسم مجموعة البيانات كأحد المعلمات في وظيفة التدريب. عند القيام بذلك، يتم تنزيل مجموعة البيانات وتهيئتها تلقائياً، حتى تتمكن من التركيز على بناء نماذجك وتحسينها.

Link to this sectionأفضل 5 مجموعات بيانات للرؤية الحاسوبية في عام 2025#

تعتمد التطورات في الذكاء الاصطناعي المرئي على مجموعات بيانات متنوعة واسعة النطاق تدفع الابتكار وتمكن من تحقيق اختراقات. دعونا نلقي نظرة على بعض أهم مجموعات البيانات، المدعومة من Ultralytics، والتي تؤثر على نماذج الرؤية الحاسوبية.

Link to this sectionمجموعة بيانات ImageNet#

ImageNet، التي أنشأتها Fei-Fei Li وفريقها في جامعة برينستون عام 2007 وتم تقديمها في عام 2009، هي مجموعة بيانات كبيرة تحتوي على أكثر من 14 مليون صورة مصنفة. تُستخدم على نطاق واسع لتدريب الأنظمة على التعرف على الأشياء المختلفة وتصنيفها. تصميمها الهيكلي يجعلها مفيدة بشكل خاص لتعليم النماذج تصنيف الصور بدقة. وعلى الرغم من أنها موثقة جيداً، إلا أنها تركز بشكل أساسي على تصنيف الصور وتفتقر إلى تعليقات تفصيلية لمهام مثل اكتشاف الأشياء.

إليك نظرة على بعض نقاط القوة الرئيسية لـ ImageNet:

التنوع: مع صور تمتد عبر أكثر من 20,000 فئة، تقدم ImageNet مجموعة بيانات واسعة ومتنوعة تعزز تدريب النموذج والتعميم.
تنظيم هيكلي: يتم تصنيف الصور بدقة باستخدام تسلسل WordNet الهرمي، مما يسهل استرجاع البيانات بكفاءة وتدريب النموذج بشكل منهجي.
توثيق شامل: تجعل الأبحاث المكثفة وسنوات الدراسة ImageNet في متناول المبتدئين والخبراء على حد سواء، مما يوفر رؤى قيمة وتوجيهات لـ مشاريع الرؤية الحاسوبية.

ومع ذلك، مثل أي مجموعة بيانات، لها قيودها. إليك بعض التحديات التي يجب مراعاتها:

المتطلبات الحسابية: يمكن أن يشكل حجمها الهائل تحديات للفرق الصغيرة ذات الموارد الحسابية المحدودة.
نقص البيانات الزمنية: نظراً لاحتوائها على صور ثابتة فقط، فقد لا تلبي احتياجات التطبيقات التي تتطلب فيديو أو بيانات تعتمد على الوقت.
صور قديمة: بعض الصور في مجموعة البيانات قديمة وقد لا تعكس الأشياء أو الأساليب أو البيئات الحالية، مما قد يقلل من أهميتها للتطبيقات الحديثة.

Link to this sectionمجموعة بيانات DOTA-v2.0#

تعد مجموعة بيانات DOTA-v2.0، حيث يرمز DOTA إلى Dataset for Object Detection in Aerial Images، مجموعة واسعة من الصور الجوية التي تم إنشاؤها خصيصاً لـ اكتشاف الأشياء بواسطة مربع الإحاطة الموجه (OBB). في اكتشاف OBB، تُستخدم مربعات إحاطة دوارة لتتماشى بدقة أكبر مع الاتجاه الفعلي للأشياء في الصورة. تعمل هذه الطريقة بشكل جيد بشكل خاص للصور الجوية، حيث تظهر الأشياء غالباً بزوايا مختلفة، مما يؤدي إلى تحديد أدق للموقع واكتشاف أفضل بشكل عام.

تتكون مجموعة البيانات هذه من أكثر من 11,000 صورة وأكثر من 1.7 مليون مربع إحاطة موجه عبر 18 فئة من الأشياء. تتراوح أحجام الصور من 800×800 إلى 20,000×20,000 بكسل، وتشمل أشياء مثل الطائرات والسفن والمباني.

صور ونماذج توضيحية للتعليقات التوضيحية من مجموعة بيانات DOTA-v2.0

شكل 2. أمثلة للصور والتعليقات التوضيحية من مجموعة بيانات DOTA-v2.0. الصورة بواسطة المؤلف.

بسبب تعليقاتها التوضيحية التفصيلية، أصبحت DOTA-v2.0 خياراً شائعاً لمشاريع الاستشعار عن بعد والمراقبة الجوية. إليك بعض الميزات الرئيسية لـ DOTA-v2.0:

فئات أشياء متنوعة: تغطي العديد من أنواع الأشياء المختلفة، مثل المركبات والموانئ وخزانات التخزين، مما يمنح النماذج تعرضاً لأشياء متنوعة في العالم الحقيقي.
تعليقات توضيحية عالية الجودة: قدم الموصفون الخبراء مربعات إحاطة موجهة بدقة تظهر بوضوح أشكال واتجاهات الأشياء.
صور متعددة المقاييس: تتضمن مجموعة البيانات صوراً بأحجام مختلفة، مما يساعد النماذج على تعلم كيفية اكتشاف الأشياء على المقاييس الصغيرة والكبيرة.

بينما تتمتع DOTA-v2 بالعديد من نقاط القوة، إليك بعض القيود التي يجب على المستخدمين وضعها في الاعتبار:

خطوات تنزيل إضافية: نظراً للطريقة التي تتم بها صيانة مجموعة بيانات DOTA، تتطلب DOTA-v2.0 خطوة إعداد إضافية. تحتاج أولاً إلى تنزيل صور DOTA-v1.0 ثم إضافة الصور الإضافية والتعليقات التوضيحية المحدثة لـ DOTA-v2.0 لإكمال مجموعة البيانات.
تعليقات توضيحية معقدة: قد تتطلب مربعات الإحاطة الموجهة جهداً إضافياً للتعامل معها أثناء تدريب النموذج.
نطاق محدود: تم تصميم DOTA-v2 للصور الجوية، مما يجعلها أقل فائدة لمهام اكتشاف الأشياء العامة خارج هذا النطاق.

Link to this sectionمجموعة بيانات Roboflow 100#

تم إنشاء مجموعة بيانات Roboflow 100 (RF100) بواسطة Roboflow بدعم من Intel. يمكن استخدامها لاختبار وقياس مدى كفاءة عمل نماذج اكتشاف الأشياء. تتضمن مجموعة بيانات القياس هذه 100 مجموعة بيانات مختلفة مختارة من أكثر من 90,000 مجموعة بيانات عامة. تحتوي على أكثر من 224,000 صورة و800 فئة من الأشياء من مجالات مثل الرعاية الصحية، والمناظر الجوية، والألعاب.

إليك بعض المزايا الرئيسية لاستخدام RF100:

تغطية واسعة للمجالات: تتضمن مجموعات بيانات من سبعة مجالات، مثل التصوير الطبي، والمناظر الجوية، والاستكشاف تحت الماء.
تشجع على تحسين النموذج: يكشف التباين والتحديات الخاصة بالمجال في RF100 عن فجوات في النماذج الحالية، مما يدفع الأبحاث نحو حلول اكتشاف أشياء أكثر قابلية للتكيف وقوة.
تنسيق صورة ثابت: يتم تغيير حجم جميع الصور إلى 640x640 بكسل. يساعد هذا المستخدمين على تدريب النماذج دون الحاجة إلى ضبط أحجام الصور.

على الرغم من نقاط قوتها، تأتي RF100 أيضاً ببعض العيوب التي يجب وضعها في الاعتبار:

محدودة من حيث المهام: تم تصميم RF100 لاكتشاف الأشياء، لذا فهي لا يمكنها استيعاب مهام مثل التجزئة أو التصنيف.
تركيز متمحور حول القياس: تم تصميم RF100 في المقام الأول كأداة قياس بدلاً من تدريب النماذج لتطبيقات العالم الحقيقي، لذا قد لا تترجم نتائجها بالكامل إلى سيناريوهات النشر العملي.
تباين التعليقات التوضيحية: نظراً لأن RF100 تجمع مجموعات بيانات من مصادر جماهيرية، فقد تكون هناك تناقضات في جودة التعليقات التوضيحية وممارسات التسمية، مما قد يؤثر على تقييم النموذج والضبط الدقيق.

Link to this sectionمجموعة بيانات COCO (Common Objects in Context)#

تعد مجموعة بيانات COCO واحدة من أكثر مجموعات بيانات الرؤية الحاسوبية استخداماً على نطاق واسع، حيث تقدم أكثر من 330,000 صورة مع تعليقات توضيحية مفصلة. إنها مصممة لاكتشاف الأشياء، والتجزئة، وشرح الصور، مما يجعلها مورداً قيماً للعديد من المشاريع. تساعد تسمياتها التفصيلية، بما في ذلك مربعات الإحاطة وأقنعة التجزئة، الأنظمة على تعلم تحليل الصور بدقة.

تشتهر مجموعة البيانات هذه بمرونتها وهي مفيدة لمهام متنوعة، من المشاريع البسيطة إلى المعقدة. لقد أصبحت معياراً في مجال الذكاء الاصطناعي المرئي، وتُستخدم بشكل متكرر في التحديات والمسابقات لتقييم أداء النموذج.

تتضمن بعض نقاط قوتها ما يلي:

بيانات متنوعة وواقعية: تتضمن مجموعة البيانات صوراً من سيناريوهات العالم الحقيقي مع أشياء متعددة، وحالات انسداد، وظروف إضاءة متنوعة.
مجتمع قوي وتبنٍ بحثي: تُستخدم في مسابقات التعلم الآلي الكبرى والأبحاث، وتتمتع مجموعة بيانات COCO بتوثيق شامل، ونماذج مدربة مسبقاً، ودعم مجتمعي نشط.
تعليقات توضيحية غنية ومفصلة: توفر مجموعة بيانات COCO تعليقات توضيحية مفصلة للغاية، بما في ذلك تجزئة الأشياء، والنقاط الرئيسية، والشروحات، مما يجعلها مثالية للمشاريع التي تتطلب فهماً مرئياً دقيقاً.

إليك بعض العوامل المقيدة التي يجب أن تكون على دراية بها أيضاً:

متطلبات حسابية عالية: نظراً لحجمها وتعقيدها، قد يتطلب تدريب النماذج على COCO موارد حسابية كبيرة، مما يجعله تحدياً للفرق ذات الأجهزة المحدودة.
عدم توازن البيانات: تحتوي بعض فئات الأشياء على صور أكثر بكثير من غيرها، مما قد يؤدي إلى تحيز في تدريب النموذج.
هيكل تعليقات توضيحية معقد: قد تكون التعليقات التوضيحية التفصيلية لمجموعة البيانات، على الرغم من قيمتها، مربكة للمبتدئين أو الفرق الصغيرة التي تفتقر إلى الخبرة في العمل مع مجموعات بيانات الذكاء الاصطناعي المرئي المنظمة.

Link to this sectionمجموعة بيانات Open Images V7#

Open Images V7 هي مجموعة بيانات ضخمة مفتوحة المصدر برعاية Google، وتضم أكثر من 9 ملايين صورة مع تعليقات توضيحية لـ 600 فئة من الأشياء. وهي تتضمن مجموعة متنوعة من أنواع التعليقات التوضيحية ومثالية لمعالجة مهام الرؤية الحاسوبية المعقدة. يوفر نطاقها وعمقها مورداً شاملاً لتدريب واختبار نماذج الرؤية الحاسوبية.

صور توضيحية من مجموعة بيانات Open Images V7

شكل 3. لمحة عن مجموعة بيانات Open Images V7. الصورة بواسطة المؤلف.

أيضاً، توفر شعبية مجموعة بيانات Open Images V7 في الأبحاث الكثير من الموارد والأمثلة للمستخدمين للتعلم منها. ومع ذلك، فإن حجمها الهائل يمكن أن يجعل التنزيل والمعالجة يستغرقان وقتاً طويلاً، خاصة للفرق الصغيرة. مشكلة أخرى هي أن بعض التعليقات التوضيحية قد تكون غير متسقة، مما يتطلب جهداً إضافياً لتنظيف البيانات، والتكامل ليس دائماً سلساً، مما يعني أن هناك حاجة إلى إعداد إضافي.

Link to this sectionاختيار مجموعة البيانات المناسبة#

اختيار مجموعة البيانات المناسبة هو جزء كبير من إعداد مشروع الرؤية الحاسوبية الخاص بك للنجاح. يعتمد الخيار الأفضل على مهمتك المحددة - فالعثور على تطابق جيد يساعد نموذجك على تعلم المهارات الصحيحة. يجب أيضاً أن تتكامل بسهولة مع أدواتك، حتى تتمكن من التركيز أكثر على بناء نموذجك وأقل على استكشاف الأخطاء وإصلاحها.

رسم تخطيطي للعوامل المؤثرة في اختيار مجموعة البيانات المناسبة

شكل 4. عوامل اختيار مجموعة البيانات المناسبة. الصورة بواسطة المؤلف.

Link to this sectionأبرز النقاط#

تعد مجموعات البيانات عالية الجودة العمود الفقري لأي نموذج رؤية حاسوبية، مما يساعد الأنظمة على تعلم تفسير الصور بدقة. مجموعات البيانات المتنوعة والموصوفة جيداً مهمة بشكل خاص، حيث أنها تمكن النماذج من الأداء بشكل موثوق في سيناريوهات العالم الحقيقي وتقليل الأخطاء الناجمة عن بيانات محدودة أو رديئة الجودة.

تعمل Ultralytics على تبسيط عملية الوصول إلى مجموعات بيانات الرؤية الحاسوبية والعمل معها، مما يجعل من الأسهل العثور على البيانات المناسبة لمشروعك. يعد اختيار مجموعة البيانات المناسبة خطوة حاسمة في بناء نموذج عالي الأداء، مما يؤدي إلى نتائج أكثر دقة وتأثيراً.

انضم إلى مجتمعنا واستكشف مستودع GitHub الخاص بنا لمعرفة المزيد عن الذكاء الاصطناعي. اكتشف تطورات مثل الرؤية الحاسوبية للرعاية الصحية والذكاء الاصطناعي في السيارات ذاتية القيادة على صفحات الحلول الخاصة بنا. تحقق من خيارات الترخيص الخاصة بنا واتخذ الخطوة الأولى نحو البدء بالرؤية الحاسوبية اليوم!

Explore solutions

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.

استكشاف أفضل مجموعات بيانات رؤية الحاسوب في 2025

Link to this sectionما هي مجموعات بيانات الرؤية الحاسوبية؟#

Link to this sectionكيفية بناء مجموعة بيانات للرؤية الحاسوبية#

Link to this sectionيتطلب تدريب النموذج بيانات عالية الجودة#

Link to this sectionUltralytics تدعم مجموعات بيانات متنوعة#

Link to this sectionأفضل 5 مجموعات بيانات للرؤية الحاسوبية في عام 2025#

Link to this sectionمجموعة بيانات ImageNet#

Link to this sectionمجموعة بيانات DOTA-v2.0#

Link to this sectionمجموعة بيانات Roboflow 100#

Link to this sectionمجموعة بيانات COCO (Common Objects in Context)#

Link to this sectionمجموعة بيانات Open Images V7#

Link to this sectionاختيار مجموعة البيانات المناسبة#

Link to this sectionأبرز النقاط#

Explore solutions

الذكاء الاصطناعي في الروبوتات

الذكاء الاصطناعي في الخدمات اللوجستية

الذكاء الاصطناعي في التجزئة

الذكاء الاصطناعي في الرعاية الصحية

الذكاء الاصطناعي في التصنيع

الذكاء الاصطناعي في مجال السيارات

الذكاء الاصطناعي في الزراعة

الذكاء الاصطناعي في الروبوتات

الذكاء الاصطناعي في الخدمات اللوجستية

الذكاء الاصطناعي في التجزئة

الذكاء الاصطناعي في الرعاية الصحية

الذكاء الاصطناعي في التصنيع

الذكاء الاصطناعي في مجال السيارات

الذكاء الاصطناعي في الزراعة

الذكاء الاصطناعي في الروبوتات

الذكاء الاصطناعي في الخدمات اللوجستية

الذكاء الاصطناعي في التجزئة

الذكاء الاصطناعي في الرعاية الصحية

الذكاء الاصطناعي في التصنيع

الذكاء الاصطناعي في مجال السيارات

الذكاء الاصطناعي في الزراعة

لنبنِ مستقبل الذكاء الاصطناعي معاً!