استعدوا لـ YOLO Vision 2025!
25 سبتمبر، 2025
10:00 — 18:00 بتوقيت بريطانيا الصيفي
حدث هجين
مؤتمر Yolo Vision 2024
مسرد المصطلحات

توصيف البيانات

ما هو ترميز البيانات؟ تعلم كيف أن تسمية البيانات باستخدام مربعات الإحاطة أو المضلعات أمر ضروري لتدريب نماذج الذكاء الاصطناعي ورؤية الكمبيوتر الدقيقة.

توصيف البيانات هو عملية تصنيف أو وضع علامات على البيانات الأولية لمساعدة نماذج تعلم الآلة (ML) على الفهم والتعلم منها. تحول هذه الخطوة الحاسمة البيانات غير المنظمة، مثل الصور أو مقاطع الفيديو، إلى معلومات منظمة يمكن للخوارزميات تفسيرها. في سياق التعلم الخاضع للإشراف، تعمل هذه التوصيفات بمثابة "الحقيقة الأساسية" - الإجابات الصحيحة التي يستخدمها النموذج لتدريب نفسه. تؤثر جودة ودقة توصيف البيانات بشكل مباشر على أداء وموثوقية نموذج الذكاء الاصطناعي (AI) الناتج. بدون توصيفات دقيقة، حتى النماذج الأكثر تقدمًا ستفشل في تعلم الأنماط بشكل فعال.

دور الشرح التوضيحي في رؤية الكمبيوتر

في مجال الرؤية الحاسوبية (CV)، يعتبر ترميز البيانات أمرًا أساسيًا لتعليم النماذج "الرؤية" وتفسير العالم. وهو ينطوي على قيام مرمّزين بشريين باستخدام برامج متخصصة لتحديد وتمييز الكائنات ذات الأهمية داخل البيانات المرئية. هناك عدة أنواع من الترميز، كل منها مناسب لمهام رؤية حاسوبية مختلفة:

  • توصيف المربع المحيط: هذا هو الشكل الأكثر شيوعًا، ويستخدم لـ اكتشاف الكائنات. يرسم المعلقون مربعات مستطيلة حول الكائنات الفردية ويعينون تسمية فئة (على سبيل المثال، "سيارة"، "شخص").
  • تجزئة المضلعات: بالنسبة للمهام التي تتطلب دقة أكبر، مثل تجزئة المثيلات، يقوم المعلقون بتتبع الخطوط العريضة الدقيقة لكل كائن. يتيح ذلك للنموذج فهم الشكل والحدود المحددة للكائن، حتى عندما تتداخل الكائنات.
  • التجزئة الدلالية: تتضمن هذه الطريقة تصنيف كل بكسل في الصورة إلى فئة معينة (مثل "السماء" أو "الطريق" أو "المبنى"). على عكس تجزئة المثيل، فإنه لا يميز بين الحالات المختلفة لنفس فئة الكائن.
  • تصنيف النقاط الرئيسية: تستخدم هذه التقنية لتقدير الوضعية (pose estimation)، وتتضمن تحديد نقاط اهتمام محددة (نقاط رئيسية) على كائن ما، مثل مفاصل جسم الإنسان أو زوايا الوجه.
  • التصنيف: أبسط شكل، حيث يتم تعيين تسمية واحدة لصورة كاملة. هذا هو الأساس لمهام تصنيف الصور.

يعتمد اختيار طريقة التعليق التوضيحي على الأهداف المحددة لمشروع الرؤية الحاسوبية، والتي تم تحديدها في دليل تحديد أهداف المشروع.

تطبيقات واقعية

  1. المركبات ذاتية القيادة: تعتمد السيارات ذاتية القيادة على نماذج مدربة على بيانات مشروحة على نطاق واسع. يقوم المعلقون بتسمية كل شيء من المشاة وراكبي الدراجات إلى إشارات المرور وعلامات المسارات وإشارات الطرق في ملايين الصور وسحب نقاط الليدار. تتيح بيانات التدريب التفصيلية هذه لنظام إدراك السيارة فهم بيئتها واتخاذ قرارات قيادة آمنة. تعتبر مجموعات البيانات مثل Argoverse ضرورية لتطوير الذكاء الاصطناعي القوي في حلول السيارات.
  2. تحليل الصور الطبية: في الذكاء الاصطناعي للرعاية الصحية، يقوم أخصائيو الأشعة والخبراء الطبيون بتعليق الفحوصات الطبية مثل صور الرنين المغناطيسي والتصوير المقطعي المحوسب والأشعة السينية لتسليط الضوء على الأورام أو الآفات أو الكسور أو التشوهات الأخرى. تُستخدم مجموعات البيانات المشروحة هذه، مثل مجموعة بيانات أورام الدماغ العامة، لتدريب نماذج مثل Ultralytics YOLO التي يمكن أن تساعد في التشخيص المبكر والتخطيط للعلاج. توفر جمعية Radiological Society of North America (RSNA) العديد من مجموعات البيانات هذه للبحث.

توصيف البيانات مقابل المفاهيم ذات الصلة

غالبًا ما تتم مناقشة توصيف البيانات جنبًا إلى جنب مع تقنيات إعداد البيانات الأخرى، لكنها تخدم أغراضًا مختلفة.

  • توصيف البيانات مقابل تصنيف البيانات: غالبًا ما يستخدم هذان المصطلحان بالتبادل ويشيران إلى نفس العملية الأساسية. غالبًا ما يفضل استخدام "التوصيف" في رؤية الكمبيوتر لوصف المهام الأكثر تعقيدًا مثل رسم المضلعات أو النقاط الرئيسية، بينما يمكن استخدام "التصنيف" للمهام الأبسط مثل التصنيف. ومع ذلك، لجميع الأغراض العملية، فهما مترادفان. للحصول على نظرة متعمقة، يمكنك قراءة المزيد في شرحنا حول تصنيف البيانات لرؤية الكمبيوتر.
  • توصيف البيانات مقابل زيادة البيانات: التوصيف هو عملية إنشاء الحقيقة الأساسية الأولية. من ناحية أخرى، فإن زيادة البيانات هي تقنية تستخدم بعد التوصيف لزيادة حجم مجموعة البيانات بشكل مصطنع عن طريق إنشاء إصدارات معدلة من الصور الموصوفة (على سبيل المثال، تدوير أو قلب أو تغيير السطوع).
  • توصيف البيانات مقابل تنظيف البيانات: يتضمن تنظيف البيانات تصحيح الأخطاء وإزالة التكرارات ومعالجة القيم المفقودة داخل مجموعة البيانات لضمان جودتها الشاملة. يمكن أن يحدث التنظيف قبل التوصيف (على سبيل المثال، إزالة الصور الضبابية) أو بعده (على سبيل المثال، إصلاح التصنيفات غير الصحيحة)، ولكنه يختلف عن فعل إضافة تصنيفات جديدة نفسه. جودة البيانات العالية ضرورية للتوصيف الفعال.

يمكن إدارة عملية التعليقات التوضيحية باستخدام أدوات مختلفة، بدءًا من الخيارات مفتوحة المصدر مثل CVAT إلى المنصات التجارية مثل Scale AI و Labelbox. توفر منصات مثل Ultralytics HUB حلولاً متكاملة لإدارة مجموعات البيانات وتدريب النماذج وتبسيط سير العمل بأكمله بدءًا من جمع البيانات والتعليقات التوضيحية وحتى النشر.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة