توصيف البيانات
ما هو ترميز البيانات؟ تعلم كيف أن تسمية البيانات باستخدام مربعات الإحاطة أو المضلعات أمر ضروري لتدريب نماذج الذكاء الاصطناعي ورؤية الكمبيوتر الدقيقة.
تعد تعليقات البيانات عملية حاسمة لتصنيف البيانات الأولية أو وضع علامات عليها أو نسخها لتوفير السياق الضروري
الذي يحتاجه نموذج التعلم الآلي (ML)
للتعلم. هذه الخطوة هي حجر الزاوية في
التعلم الخاضع للإشراف، وهي طريقة يتم فيها تدريب الخوارزميات
على أزواج المدخلات والمخرجات للتعرف على الأنماط ووضع التنبؤات. تعمل المعلومات الموسومة كأساس
للحقيقة الأساسية، وتمثل النتيجة المثالية التي يسعى النموذج
إلى تكرارها. بدون تعليق دقيق ومتسق، لا يمكن حتى للبنى المتقدمة مثل
Ultralytics أن تعمل بفعالية، حيث أن
دقة النظام تعتمد بشكل مباشر على جودة
بيانات التدريب.
أنواع التعليقات الشائعة في الرؤية الحاسوبية
في مجال الرؤية الحاسوبية (CV)، تتضمن
تعليقات البيانات وضع علامات على ميزات محددة داخل الصور أو إطارات الفيديو. تعتمد الطريقة المستخدمة بشكل كبير على
المهمة المحددة التي يتم بناء النموذج لأدائها.
-
كشف الأجسام: يقوم المعلقون
برسم مربعات حدودية ثنائية الأبعاد حول الأجسام المهمة،
مثل المركبات أو المشاة. وهذا يعلم النموذج ما هو الجسم ومكانه داخل المشهد.
-
تجزئة المثيل:
تتضمن هذه التقنية تتبع مضلعات دقيقة حول حواف الكائن. على عكس الصناديق البسيطة، تقوم التجزئة
بتعيين الشكل والخطوط الدقيقة، وهو أمر حيوي للمهام التي تتطلب دقة عالية مثل
الإمساك الآلي.
-
تقدير الوضع: يقوم المعلقون بتمييز
نقاط محددة على موضوع ما، مثل مفاصل
جسم الإنسان (المرفقين والركبتين والكتفين). وهذا يسمح للنماذج track والوضعية وحتى تحليل الأداء الرياضي
.
-
تصنيف الصور: هذا
هو أبسط شكل، حيث يتم تعيين تسمية فئة واحدة (على سبيل المثال، "ورقة سليمة" مقابل "ورقة مريضة")
للصورة بأكملها.
تطبيقات واقعية
تسد تعليقات البيانات الفجوة بين البيانات الأولية المستقاة من أجهزة الاستشعار واتخاذ القرارات الذكية في مختلف الصناعات.
-
الزراعة الذكية: في
الذكاء الاصطناعي في الزراعة، يتم توضيح مجموعات بيانات ضخمة من صور المحاصيل
لتحديد الأعشاب الضارة والآفات أو نقص المغذيات. من خلال تدريب النماذج على هذه البيانات، يمكن للمزارعين
أتمتة مراقبة المحاصيل وتطبيق العلاجات فقط عند الضرورة، مما يقلل من الهدر ويحسن المحصول.
-
القيادة الذاتية: تعتمد السيارات ذاتية القيادة على مكتبات ضخمة من البيانات المُعلقة حيث يتم تمييز كل علامة حارة
وإشارة مرور وعقبة. تتم معالجة البيانات من الكاميرات وأجهزة استشعار LiDAR
لتدريب نظام الإدراك لدى السيارة
، مما يضمن قدرتها على التنقل بأمان في حالات المرور المعقدة.
التمييز بين المفاهيم ذات الصلة
من المفيد التمييز بين تعليق البيانات والمصطلحات الأخرى التي غالبًا ما تستخدم في سير عمل إعداد مجموعة البيانات.
-
التعليق التوضيحي مقابل تسمية البيانات:
على الرغم من استخدامهما بشكل متبادل في كثير من الأحيان، فإن "التسمية" تشير عادةً إلى مهام تصنيف أبسط (تعيين علامة
)، بينما يشير "التعليق التوضيحي" إلى إنشاء بيانات وصفية أكثر ثراءً، مثل رسم هندسة معقدة أو وضع علامات
زمنية في الفيديو.
-
التعليق التوضيحي مقابل زيادة البيانات:
يخلق التعليق التوضيحي الحقيقة الأساسية الأولية. الزيادة هي عملية لاحقة تعمل على توسيع
مجموعة البيانات بشكل مصطنع من خلال تطبيق تحويلات (مثل الدوران أو تغييرات الألوان) على الصور الموجودة المُعلقة توضيحيًا لتحسين
متانة النموذج.
-
التعليق التوضيحي مقابل التعلم النشط:
التعلم النشط هو استراتيجية يحدد فيها النموذج نقاط البيانات المحددة التي يجدها أكثر إرباكًا ويطلب تعليقًا توضيحيًا بشريًا لتلك الأمثلة فقط، مما يؤدي إلى تحسين الوقت والتكلفة لعملية التعليق التوضيحي.
الأدوات وسير العمل
يتطلب إنشاء تعليقات توضيحية عالية الجودة عادةً برامج متخصصة تقوم بتصدير البيانات بتنسيقات قياسية مثل
JSON أو XML. تتجه سير العمل الحديثة
بشكل متزايد نحو بيئات متكاملة مثل
Ultralytics التي تعمل على تبسيط عملية الحصول على البيانات والتعليقات التوضيحية التلقائية و
تدريب النماذج في واجهة واحدة.
بمجرد أن يتم توضيح البيانات، يتم الإشارة إليها في ملف تكوين (غالبًا YAML) للتدريب. يوضح المثال التالي
كيفية تدريب نموذج YOLO26 باستخدام
COCO8 القياسية، التي تأتي مع
توضيحات موجودة مسبقًا.
from ultralytics import YOLO
# Load the latest YOLO26 model (nano version)
model = YOLO("yolo26n.pt")
# Train the model using a dataset configuration file
# The YAML file points to the annotated images and labels
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)