Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

البيانات الاصطناعية

أطلق العنان لقوة البيانات الاصطناعية للذكاء الاصطناعي/التعلم الآلي! تغلب على ندرة البيانات ومشكلات الخصوصية والتكاليف مع تعزيز تدريب النماذج والابتكار.

تشير البيانات الاصطناعية إلى المعلومات التي يتم إنشاؤها بشكل مصطنع والتي تحاكي الخصائص والأنماط الإحصائية لبيانات بيانات العالم الحقيقي. في مجالات التعلم الآلي (ML) و والرؤية الحاسوبية (CV)، فهي بمثابة مورد قوي قوية لتطوير نماذج عالية الأداء عندما يكون الحصول على بيانات أصلية صعباً أو مكلفاً أو مقيداً بسبب مخاوف تتعلق بالخصوصية. على عكس مجموعات البيانات التقليدية التي يتم جمعها من الأحداث المادية، تتم برمجة البيانات الاصطناعية أو أو محاكاة لها، مما يسمح للمطورين بإنشاء مستودعات ضخمة من بيانات تدريب مثالية عند الطلب. يتوقع محللو الصناعة في جارتنر أنه بحلول عام 2030، ستطغى البيانات الاصطناعية على البيانات الحقيقية في نماذج الذكاء الاصطناعي، مما سيؤدي إلى تحول كبير في كيفية في كيفية بناء الأنظمة الذكية.

كيف يتم توليد البيانات الاصطناعية

ينطوي إنشاء مجموعات بيانات اصطناعية عالية الجودة على تقنيات متطورة تتراوح بين رسومات الحاسوب الكلاسيكية إلى الذكاء الاصطناعي التوليدي الحديث. تضمن هذه الأساليب أن أن تكون البيانات الاصطناعية متنوعة بما يكفي لمساعدة النماذج على التعميم بشكل جيد على سيناريوهات جديدة غير مرئية.

  • المحاكاة والتقديم ثلاثي الأبعاد: محركات الألعاب مثل Unity و Unreal Engine تسمح للمطورين ببناء بيئات افتراضية واقعية. هنا، تقوم المحركات الفيزيائية بمحاكاة الضوء والجاذبية وتفاعلات الكائنات لإنتاج صور تبدو حقيقية. يُستخدم هذا غالبًا بالاقتران مع سير عمل الكشف عن الأجسام ثلاثية الأبعاد.
  • النماذج التوليدية: خوارزميات متقدمة مثل شبكات الخصومة التوليدية (GANs) ونماذج الانتشار تعلم البنية الأساسية لمجموعة بيانات صغيرة في العالم الواقعي لتوليد تنويعات جديدة لا نهائية. أدوات مثل الانتشار المستقر تجسّد كيف يمكن لهذه النماذج إنشاء بيانات مرئية معقدة من من الصفر.
  • عشوائية المجال: لمنع الإفراط في الملاءمة لمظهر محاكاة معين، يستخدم المطورون استخدام عشوائية المجال. تُغيِّر هذه التقنية معلمات مثل الإضاءة والنسيج وزاوية الكاميرا بشكل كبير، مما يجبر الذكاء الاصطناعي على تعلم الميزات الأساسية للجسم بدلاً من ضوضاء الخلفية.

تطبيقات واقعية

تُحدِث البيانات الاصطناعية ثورة في الصناعات التي يمثل فيها جمع البيانات عنق الزجاجة.

  • السيارات ذاتية القيادة: يتطلب تدريب السيارات ذاتية القيادة تعريضها لملايين من سيناريوهات القيادة سيناريوهات القيادة، بما في ذلك الأحداث النادرة والخطيرة مثل اندفاع المشاة في حركة المرور أو الظروف الجوية القاسية. إن جمع هذه البيانات فعلياً أمر غير آمن. تستخدم شركات مثل Waymo المحاكاة لاختبار مركباتها ذاتية القيادة عبر مليارات من الأميال الافتراضية، لتحسين أنظمة الكشف عن الأجسام دون المخاطرة بالأرواح.
  • الرعاية الصحية والتصوير الطبي: سجلات المرضى محمية بموجب لوائح صارمة مثل قانون HIPAA. غالبًا ما تكون مشاركة صور الأشعة السينية الحقيقية أو فحوصات التصوير بالرنين المغناطيسي للأبحاث معقدة من الناحية القانونية. تسمح البيانات الاصطناعية للباحثين بإنشاء مجموعات بيانات تحليل الصور الطبية الواقعية التي تحتفظ بالعلامات الإحصائية للأمراض دون أن تحتوي على أي معلومات تعريف شخصية (PII). وهذا يحافظ على خصوصية البيانات مع تطوير أدوات التشخيص.

البيانات الاصطناعية مقابل زيادة البيانات

من المهم التمييز بين البيانات التركيبية و زيادة البيانات، حيث أن كلاهما يستخدم لتحسين مجموعات البيانات.

  • تأخذ زيادة البيانات الصور الموجودة في العالم الحقيقي وتُعدِّلها - تقليبها أو تدويرها أو تغيير توازن الألوان لزيادة التنوع. يمكنك قراءة المزيد عن هذا في دليل زيادة بياناتYOLO .
  • يتم إنشاء البيانات التركيبية من الصفر. وهي لا تعتمد على تعديل صورة مصدر محددة، ولكنها ينشئ مثيلات جديدة تمامًا، مما يسمح بإنشاء سيناريوهات ربما لم يتم التقاطها من قبل بواسطة كاميرا.

التكامل مع Ultralytics YOLO

تُنسق مجموعات البيانات الاصطناعية تمامًا مثل مجموعات البيانات الحقيقية، وعادةً ما تكون مصحوبة بصور وملفات شروح مقابلة. يمكنك بسلاسة تدريب أحدث النماذج مثل YOLO11 على هذه البيانات لتعزيز الأداء في المهام المتخصصة.

يوضّح المثال التالي كيفية إنشاء صورة تركيبية بسيطة باستخدام التعليمات البرمجية وتشغيل الاستدلال عليها باستخدام باستخدام ultralytics الحزمة.

import cv2
import numpy as np
from ultralytics import YOLO

# 1. Generate a synthetic image (black background, white rectangle)
# This mimics a simple object generation process
synthetic_img = np.zeros((640, 640, 3), dtype=np.uint8)
cv2.rectangle(synthetic_img, (100, 100), (400, 400), (255, 255, 255), -1)

# 2. Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# 3. Run inference on the synthetic data
# The model attempts to detect objects within the generated image
results = model.predict(synthetic_img)

# Display result count
print(f"Detected {len(results[0].boxes)} objects in synthetic image.")

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن