يولو فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

البيانات الاصطناعية

أطلق العنان لقوة البيانات الاصطناعية للذكاء الاصطناعي/التعلم الآلي! تغلب على ندرة البيانات ومشكلات الخصوصية والتكاليف مع تعزيز تدريب النماذج والابتكار.

البيانات الاصطناعية هي معلومات تم إنشاؤها بشكل مصطنع لتقليد بيانات العالم الحقيقي. في مجالات الذكاء الاصطناعي (AI) و التعلم الآلي (ML)، فإنها تعمل كبديل قوي أو مكمل لبيانات العالم الحقيقي لـ تدريب نماذج الذكاء الاصطناعي. يمكن أن يكون جمع مجموعات بيانات واسعة النطاق وعالية الجودة ومصنفة بشكل صحيح من العالم الحقيقي مكلفًا ويستغرق وقتًا طويلاً وغير عملي في بعض الأحيان بسبب لوائح الخصوصية أو ندرة بعض الأحداث. توفر البيانات الاصطناعية حلاً من خلال تمكين المطورين من إنشاء كميات هائلة من البيانات المصنفة بشكل مثالي عند الطلب، ومعالجة هذه القيود وتسريع تطوير أنظمة رؤية الكمبيوتر (CV) القوية.

كيف يتم إنشاء البيانات الاصطناعية؟

يمكن إنشاء البيانات الاصطناعية باستخدام العديد من التقنيات المتقدمة، كل منها مناسب لتطبيقات مختلفة. تتيح هذه الطرق تحكمًا دقيقًا في خصائص البيانات التي تم إنشاؤها، مثل الإضاءة وموضع الكائن والظروف البيئية.

  • النمذجة والمحاكاة ثلاثية الأبعاد: يستخدم المطورون رسومات الحاسوب وبيئات المحاكاة لإنشاء عوالم افتراضية واقعية للغاية. هذا النهج شائع في الروبوتات والأنظمة المستقلة، حيث يمكن للمحركات الفيزيائية محاكاة فيزياء العالم الحقيقي. تُستخدم منصات مثل NVIDIA DRIVE Sim لإنشاء بيانات لتدريب السيارات ذاتية القيادة.
  • النماذج التوليدية: تقنيات مثل شبكات الخصومة التوليدية (GANs)، ومؤخرًا، نماذج الانتشار هي عنصر أساسي في الذكاء الاصطناعي التوليدي. تتعلم هذه النماذج الأنماط الأساسية من البيانات الحقيقية لإنشاء عينات واقعية جديدة تمامًا. هذا مفيد بشكل خاص لإنشاء وجوه بشرية متنوعة أو مشاهد معقدة.
  • التوليد الإجرائي: تستخدم هذه الطريقة الخوارزميات والقواعد لإنشاء البيانات تلقائيًا. يتم استخدامه على نطاق واسع في تطوير ألعاب الفيديو لإنشاء بيئات واسعة النطاق ويمكن تكييفه لإنتاج بيانات تدريب متنوعة بأقل جهد يدوي.
  • توزيع المجال العشوائي: تقنية يتم فيها تغيير معلمات المحاكاة (مثل الإضاءة والملمس ومواضع الكائنات) عن قصد. يساعد هذا النموذج المدرب على التعميم بشكل أفضل من البيئات المحاكاة إلى البيئات الواقعية من خلال إجباره على التركيز على الميزات الأساسية. أظهرت ورقة بحثية أساسية لتوبين وآخرون فعاليتها في التلاعب الروبوتي.

تطبيقات واقعية

يتوسع استخدام البيانات الاصطناعية عبر العديد من الصناعات، مما يتيح تحقيق اختراقات حيث تكون بيانات العالم الحقيقي بمثابة عنق الزجاجة.

  1. المركبات ذاتية القيادة: يتطلب تدريب السيارات ذاتية القيادة بيانات من ملايين الأميال من القيادة، بما في ذلك السيناريوهات النادرة والخطيرة مثل الحوادث أو الظروف الجوية القاسية. من غير الآمن وغير العملي جمع هذه البيانات في العالم الحقيقي. تسمح البيانات الاصطناعية للمطورين بمحاكاة هذه الحالات الشاذة في بيئة آمنة ومحكمة، مما يحسن من قوة اكتشاف الكائنات وأنظمة الملاحة. تعتمد شركات مثل Waymo بشكل كبير على المحاكاة للاختبار والتحقق.
  2. الذكاء الاصطناعي في الرعاية الصحية: في تحليل الصور الطبية، تعتبر بيانات المرضى حساسة للغاية وتحميها قوانين الخصوصية الصارمة مثل HIPAA. علاوة على ذلك، فإن بيانات الأمراض النادرة شحيحة. يمكن استخدام البيانات الاصطناعية لإنشاء فحوصات طبية واقعية (مثل التصوير المقطعي المحوسب أو التصوير بالرنين المغناطيسي) دون المساس بخصوصية البيانات. يساعد هذا في إنشاء مجموعات بيانات أكبر وأكثر توازناً، مما يقلل من تحيز الذكاء الاصطناعي ويحسن دقة النماذج التشخيصية لحالات مثل الكشف عن سرطان الجلد.

البيانات الاصطناعية مقابل زيادة البيانات

في حين أن البيانات الاصطناعية وزيادة البيانات تهدفان إلى تحسين مجموعات البيانات، إلا أنهما تعملان بشكل مختلف.

  • زيادة البيانات: تتضمن هذه التقنية تطبيق تحويلات مثل التدوير أو الاقتصاص أو تغييرات الألوان على الصور الحقيقية الموجودة. يزيد من تنوع مجموعة التدريب عن طريق إنشاء إصدارات معدلة من البيانات الأصلية. يمكنك معرفة المزيد حول الزيادات المستخدمة في نماذج Ultralytics YOLO.
  • البيانات الاصطناعية: يتضمن ذلك إنشاء بيانات جديدة تمامًا من البداية باستخدام عمليات المحاكاة أو النماذج التوليدية. وهي ليست مشتقة من نقاط البيانات الموجودة ويمكن أن تمثل سيناريوهات غائبة تمامًا عن مجموعة البيانات الأصلية.

باختصار، يعمل تضخيم البيانات على تغيير البيانات الموجودة، بينما تنشئ البيانات الاصطناعية بيانات جديدة. كلاهما تقنيتان قويتان، ويمكن دمجهما لبناء نماذج التعلم العميق قوية ودقيقة للغاية تتم إدارتها من خلال منصات مثل Ultralytics HUB.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة