مسرد المصطلحات

البيانات التركيبية

أطلق العنان لقوة البيانات التركيبية للذكاء الاصطناعي/التعلم الآلي! التغلب على ندرة البيانات ومشكلات الخصوصية والتكاليف مع تعزيز تدريب النماذج والابتكار.

البيانات الاصطناعية هي معلومات تم إنشاؤها بشكل مصطنع لمحاكاة بيانات العالم الحقيقي. في مجالات الذكاء الاصطناعي والتعلم الآلي ( AI) والتعلم الآلي (ML)، فهي بمثابة بديل قوي أو مكمل لبيانات العالم الحقيقي لتدريب نماذج الذكاء الاصطناعي. يمكن أن يكون جمع مجموعات بيانات واقعية واسعة النطاق وعالية الجودة وموسومة بشكل صحيح مكلفًا ومستهلكًا للوقت وأحيانًا غير عملي بسبب لوائح الخصوصية أو ندرة بعض الأحداث. توفر البيانات التركيبية حلاً من خلال تمكين المطورين من توليد كميات هائلة من البيانات المصنفة بشكل مثالي عند الطلب، مما يعالج هذه القيود ويسرّع من تطوير أنظمة رؤية حاسوبية قوية.

كيف يتم توليد البيانات الاصطناعية؟

يمكن إنشاء البيانات الاصطناعية باستخدام عدة تقنيات متقدمة، كل منها مناسب لتطبيقات مختلفة. تسمح هذه الأساليب بالتحكم الدقيق في خصائص البيانات التي تم إنشاؤها، مثل الإضاءة ووضع الأجسام والظروف البيئية.

  • النمذجة والمحاكاة ثلاثية الأبعاد: يستخدم المطورون رسومات الحاسوب وبيئات المحاكاة لإنشاء عوالم افتراضية واقعية. هذا النهج شائع في مجال الروبوتات والأنظمة ذاتية القيادة، حيث يمكن للمحركات المادية محاكاة فيزياء العالم الحقيقي. تُستخدم منصات مثل NVIDIA DRIVE Sim لتوليد بيانات لتدريب السيارات ذاتية القيادة.
  • النماذج التوليدية: تعد تقنيات مثل شبكات الخصومة التوليدية (GANs) ، ومؤخراً نماذج الانتشار، مكوناً أساسياً للذكاء الاصطناعي التوليدي. تتعلم هذه النماذج الأنماط الأساسية من البيانات الحقيقية لإنشاء عينات جديدة وواقعية تماماً. وهذا مفيد بشكل خاص لتوليد وجوه بشرية متنوعة أو مشاهد معقدة.
  • التوليد الإجرائي: تستخدم هذه الطريقة خوارزميات وقواعد لإنشاء البيانات تلقائيًا. تُستخدم على نطاق واسع في تطوير ألعاب الفيديو لتوليد بيئات واسعة النطاق ويمكن تكييفها لإنتاج بيانات تدريب متنوعة بأقل جهد يدوي.
  • عشوائية المجال: تقنية يتم فيها تغيير معلمات المحاكاة (مثل الإضاءة، والملمس، ومواضع الأجسام) عن قصد. وهذا يساعد النموذج المدرّب على التعميم بشكل أفضل من بيئات المحاكاة إلى بيئات العالم الحقيقي من خلال إجباره على التركيز على الميزات الأساسية. وقد أثبتت ورقة بحثية أساسية من تأليف توبين وآخرين فعاليتها في التلاعب الآلي.

التطبيقات الواقعية

يتوسع استخدام البيانات الاصطناعية في العديد من الصناعات، مما يتيح تحقيق اختراقات في المجالات التي تمثل فيها البيانات الواقعية عنق الزجاجة.

  1. المركبات ذاتية القيادة: يتطلب تدريب السيارات ذاتية القيادة بيانات من ملايين الأميال من القيادة، بما في ذلك سيناريوهات نادرة وخطيرة مثل الحوادث أو الطقس القاسي. ومن غير الآمن وغير العملي جمع هذه البيانات في العالم الحقيقي. تسمح البيانات الاصطناعية للمطوّرين بمحاكاة هذه الحالات النادرة في بيئة آمنة وخاضعة للرقابة، مما يحسّن من متانة أنظمة اكتشاف الأجسام وأنظمة الملاحة. تعتمد شركات مثل Waymo اعتماداً كبيراً على المحاكاة للاختبار والتحقق من الصحة.
  2. الذكاء الاصطناعي في الرعاية الصحية: في تحليل الصور الطبية، تكون بيانات المرضى حساسة للغاية ومحمية بقوانين خصوصية صارمة مثل قانون HIPAA. علاوة على ذلك، فإن البيانات الخاصة بالأمراض النادرة نادرة. يمكن استخدام البيانات الاصطناعية لتوليد فحوصات طبية واقعية (مثل التصوير المقطعي المحوسب أو التصوير بالرنين المغناطيسي) دون المساس بخصوصية البيانات. يساعد ذلك في إنشاء مجموعات بيانات أكبر وأكثر توازناً، مما يقلل من تحيز الذكاء الاصطناعي ويحسن دقة النماذج التشخيصية لحالات مثل الكشف عن سرطان الجلد.

البيانات التركيبية مقابل زيادة البيانات

بينما يهدف كل من البيانات التركيبية وزيادة البيانات إلى تحسين مجموعات البيانات، إلا أنهما يعملان بشكل مختلف.

  • تعزيز البيانات: تتضمن هذه التقنية تطبيق تحويلات مثل التدوير أو الاقتصاص أو تغيير الألوان على الصور الموجودة في العالم الحقيقي. وهي تزيد من تنوع مجموعة التدريب من خلال إنشاء نسخ معدلة من البيانات الأصلية. يمكنك معرفة المزيد حول عمليات التعزيز المستخدمة في نماذج Ultralytics YOLO.
  • البيانات الاصطناعية: يتضمن ذلك إنشاء بيانات جديدة بالكامل من الصفر باستخدام المحاكاة أو النماذج التوليدية. وهي غير مشتقة من نقاط البيانات الموجودة ويمكن أن تمثل سيناريوهات غائبة تمامًا عن مجموعة البيانات الأصلية.

باختصار، تعمل زيادة البيانات على تنويع البيانات الموجودة، بينما تعمل البيانات التركيبية على إنشاء بيانات جديدة. كلاهما تقنيتان قويتان، ويمكن الجمع بينهما لبناء نماذج تعلُّم عميق قوية ودقيقة للغاية تتم إدارتها من خلال منصات مثل Ultralytics HUB.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون ونمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة