ما هي البيانات التركيبية في الرؤية الحاسوبية؟ Ultralytics

لطالما كانت البيانات عاملاً دافعًا في مجالات مثل التحليلات والذكاء الاصطناعي (AI). في الواقع، فإن الطريقة التي نجمع بها البيانات ونولدها ونستخدمها تشكل مستقبل الأنظمة الذكية. على سبيل المثال، تعتمد السيارات ذاتية القيادة على ملايين الصور المصنفة وقراءات المستشعرات، من لافتات الشوارع إلى حركات المشاة، لتعلم كيفية التنقل في الطرق بأمان.

أحد أهم أنواع البيانات التي تدعم هذا التقدم، خاصة في مجالات مثل المركبات ذاتية القيادة والأمن، هي البيانات المرئية مثل الصور ومقاطع الفيديو.

على وجه الخصوص، يُطلق على مجال الذكاء الاصطناعي الذي يمكّن الآلات من تفسير هذه المعلومات المرئية اسم رؤية الكمبيوتر. فهو يساعد الأنظمة على فهم وتحليل المدخلات المرئية تمامًا كما يفعل البشر، ويدعم مهام مثل التعرف على الوجوه واكتشاف إشارات المرور وتحليل الصور الطبية.

ومع ذلك، فإن جمع مجموعات بيانات مرئية عالية الجودة وواسعة النطاق من العالم الحقيقي يمكن أن يستغرق وقتًا طويلاً ومكلفًا وغالبًا ما يثير مخاوف تتعلق بالخصوصية. لهذا السبب يستكشف الباحثون بنشاط مفهوم الاستفادة من البيانات الاصطناعية.

البيانات الاصطناعية تشير إلى المرئيات التي يتم إنشاؤها بشكل مصطنع والتي تحاكي الصور ومقاطع الفيديو الواقعية بشكل وثيق. يتم إنشاؤها باستخدام تقنيات مثل النمذجة ثلاثية الأبعاد، وعمليات المحاكاة الحاسوبية، وطرق الذكاء الاصطناعي التوليدية مثل الشبكات الخصومية التوليدية (GANs)، التي تتعلم أنماطًا من البيانات الحقيقية لإنتاج أمثلة جديدة واقعية.

من المتوقع أن تلعب البيانات الاصطناعية دورًا حاسمًا في تطوير الذكاء الاصطناعي قريبًا - حيث تتوقع Gartner أنه بحلول عام 2030، ستصبح أكثر أهمية من بيانات العالم الحقيقي. في هذه المقالة، سنستكشف ماهية البيانات الاصطناعية في سياق رؤية الكمبيوتر، وكيف يتم إنشاؤها، وأين يتم تطبيقها في سيناريوهات العالم الحقيقي. هيا بنا نبدأ!

ما هي البيانات الاصطناعية في الرؤية الحاسوبية؟

لنفترض أنك تريد تدريب نموذج ذكاء اصطناعي بصري detect الأجسام في بيئات وظروف متنوعة. قد يكون الاعتماد على بيانات العالم الواقعي فقط أمرًا صعبًا وأحيانًا يبدو محدودًا.

وفي الوقت نفسه، يمكن استخدام البيانات الاصطناعية لإنشاء مجموعة البيانات الصحيحة، التي تحتوي على كائنات في ظروف مختلفة تم إنشاؤها بشكل مصطنع. باستخدام أدوات مثل النمذجة ثلاثية الأبعاد والمحاكاة، يمكن للمطورين إنشاء صور مع تحكم دقيق في عوامل مثل الإضاءة والزوايا وموضع الكائن. وهذا بدوره يوفر مرونة أكبر لتدريب النموذج من بيانات العالم الحقيقي.

تعتبر البيانات الاصطناعية مفيدة بشكل خاص عندما يكون جمع بيانات العالم الحقيقي أمرًا صعبًا أو مستحيلًا. على سبيل المثال، يتطلب تدريب نموذج للتعرف على الأشخاص في مجموعة واسعة من الأوضاع، مثل الجري أو الانحناء أو الاستلقاء، التقاط آلاف الصور في العديد من الإعدادات والزوايا وظروف الإضاءة المختلفة.

من ناحية أخرى، باستخدام البيانات الاصطناعية، يمكن للمطورين بسهولة إنشاء هذه الاختلافات مع تسميات دقيقة، مما يوفر الوقت والجهد مع تحسين أداء النموذج.

الشكل 1. مجموعة بيانات اصطناعية بأوضاع بشرية مختلفة وتغيرات في الإضاءة (المصدر).

‍

البيانات الاصطناعية مقابل البيانات الحقيقية في الذكاء الاصطناعي

بعد ذلك، دعنا نلقي نظرة فاحصة على الاختلافات بين البيانات الاصطناعية والبيانات الحقيقية. لكل منهما إيجابياته وسلبياته عندما يتعلق الأمر بتدريب نماذج الذكاء الاصطناعي.

على سبيل المثال، تكون البيانات الاصطناعية مفيدة عندما يصعب جمع البيانات الحقيقية، ولكنها قد لا تلتقط كل التفاصيل الصغيرة الموجودة في الحياة الواقعية. في الوقت نفسه، تكون البيانات الحقيقية أكثر أصالة، ولكن قد يكون من الصعب الحصول عليها وتستغرق وقتًا طويلاً لتصنيفها وقد لا تغطي كل موقف.

من خلال الجمع بين البيانات الاصطناعية والحقيقية، يمكن للمطورين الحصول على أفضل ما في العالمين. يساعد هذا التوازن نماذج الذكاء الاصطناعي على التعلم بدقة أكبر، والتعميم بشكل أفضل عبر سيناريوهات مختلفة، وتقليل التحيز.

الشكل 2. البيانات الاصطناعية مقابل البيانات الحقيقية في الذكاء الاصطناعي. الصورة من إعداد المؤلف.

‍

نظرة على إنشاء البيانات لنماذج رؤية الحاسوب

بدءًا من بناء عوالم افتراضية باستخدام أدوات ثلاثية الأبعاد وصولًا إلى إنشاء صور باستخدام الذكاء الاصطناعي التوليدي، إليك بعض الطرق الشائعة المستخدمة لإنشاء بيانات تدريبية اصطناعية لنماذج رؤية الحاسوب:

النمذجة ثلاثية الأبعاد: يستخدم المطورون برامج ثلاثية الأبعاد لإنشاء كائنات ومشاهد رقمية. يتيح ذلك التحكم الكامل في أشياء مثل الإضاءة وزوايا الكاميرا وموضع الكائن وهو مفيد لإنشاء صور واقعية للأشخاص والمركبات والبيئات.
المحاكاة: تعيد هذه إنشاء مواقف من العالم الحقيقي، مثل حركة المرور أو بيئات المصانع، باستخدام محركات قائمة على الفيزياء. تعتبر عمليات المحاكاة مفيدة لإنشاء بيانات تدريب بأمان في مجالات مثل الروبوتات والسيارات ذاتية القيادة.
شبكات الخصومة التوليدية: GANs هي نوع من نماذج التعلم العميق تتكون من شبكتين: واحدة تنشئ الصور والأخرى تقيمها. معًا، يقومون بإنشاء صور واقعية للغاية، مثل وجوه بشرية أو مناظر للشوارع، من خلال التعلم من أمثلة حقيقية.
التوليد الإجرائي: تستخدم هذه التقنية قواعد محددة مسبقًا أو نماذج رياضية لإنشاء هياكل بصرية معقدة تلقائيًا مثل التضاريس أو المباني أو الأنسجة. غالبًا ما يتم استخدامه في منصات الألعاب والمحاكاة ويمكنه إنتاج مجموعات بيانات واسعة النطاق ومتنوعة بأقل تدخل بشري.
توزيع المجال العشوائي: يمكنه تغيير أشياء مثل الإضاءة والألوان وأشكال الكائنات في المشاهد الاصطناعية بشكل عشوائي. الهدف من هذه التقنية هو مساعدة النماذج على التركيز على ما يهم حقًا، مما يجعلها أكثر قابلية للتكيف مع البيئات الواقعية.

الشكل 3. أمثلة على البيانات: (أ) تعتمد على نموذج ثلاثي الأبعاد، (ب) مشاهد اصطناعية متعددة الأجسام، و (ج) صور مجموعة بيانات حقيقية (المصدر).

‍

تدريب نموذج الذكاء الاصطناعي البصري باستخدام البيانات الاصطناعية

الآن بعد أن ناقشنا بعض الطرق المختلفة المستخدمة لإنشاء بيانات اصطناعية، دعونا نشرح كيفية استخدامها لتدريب نماذج الذكاء الاصطناعي.

بمجرد إنشائها، يمكن عادةً دمج البيانات الاصطناعية مباشرةً في خط إنتاج التدريب بنفس طريقة بيانات العالم الحقيقي. تتضمن عادةً التعليقات التوضيحية الضرورية، مثل تسميات الكائنات أو المربعات المحيطة أو أقنعة التجزئة، مما يعني أنه يمكن استخدامها لمهام التعلم الخاضعة للإشراف، حيث تتعلم النماذج من أزواج الإدخال والإخراج المصنفة، دون الحاجة إلى التصنيف اليدوي.

أثناء التدريب، يقوم النموذج بمعالجة الصور الاصطناعية لتعلم detect السمات والتعرف على الأنماط classify الكائنات. يمكن استخدام هذه البيانات لبناء نسخة أولية من النموذج من الصفر أو لإثراء مجموعة بيانات موجودة، مما يساعد على تحسين أداء النموذج.

في العديد من سير العمل، تُستخدم البيانات الاصطناعية أيضًا للتدريب المسبق، مما يمنح النماذج فهمًا تأسيسيًا واسعًا قبل ضبطها بدقة باستخدام أمثلة من العالم الحقيقي. وبالمثل، يتم استخدامه لزيادة مجموعات البيانات عن طريق إدخال اختلافات يتم التحكم فيها، مثل ظروف الإضاءة المختلفة أو الزوايا أو فئات الكائنات النادرة، لتحسين التعميم وتقليل التجاوز.

من خلال الجمع بين البيانات الاصطناعية والحقيقية، يمكن للفرق تدريب نماذج أكثر قوة تعمل بشكل جيد عبر مجموعة واسعة من الظروف، كل ذلك مع تقليل الاعتماد على جهود جمع البيانات اليدوية التي تستغرق وقتًا طويلاً ومكلفة.

تطبيقات عملية للبيانات الاصطناعية في رؤية الحاسوب

مع ازدياد كون البيانات الاصطناعية أكثر عملية وسهولة في الوصول إليها، بدأنا نرى اعتمادها في مجموعة متنوعة من حالات استخدام Vision AI الواقعية. دعنا نستكشف بعض التطبيقات الأكثر تأثيرًا في الرؤية الحاسوبية حيث يتم استخدامها.

استخدام البيانات الاصطناعية للكشف عن الكائنات في المركبات ذاتية القيادة

يتطلب تعليم السيارات ذاتية القيادة القيادة القيادة بأمان تدريب النماذج على مجموعة واسعة من السيناريوهات، بما في ذلك المواقف النادرة أو الخطرة. ومع ذلك، فإن جمع بيانات العالم الحقيقي لهذه الحالات النادرة قد يكون صعباً وغير آمن في بعض الأحيان. يمكن أن تساعد البيانات الاصطناعية في إنشاء مشاهد يمكن للنماذج أن تتعلم فيها detect الأجسام في المواقف الصعبة. ويمكنها أيضاً محاكاة تكوينات مختلفة لأجهزة الاستشعار، وهو ما يساعد في ذلك لأن السيارات ذاتية القيادة لا تستخدم جميع السيارات ذاتية القيادة نفس الأجهزة.

تُعد منصة DRIVE Sim منNVIDIA مثالاً رائعاً على ذلك. فهي تُنشئ بيانات تركيبية عالية الجودة باستخدام نماذج ثلاثية الأبعاد واقعية وبيئات افتراضية ومحاكاة أجهزة الاستشعار. ويمكنها أيضاً توليد صور لزوايا قيادة متعددة من صورة واحدة. يساعد استخدام بيانات اصطناعية كهذه في تقليل الحاجة إلى إجراء اختبارات واقعية باهظة الثمن مع منح النموذج التنوع الذي يحتاجه للتعلم بفعالية.

الشكل 4. إنشاء طرق عرض قيادة متعددة من صورة واحدة (المصدر).

‍

تقليل التحيز في الذكاء الاصطناعي للتصوير الطبي باستخدام البيانات الاصطناعية

نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11 التي تدعم مهام مثل اكتشاف الأجسام وتجزئة النماذج يمكن تدريبها خصيصًا لتطبيقات التصوير الطبي. ومع ذلك، غالبًا ما تحتوي بيانات التدريب في العالم الحقيقي على تحيزات، حيث إنها قد لا تمثل المرضى من جميع المجموعات السكانية بشكل كافٍ.

على سبيل المثال، يتم تشخيص سرطان الجلد بشكل أقل تكرارًا لدى الأفراد ذوي درجات لون البشرة الداكنة، مما يؤدي إلى بيانات محدودة لتلك الفئات السكانية. يمكن أن يساهم هذا الاختلال في التشخيص الخاطئ وعدم المساواة في نتائج الرعاية الصحية، لا سيما في مجالات مثل علم الأنسجة المرضية والأشعة السينية على الصدر والأمراض الجلدية.

يمكن أن تلعب الصور الاصطناعية دورًا في اتخاذ خطوة نحو سد هذه الفجوة في البيانات. من خلال إنشاء أمثلة إضافية ومتنوعة، مثل التشوهات المتنوعة في الأنسجة، ومجموعة واسعة من حالات الرئة، ودرجات لون البشرة مع أنواع مختلفة من الآفات، يمكن أن تساعد البيانات الاصطناعية في تحسين أداء النموذج عبر المجموعات الممثلة تمثيلاً ناقصًا.

يعمل الباحثون حاليًا على تطوير والتحقق من صحة مجموعات البيانات الاصطناعية لدعم هذه الأهداف. كما أنهم يستكشفون كيف يمكن استخدام البيانات الاصطناعية لاختبار الأدوات الطبية واستراتيجيات العلاج دون الاعتماد على سجلات المرضى الحقيقية، مما يساعد على تسريع البحث مع حماية خصوصية المرضى. من خلال هذا العمل، تمهد البيانات الاصطناعية الطريق لأنظمة ذكاء اصطناعي طبية أكثر شمولاً ودقة وأخلاقية.

النهوض بالذكاء الاصطناعي الزراعي ببيانات اصطناعية للزراعة الدقيقة

يعتمد بناء أنظمة الذكاء الاصطناعي البصري للتطبيقات الزراعية على الوصول إلى كميات كبيرة من البيانات المصنفة. ومع ذلك، فإن جمع وتصنيف صور المحاصيل والأمراض وظروف الحقول أمر بطيء ومكلف وغالبًا ما يكون محدودًا بأشياء مثل الطقس أو مواسم النمو أو مدى صعوبة الوصول إلى مناطق معينة.

تجعل هذه التحديات من الصعب تدريب نماذج رؤية الكمبيوتر للتعامل مع مهام مثل اكتشاف أمراض النباتات، ومراقبة المحاصيل، أو التنبؤ بالغلة. هذا هو المكان الذي يمكن أن تساعد فيه البيانات الاصطناعية - من خلال محاكاة البيئات الزراعية المختلفة لإنشاء أمثلة تدريب مفيدة.

الشكل 5. استخدام الصور الاصطناعية لتحسين الكشف عن الأمراض (المصدر).

‍

النقاط الرئيسية

يمثل استخدام البيانات الاصطناعية خطوة مهمة إلى الأمام في تدريب نماذج الذكاء الاصطناعي، وخاصة لأنظمة رؤية الكمبيوتر في المجالات التي تكون فيها بيانات العالم الحقيقي محدودة أو يصعب الحصول عليها. بدلاً من الاعتماد فقط على الصور أو مقاطع الفيديو الحقيقية، والتي قد تكون مكلفة أو تستغرق وقتًا طويلاً أو تثير مخاوف تتعلق بالخصوصية، تسمح لنا البيانات الاصطناعية بإنشاء صور واقعية ومصنفة حسب الطلب.

إنه يسهل تدريب نماذج Vision AI لمهام مثل القيادة الذاتية أو الكشف عن الأمراض أو مراقبة المحاصيل. مع استمرار تطور الذكاء الاصطناعي، من المقرر أن تلعب البيانات الاصطناعية دورًا أكبر في تسريع الابتكار وتحسين إمكانية الوصول عبر الصناعات.

تعرف على المزيد حول الذكاء الاصطناعي على مستودع GitHub الخاص بنا وانضم إلى مجتمعنا المتنامي. اكتشف تأثير التطبيقات مثل الذكاء الاصطناعي في المركبات ذاتية القيادة و الرؤية الحاسوبية في الزراعة. استكشف خيارات الترخيص الخاصة بنا واجعل مشاريع Vision AI الخاصة بك تنبض بالحياة.

ما هي البيانات الاصطناعية في الرؤية الحاسوبية؟ نظرة عامة

ما هي البيانات الاصطناعية في الرؤية الحاسوبية؟

البيانات الاصطناعية مقابل البيانات الحقيقية في الذكاء الاصطناعي

نظرة على إنشاء البيانات لنماذج رؤية الحاسوب

تدريب نموذج الذكاء الاصطناعي البصري باستخدام البيانات الاصطناعية

تطبيقات عملية للبيانات الاصطناعية في رؤية الحاسوب

استخدام البيانات الاصطناعية للكشف عن الكائنات في المركبات ذاتية القيادة

تقليل التحيز في الذكاء الاصطناعي للتصوير الطبي باستخدام البيانات الاصطناعية

النهوض بالذكاء الاصطناعي الزراعي ببيانات اصطناعية للزراعة الدقيقة

النقاط الرئيسية

اقرأ المزيد في هذه الفئة

ما هو تقدير العمق الأحادي العين؟ نظرة عامة

ما هو حساب الصور؟ مقدمة سريعة

ما هو مطابقة القوالب؟ دليل سريع

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ما هي البيانات الاصطناعية في الرؤية الحاسوبية؟ نظرة عامة

ما هي البيانات الاصطناعية في الرؤية الحاسوبية؟

البيانات الاصطناعية مقابل البيانات الحقيقية في الذكاء الاصطناعي

نظرة على إنشاء البيانات لنماذج رؤية الحاسوب

تدريب نموذج الذكاء الاصطناعي البصري باستخدام البيانات الاصطناعية

تطبيقات عملية للبيانات الاصطناعية في رؤية الحاسوب

استخدام البيانات الاصطناعية للكشف عن الكائنات في المركبات ذاتية القيادة

تقليل التحيز في الذكاء الاصطناعي للتصوير الطبي باستخدام البيانات الاصطناعية

النهوض بالذكاء الاصطناعي الزراعي ببيانات اصطناعية للزراعة الدقيقة

النقاط الرئيسية

اقرأ المزيد في هذه الفئة

ما هو تقدير العمق الأحادي العين؟ نظرة عامة

ما هو حساب الصور؟ مقدمة سريعة

ما هو مطابقة القوالب؟ دليل سريع

لنبنِ مستقبل الذكاء الاصطناعي معًا!

لنبنِ مستقبل
الذكاء الاصطناعي معًا!