يولو فيجن شنتشن
شنتشن
انضم الآن

استكشاف أنواع مختلفة من البيانات لتطبيقات الرؤية الاصطناعية

أبيرامي فينا

4 دقائق قراءة

9 مايو 2025

اكتشف كيف تتيح أنواع البيانات المرئية مثل التصوير الحراري و LiDAR والصور بالأشعة تحت الحمراء تطبيقات رؤية حاسوبية متنوعة عبر مختلف الصناعات.

كانت التقنيات مثل الطائرات بدون طيار محدودة ولا يمكن الوصول إليها إلا للباحثين والمتخصصين، ولكن في الوقت الحاضر، أصبحت الأجهزة المتطورة في متناول جمهور أوسع. هذا التحول يغير الطريقة التي نجمع بها البيانات المرئية. مع توفر المزيد من التقنيات، يمكننا الآن التقاط الصور ومقاطع الفيديو من مجموعة متنوعة من المصادر، بخلاف الكاميرات التقليدية فقط.

بالتوازي مع ذلك، فإن تحليلات الصور، التي تم تمكينها بواسطة الرؤية الحاسوبية، وهي فرع من فروع الذكاء الاصطناعي (AI)، تتطور بسرعة، مما يسمح للآلات بتفسير ومعالجة البيانات المرئية بشكل أكثر فعالية. وقد فتح هذا التقدم إمكانيات جديدة للأتمتة والكشف عن الأجسام والتحليل في الوقت الفعلي. يمكن للآلات الآن التعرف على الأنماط وتتبع الحركة وفهم المدخلات المرئية المعقدة.

تتضمن بعض الأنواع الرئيسية من البيانات المرئية صور RGB (أحمر، أخضر، أزرق)، والتي تستخدم بشكل شائع للتعرف على الأجسام، والتصوير الحراري، الذي يساعد على اكتشاف التوقيعات الحرارية في ظروف الإضاءة المنخفضة، وبيانات العمق، التي تمكن الآلات من فهم البيئات ثلاثية الأبعاد. يلعب كل نوع من هذه الأنواع من البيانات دورًا حيويًا في تشغيل تطبيقات مختلفة للرؤية الاصطناعية (Vision AI)، بدءًا من المراقبة وحتى التصوير الطبي.

في هذه المقالة، سوف نستكشف الأنواع الرئيسية من البيانات المرئية المستخدمة في الرؤية الاصطناعية (Vision AI) ونستكشف كيف يساهم كل منها في تحسين الدقة والكفاءة والأداء عبر مختلف الصناعات. هيا بنا نبدأ!

النوع الأكثر شيوعًا من مجموعات بيانات صور وفيديو الذكاء الاصطناعي

عادةً، عندما تستخدم هاتفًا ذكيًا لالتقاط صورة أو عرض لقطات CCTV، فإنك تتعامل مع صور RGB. يرمز RGB إلى الأحمر والأخضر والأزرق، وهي قنوات الألوان الثلاث التي تمثل المعلومات المرئية في الصور الرقمية. 

تعتبر صور ومقاطع فيديو RGB أنواعًا وثيقة الصلة من البيانات المرئية المستخدمة في الرؤية الحاسوبية، وكلاهما يتم التقاطه باستخدام كاميرات قياسية. والفرق الرئيسي هو أن الصور تلتقط لحظة واحدة، بينما مقاطع الفيديو عبارة عن سلسلة من الإطارات التي توضح كيف تتغير الأشياء بمرور الوقت.

تستخدم صور RGB بشكل عام في مهام الرؤية الحاسوبية مثل الكشف عن الأجسام وتقسيم المثيلات وتقدير الوضع، بدعم من نماذج مثل Ultralytics YOLO11. تعتمد هذه التطبيقات على تحديد الأنماط أو الأشكال أو الميزات المحددة في إطار واحد. 

من ناحية أخرى، تعتبر مقاطع الفيديو ضرورية عندما تكون الحركة أو الوقت عاملاً، كما هو الحال بالنسبة للتعرف على الإيماءات أو المراقبة أو تتبع الإجراءات. نظرًا لأنه يمكن اعتبار مقاطع الفيديو سلسلة من الصور، فإن نماذج الرؤية الحاسوبية مثل YOLO11 تعالجها إطارًا تلو الآخر لفهم الحركة والسلوك بمرور الوقت.

على سبيل المثال، يمكن استخدام YOLO11 لتحليل صور أو مقاطع فيديو RGB لاكتشاف الأعشاب الضارة وعد النباتات في الحقول الزراعية. يعزز هذا مراقبة المحاصيل ويساعد على تتبع التغيرات عبر دورات النمو لإدارة المزرعة بشكل أكثر كفاءة.

الشكل 1. يمكن لـ YOLO11 اكتشاف وعدّ النباتات لمراقبة المحاصيل بشكل أكثر ذكاءً.

بيانات العمق في مجال الذكاء الاصطناعي البصري: LiDAR والإدراك ثلاثي الأبعاد

تضيف بيانات العمق بعدًا ثالثًا إلى المعلومات المرئية من خلال الإشارة إلى مدى بعد الأجسام عن الكاميرا أو المستشعر. على عكس صور RGB التي تلتقط اللون والملمس فقط، توفر بيانات العمق سياقًا مكانيًا. إنها تعرض المسافة بين الأجسام والكاميرا، مما يجعل من الممكن تفسير التصميم ثلاثي الأبعاد للمشهد.

يتم التقاط هذا النوع من البيانات باستخدام تقنيات مثل LiDAR، والرؤية المجسمة (باستخدام كاميرتين لتقليد إدراك العمق البشري)، وكاميرات Time-of-Flight (قياس الوقت الذي يستغرقه الضوء للانتقال إلى الجسم والعودة). 

من بين هذه التقنيات، غالبًا ما تكون LiDAR (الكشف عن الضوء وتحديد المدى) هي الأكثر موثوقية لقياس العمق. وهي تعمل عن طريق إرسال نبضات ليزر سريعة وقياس المدة التي تستغرقها للارتداد. والنتيجة هي خريطة ثلاثية الأبعاد دقيقة للغاية، تُعرف باسم سحابة النقاط، والتي تبرز شكل وموضع ومسافة الأجسام في الوقت الفعلي.

الدور المتزايد لـ LiDAR في أنظمة الذكاء الاصطناعي البصري

يمكن تقسيم تقنية LiDAR إلى نوعين رئيسيين، تم تصميم كل منهما لتطبيقات وبيئات محددة. فيما يلي نظرة فاحصة على كلا النوعين:

  • LiDAR المحمولة جوًا: تُستخدم ماسحات LiDAR المحمولة جوًا بشكل عام لرسم خرائط لمناطق واسعة، ويتم تركيبها على طائرات بدون طيار أو طائرات لالتقاط بيانات عالية الدقة لرسم الخرائط الطبوغرافية واسعة النطاق. وهي مثالية لمسح التضاريس والغابات والمناظر الطبيعية.

  • LiDAR الأرضية: يتم جمع هذا النوع من بيانات LiDAR من أجهزة استشعار مثبتة على مركبات أو منصات ثابتة لتطبيقات مثل مراقبة البنية التحتية والبناء ورسم الخرائط الداخلية. وهي توفر بيانات مفصلة للغاية لمناطق أصغر ومحلية، مما يجعلها مفيدة لمهام مثل تخطيط المدن ومسح الهياكل المحددة.

أحد التطبيقات المؤثرة لبيانات LiDAR هو في المركبات ذاتية القيادة، حيث تلعب دورًا رئيسيًا في مهام مثل اكتشاف المسار وتجنب الاصطدام وتحديد الأجسام القريبة. تقوم LiDAR بإنشاء خرائط ثلاثية الأبعاد مفصلة وفي الوقت الفعلي للبيئة، مما يمكّن السيارة من رؤية الأجسام وحساب المسافة بينها والتنقل بأمان.

الشكل 2. تمكن تقنية LiDAR المركبات ذاتية القيادة من رسم خرائط العمق واكتشاف الأجسام.

استخدام البيانات الحرارية والأشعة تحت الحمراء في تطبيقات الذكاء الاصطناعي

تلتقط صور RGB ما نراه في طيف الضوء المرئي؛ ومع ذلك، فإن تقنيات التصوير الأخرى، مثل التصوير الحراري والأشعة تحت الحمراء، تتجاوز ذلك. يلتقط تصوير الأشعة تحت الحمراء ضوء الأشعة تحت الحمراء المنبعث أو المنعكس من الأجسام، مما يجعله مفيدًا في ظروف الإضاءة المنخفضة.

على النقيض من ذلك، يكتشف التصوير الحراري الحرارة المنبعثة من الأجسام ويظهر اختلافات في درجة الحرارة، مما يسمح له بالعمل في الظلام الدامس أو من خلال الدخان والضباب والعوائق الأخرى. هذا النوع من البيانات مفيد بشكل خاص لمراقبة المشكلات واكتشافها، خاصة في الصناعات التي يمكن أن تشير فيها التغيرات في درجة الحرارة إلى مشاكل محتملة.

أحد الأمثلة المثيرة للاهتمام هو استخدام التصوير الحراري لمراقبة المكونات الكهربائية بحثًا عن علامات ارتفاع درجة الحرارة. من خلال اكتشاف الاختلافات في درجة الحرارة، يمكن للكاميرات الحرارية تحديد المشكلات قبل أن تؤدي إلى فشل المعدات أو الحرائق أو الأضرار المكلفة. 

الشكل 3. مثال على استخدام التصوير الحراري لمراقبة المكونات الكهربائية.

وبالمثل، يمكن أن تساعد صور الأشعة تحت الحمراء في اكتشاف التسربات في خطوط الأنابيب أو العزل عن طريق تحديد الاختلافات في درجة الحرارة التي تشير إلى تسرب الغازات أو السوائل، وهو أمر بالغ الأهمية لمنع المواقف الخطرة وتحسين كفاءة الطاقة.

التصوير متعدد الأطياف وفائق الأطياف في الذكاء الاصطناعي

بينما يلتقط التصوير بالأشعة تحت الحمراء والتصوير الحراري جوانب محددة من الطيف الكهرومغناطيسي، فإن التصوير متعدد الأطياف يجمع الضوء من نطاقات قليلة مختارة من الأطوال الموجية، يتم اختيار كل منها لغرض معين، مثل اكتشاف الغطاء النباتي الصحي أو تحديد مواد السطح. 

يخطو التصوير فائق الأطياف خطوة أخرى إلى الأمام من خلال التقاط الضوء عبر مئات النطاقات الضيقة جدًا والمستمرة من الأطوال الموجية. يوفر هذا توقيعًا ضوئيًا مفصلاً لكل بكسل في الصورة، مما يوفر فهمًا أعمق بكثير لأي مادة تتم ملاحظتها.

الشكل 4. مقارنة التصوير متعدد الأطياف والتصوير فائق الأطياف.

يستخدم كل من التصوير متعدد الأطياف والتصوير فائق الأطياف أجهزة استشعار وفلاتر خاصة لالتقاط الضوء بأطوال موجية مختلفة. ثم يتم تنظيم البيانات في هيكل ثلاثي الأبعاد يسمى المكعب الطيفي، حيث تمثل كل طبقة طولًا موجيًا مختلفًا. 

يمكن لنماذج الذكاء الاصطناعي تحليل هذه البيانات لاكتشاف الميزات التي لا تستطيع الكاميرات العادية أو العين البشرية رؤيتها. على سبيل المثال، في النمط الظاهري للنبات، يمكن استخدام التصوير فائق الأطياف لمراقبة صحة ونمو النباتات عن طريق اكتشاف التغيرات الطفيفة في أوراقها أو سيقانها، مثل نقص المغذيات أو الإجهاد. يساعد هذا الباحثين على تقييم صحة النبات وتحسين الممارسات الزراعية دون الحاجة إلى طرق جراحية.

تحليل صور الرادار والسونار باستخدام الذكاء الاصطناعي

تصوير الرادار والسونار هما تقنيتان تكتشفان وتحددان الأجسام عن طريق إرسال إشارات وتحليل انعكاساتها، على غرار LiDAR. على عكس تصوير RGB، الذي يعتمد على الموجات الضوئية لالتقاط المعلومات المرئية، يستخدم الرادار الموجات الكهرومغناطيسية، وعادةً ما تكون موجات الراديو، بينما يستخدم السونار الموجات الصوتية. يرسل كل من أنظمة الرادار والسونار نبضات ويقيس الوقت الذي تستغرقه الإشارة للارتداد من الجسم، مما يوفر معلومات حول المسافة والحجم والسرعة.

تعتبر صور الرادار مفيدة بشكل خاص عندما تكون الرؤية ضعيفة، كما هو الحال أثناء الضباب أو المطر أو في الليل. نظرًا لأنه لا يعتمد على الضوء، فإنه يمكنه اكتشاف الطائرات أو المركبات أو التضاريس في الظلام الدامس. وهذا يجعل الرادار خيارًا موثوقًا به في مجال الطيران، ومراقبة الأحوال الجوية، والملاحة الذاتية.

بالمقارنة، يشيع استخدام التصوير بالسونار في البيئات تحت الماء حيث لا يمكن للضوء الوصول. يستخدم الموجات الصوتية التي تنتقل عبر الماء وترتد عن الأجسام المغمورة، مما يسمح بالكشف عن الغواصات، ورسم خرائط قاع المحيطات، وتنفيذ مهام الإنقاذ تحت الماء. تتيح التطورات في مجال الرؤية الحاسوبية الآن زيادة تحسين الكشف تحت الماء من خلال الجمع بين بيانات السونار والتحليل الذكي لتحسين الكشف واتخاذ القرارات.

الشكل 5. كيف يستخدم نظام السونار نبضات الموجات فوق الصوتية لقياس عمق البحر.

بيانات بصرية اصطناعية ومحاكاة لتدريب نماذج الذكاء الاصطناعي

حتى الآن، كانت الأنواع المختلفة من البيانات التي ناقشناها هي تلك التي يمكن جمعها من العالم الحقيقي. ومع ذلك، فإن البيانات البصرية الاصطناعية والمحاكاة هي نوعان من المحتوى الاصطناعي. يتم إنشاء البيانات الاصطناعية من الصفر باستخدام النمذجة ثلاثية الأبعاد أو الذكاء الاصطناعي التوليدي لإنتاج صور أو مقاطع فيديو ذات مظهر واقعي. 

الشكل 6. نظرة على الصور المولدة اصطناعياً.

البيانات المحاكاة مماثلة ولكنها تنطوي على إنشاء بيئات افتراضية تحاكي كيفية تصرف العالم المادي، بما في ذلك انعكاس الضوء وتكوين الظلال وحركة الكائنات. في حين أن جميع البيانات البصرية المحاكاة هي بيانات اصطناعية، إلا أنه ليست كل البيانات الاصطناعية محاكاة. والفرق الرئيسي هو أن البيانات المحاكاة تكرر السلوك الواقعي، وليس المظهر فقط.

تعتبر هذه الأنواع من البيانات مفيدة لتدريب نماذج الرؤية الحاسوبية، خاصة عندما يكون من الصعب جمع البيانات الواقعية أو عندما تحتاج إلى محاكاة مواقف معينة ونادرة. يمكن للمطورين إنشاء مشاهد كاملة، واختيار أنواع الكائنات ومواقعها وإضاءتها، وإضافة تسميات تلقائيًا مثل المربعات المحيطة للتدريب. يساعد هذا في بناء مجموعات بيانات كبيرة ومتنوعة بسرعة، دون الحاجة إلى صور حقيقية أو وضع العلامات اليدوية، والتي قد تكون مكلفة وتستغرق وقتًا طويلاً.

على سبيل المثال، في مجال الرعاية الصحية، يمكن استخدام البيانات الاصطناعية لتدريب النماذج على تقسيم خلايا سرطان الثدي، حيث يصعب جمع وتسمية مجموعات بيانات كبيرة من الصور الحقيقية. توفر البيانات الاصطناعية والمحاكاة المرونة والتحكم، مما يسد الفجوات حيث تكون المرئيات الواقعية محدودة.

اختيار النوع المناسب من البيانات المرئية لتطبيق الذكاء الاصطناعي الخاص بك

الآن بعد أن نظرنا في كيفية عمل الأنواع المختلفة من البيانات المرئية وما يمكنها فعله، دعنا نلقي نظرة فاحصة على أنواع البيانات الأفضل لمهام محددة:

  • صور RGB: إنها مثالية لمهام الرؤية الحاسوبية العامة مثل تصنيف الصور واكتشاف الكائنات. تلتقط اللون والملمس ولكنها محدودة في الظروف الصعبة مثل الإضاءة المنخفضة أو ضعف الرؤية.

  • التصوير بالليدار (LiDAR): يوفر هذا النوع من التصوير رسم خرائط ثلاثي الأبعاد عالي الدقة باستخدام نبضات الليزر. إنه رائع للتطبيقات التي تتطلب قياسات دقيقة للمسافة، مثل الروبوتات والمركبات ذاتية القيادة وفحص البنية التحتية.
  • التصوير الحراري: نظرًا لأنه يمكنه اكتشاف اختلافات درجة الحرارة، فهو مفيد في ظروف الرؤية المنخفضة، مثل المراقبة الليلية أو مكافحة الحرائق أو اكتشاف تسربات الحرارة في الآلات والمباني.
  • التصوير متعدد الأطياف وفائق الأطياف: إنه مفيد للمهام التي تتطلب تحليلًا تفصيليًا للمواد، مثل المراقبة الزراعية أو مراقبة الجودة الصيدلانية أو الاستشعار عن بعد. توفر هذه الطرق رؤى أعمق من خلال التقاط البيانات عبر مجموعة واسعة من الأطوال الموجية تتجاوز الضوء المرئي.

  • تصوير الرادار والسونار: يفضل استخدامها في البيئات منخفضة الرؤية. يستخدم الرادار موجات الراديو وهو مفيد في مجال الطيران والملاحة، بينما يستخدم السونار الموجات الصوتية للتشغيل للكشف تحت الماء.

  • بيانات مرئية اصطناعية ومحاكاة: إنها مثالية لتدريب نماذج الذكاء الاصطناعي عندما تكون البيانات الواقعية محدودة أو غير متوفرة أو يصعب تسميتها. تساعد هذه المرئيات الاصطناعية في بناء مجموعات بيانات متنوعة لسيناريوهات معقدة مثل الأحداث النادرة أو الظروف الحرجة للسلامة.

في بعض الأحيان، قد لا يوفر نوع واحد من البيانات دقة أو سياقًا كافيًا في المواقف الواقعية. هذا هو المكان الذي يصبح فيه دمج أجهزة الاستشعار متعدد الوسائط أمرًا أساسيًا. من خلال الجمع بين RGB وأنواع البيانات الأخرى مثل الحرارة أو العمق أو الليدار، يمكن للأنظمة التغلب على القيود الفردية، وتحسين الموثوقية والقدرة على التكيف. 

على سبيل المثال، في أتمتة المستودعات، فإن استخدام RGB للتعرف على الكائنات، والعمق لقياس المسافة، والحرارة لاكتشاف المعدات المحمومة يجعل العمليات أكثر كفاءة وأمانًا. في النهاية، تأتي أفضل النتائج من تحديد أو دمج أنواع البيانات بناءً على الاحتياجات المحددة لتطبيقك.

النقاط الرئيسية

عند بناء نماذج Vision AI، يعد اختيار النوع المناسب من البيانات المرئية أمرًا بالغ الأهمية. لا تعتمد مهام مثل اكتشاف الكائنات وتقسيمها وتتبع الحركة على الخوارزميات فحسب، بل تعتمد أيضًا على جودة بيانات الإدخال. تساعد مجموعات البيانات النظيفة والمتنوعة والدقيقة على تقليل الضوضاء وتحسين الأداء.

من خلال الجمع بين أنواع البيانات مثل RGB والعمق والحرارة والليدار، تكتسب أنظمة الذكاء الاصطناعي رؤية أكثر اكتمالاً للبيئة، مما يجعلها أكثر موثوقية في مختلف الظروف. مع استمرار تحسن التكنولوجيا، فمن المحتمل أن يمهد الطريق لكي يصبح Vision AI أسرع وأكثر قابلية للتكيف وأكثر تأثيرًا عبر الصناعات.

انضم إلى مجتمعنا واستكشف مستودع GitHub الخاص بنا لمعرفة المزيد حول الرؤية الحاسوبية. اكتشف التطبيقات المختلفة المتعلقة بـ الذكاء الاصطناعي في الرعاية الصحية و الرؤية الحاسوبية في مجال البيع بالتجزئة في صفحات الحلول الخاصة بنا. تحقق من خيارات الترخيص الخاصة بنا للبدء في Vision AI.

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا
تم نسخ الرابط إلى الحافظة