اكتشف كيف تتيح أنواع البيانات المرئية مثل التصوير الحراري و LiDAR والصور بالأشعة تحت الحمراء تطبيقات رؤية حاسوبية متنوعة عبر مختلف الصناعات.
اكتشف كيف تتيح أنواع البيانات المرئية مثل التصوير الحراري و LiDAR والصور بالأشعة تحت الحمراء تطبيقات رؤية حاسوبية متنوعة عبر مختلف الصناعات.
كانت التقنيات مثل الطائرات بدون طيار محدودة ولا يمكن الوصول إليها إلا للباحثين والمتخصصين، ولكن في الوقت الحاضر، أصبحت الأجهزة المتطورة في متناول جمهور أوسع. هذا التحول يغير الطريقة التي نجمع بها البيانات المرئية. مع توفر المزيد من التقنيات، يمكننا الآن التقاط الصور ومقاطع الفيديو من مجموعة متنوعة من المصادر، بخلاف الكاميرات التقليدية فقط.
بالتوازي مع ذلك، فإن تحليلات الصور، التي تم تمكينها بواسطة الرؤية الحاسوبية، وهي فرع من فروع الذكاء الاصطناعي (AI)، تتطور بسرعة، مما يسمح للآلات بتفسير ومعالجة البيانات المرئية بشكل أكثر فعالية. وقد فتح هذا التقدم إمكانيات جديدة للأتمتة والكشف عن الأجسام والتحليل في الوقت الفعلي. يمكن للآلات الآن التعرف على الأنماط وتتبع الحركة وفهم المدخلات المرئية المعقدة.
تتضمن بعض الأنواع الرئيسية من البيانات المرئية صور RGB (أحمر، أخضر، أزرق)، والتي تستخدم بشكل شائع للتعرف على الأجسام، والتصوير الحراري، الذي يساعد على اكتشاف التوقيعات الحرارية في ظروف الإضاءة المنخفضة، وبيانات العمق، التي تمكن الآلات من فهم البيئات ثلاثية الأبعاد. يلعب كل نوع من هذه الأنواع من البيانات دورًا حيويًا في تشغيل تطبيقات مختلفة للرؤية الاصطناعية (Vision AI)، بدءًا من المراقبة وحتى التصوير الطبي.
في هذه المقالة، سوف نستكشف الأنواع الرئيسية من البيانات المرئية المستخدمة في الرؤية الاصطناعية (Vision AI) ونستكشف كيف يساهم كل منها في تحسين الدقة والكفاءة والأداء عبر مختلف الصناعات. هيا بنا نبدأ!
عادةً، عندما تستخدم هاتفًا ذكيًا لالتقاط صورة أو عرض لقطات CCTV، فإنك تتعامل مع صور RGB. يرمز RGB إلى الأحمر والأخضر والأزرق، وهي قنوات الألوان الثلاث التي تمثل المعلومات المرئية في الصور الرقمية.
تعتبر صور ومقاطع فيديو RGB أنواعًا وثيقة الصلة من البيانات المرئية المستخدمة في الرؤية الحاسوبية، وكلاهما يتم التقاطه باستخدام كاميرات قياسية. والفرق الرئيسي هو أن الصور تلتقط لحظة واحدة، بينما مقاطع الفيديو عبارة عن سلسلة من الإطارات التي توضح كيف تتغير الأشياء بمرور الوقت.
تستخدم صور RGB بشكل عام في مهام الرؤية الحاسوبية مثل الكشف عن الأجسام وتقسيم المثيلات وتقدير الوضع، بدعم من نماذج مثل Ultralytics YOLO11. تعتمد هذه التطبيقات على تحديد الأنماط أو الأشكال أو الميزات المحددة في إطار واحد.
من ناحية أخرى، تعتبر مقاطع الفيديو ضرورية عندما تكون الحركة أو الوقت عاملاً، كما هو الحال بالنسبة للتعرف على الإيماءات أو المراقبة أو تتبع الإجراءات. نظرًا لأنه يمكن اعتبار مقاطع الفيديو سلسلة من الصور، فإن نماذج الرؤية الحاسوبية مثل YOLO11 تعالجها إطارًا تلو الآخر لفهم الحركة والسلوك بمرور الوقت.
على سبيل المثال، يمكن استخدام YOLO11 لتحليل صور أو مقاطع فيديو RGB لاكتشاف الأعشاب الضارة وعد النباتات في الحقول الزراعية. يعزز هذا مراقبة المحاصيل ويساعد على تتبع التغيرات عبر دورات النمو لإدارة المزرعة بشكل أكثر كفاءة.

تضيف بيانات العمق بعدًا ثالثًا إلى المعلومات المرئية من خلال الإشارة إلى مدى بعد الأجسام عن الكاميرا أو المستشعر. على عكس صور RGB التي تلتقط اللون والملمس فقط، توفر بيانات العمق سياقًا مكانيًا. إنها تعرض المسافة بين الأجسام والكاميرا، مما يجعل من الممكن تفسير التصميم ثلاثي الأبعاد للمشهد.
يتم التقاط هذا النوع من البيانات باستخدام تقنيات مثل LiDAR، والرؤية المجسمة (باستخدام كاميرتين لتقليد إدراك العمق البشري)، وكاميرات Time-of-Flight (قياس الوقت الذي يستغرقه الضوء للانتقال إلى الجسم والعودة).
من بين هذه التقنيات، غالبًا ما تكون LiDAR (الكشف عن الضوء وتحديد المدى) هي الأكثر موثوقية لقياس العمق. وهي تعمل عن طريق إرسال نبضات ليزر سريعة وقياس المدة التي تستغرقها للارتداد. والنتيجة هي خريطة ثلاثية الأبعاد دقيقة للغاية، تُعرف باسم سحابة النقاط، والتي تبرز شكل وموضع ومسافة الأجسام في الوقت الفعلي.
يمكن تقسيم تقنية LiDAR إلى نوعين رئيسيين، تم تصميم كل منهما لتطبيقات وبيئات محددة. فيما يلي نظرة فاحصة على كلا النوعين:
أحد التطبيقات المؤثرة لبيانات LiDAR هو في المركبات ذاتية القيادة، حيث تلعب دورًا رئيسيًا في مهام مثل اكتشاف المسار وتجنب الاصطدام وتحديد الأجسام القريبة. تقوم LiDAR بإنشاء خرائط ثلاثية الأبعاد مفصلة وفي الوقت الفعلي للبيئة، مما يمكّن السيارة من رؤية الأجسام وحساب المسافة بينها والتنقل بأمان.

تلتقط صور RGB ما نراه في طيف الضوء المرئي؛ ومع ذلك، فإن تقنيات التصوير الأخرى، مثل التصوير الحراري والأشعة تحت الحمراء، تتجاوز ذلك. يلتقط تصوير الأشعة تحت الحمراء ضوء الأشعة تحت الحمراء المنبعث أو المنعكس من الأجسام، مما يجعله مفيدًا في ظروف الإضاءة المنخفضة.
على النقيض من ذلك، يكتشف التصوير الحراري الحرارة المنبعثة من الأجسام ويظهر اختلافات في درجة الحرارة، مما يسمح له بالعمل في الظلام الدامس أو من خلال الدخان والضباب والعوائق الأخرى. هذا النوع من البيانات مفيد بشكل خاص لمراقبة المشكلات واكتشافها، خاصة في الصناعات التي يمكن أن تشير فيها التغيرات في درجة الحرارة إلى مشاكل محتملة.
أحد الأمثلة المثيرة للاهتمام هو استخدام التصوير الحراري لمراقبة المكونات الكهربائية بحثًا عن علامات ارتفاع درجة الحرارة. من خلال اكتشاف الاختلافات في درجة الحرارة، يمكن للكاميرات الحرارية تحديد المشكلات قبل أن تؤدي إلى فشل المعدات أو الحرائق أو الأضرار المكلفة.

وبالمثل، يمكن أن تساعد صور الأشعة تحت الحمراء في اكتشاف التسربات في خطوط الأنابيب أو العزل عن طريق تحديد الاختلافات في درجة الحرارة التي تشير إلى تسرب الغازات أو السوائل، وهو أمر بالغ الأهمية لمنع المواقف الخطرة وتحسين كفاءة الطاقة.
بينما يلتقط التصوير بالأشعة تحت الحمراء والتصوير الحراري جوانب محددة من الطيف الكهرومغناطيسي، فإن التصوير متعدد الأطياف يجمع الضوء من نطاقات قليلة مختارة من الأطوال الموجية، يتم اختيار كل منها لغرض معين، مثل اكتشاف الغطاء النباتي الصحي أو تحديد مواد السطح.
يخطو التصوير فائق الأطياف خطوة أخرى إلى الأمام من خلال التقاط الضوء عبر مئات النطاقات الضيقة جدًا والمستمرة من الأطوال الموجية. يوفر هذا توقيعًا ضوئيًا مفصلاً لكل بكسل في الصورة، مما يوفر فهمًا أعمق بكثير لأي مادة تتم ملاحظتها.

يستخدم كل من التصوير متعدد الأطياف والتصوير فائق الأطياف أجهزة استشعار وفلاتر خاصة لالتقاط الضوء بأطوال موجية مختلفة. ثم يتم تنظيم البيانات في هيكل ثلاثي الأبعاد يسمى المكعب الطيفي، حيث تمثل كل طبقة طولًا موجيًا مختلفًا.
يمكن لنماذج الذكاء الاصطناعي تحليل هذه البيانات لاكتشاف الميزات التي لا تستطيع الكاميرات العادية أو العين البشرية رؤيتها. على سبيل المثال، في النمط الظاهري للنبات، يمكن استخدام التصوير فائق الأطياف لمراقبة صحة ونمو النباتات عن طريق اكتشاف التغيرات الطفيفة في أوراقها أو سيقانها، مثل نقص المغذيات أو الإجهاد. يساعد هذا الباحثين على تقييم صحة النبات وتحسين الممارسات الزراعية دون الحاجة إلى طرق جراحية.
تصوير الرادار والسونار هما تقنيتان تكتشفان وتحددان الأجسام عن طريق إرسال إشارات وتحليل انعكاساتها، على غرار LiDAR. على عكس تصوير RGB، الذي يعتمد على الموجات الضوئية لالتقاط المعلومات المرئية، يستخدم الرادار الموجات الكهرومغناطيسية، وعادةً ما تكون موجات الراديو، بينما يستخدم السونار الموجات الصوتية. يرسل كل من أنظمة الرادار والسونار نبضات ويقيس الوقت الذي تستغرقه الإشارة للارتداد من الجسم، مما يوفر معلومات حول المسافة والحجم والسرعة.
تعتبر صور الرادار مفيدة بشكل خاص عندما تكون الرؤية ضعيفة، كما هو الحال أثناء الضباب أو المطر أو في الليل. نظرًا لأنه لا يعتمد على الضوء، فإنه يمكنه اكتشاف الطائرات أو المركبات أو التضاريس في الظلام الدامس. وهذا يجعل الرادار خيارًا موثوقًا به في مجال الطيران، ومراقبة الأحوال الجوية، والملاحة الذاتية.
بالمقارنة، يشيع استخدام التصوير بالسونار في البيئات تحت الماء حيث لا يمكن للضوء الوصول. يستخدم الموجات الصوتية التي تنتقل عبر الماء وترتد عن الأجسام المغمورة، مما يسمح بالكشف عن الغواصات، ورسم خرائط قاع المحيطات، وتنفيذ مهام الإنقاذ تحت الماء. تتيح التطورات في مجال الرؤية الحاسوبية الآن زيادة تحسين الكشف تحت الماء من خلال الجمع بين بيانات السونار والتحليل الذكي لتحسين الكشف واتخاذ القرارات.

حتى الآن، كانت الأنواع المختلفة من البيانات التي ناقشناها هي تلك التي يمكن جمعها من العالم الحقيقي. ومع ذلك، فإن البيانات البصرية الاصطناعية والمحاكاة هي نوعان من المحتوى الاصطناعي. يتم إنشاء البيانات الاصطناعية من الصفر باستخدام النمذجة ثلاثية الأبعاد أو الذكاء الاصطناعي التوليدي لإنتاج صور أو مقاطع فيديو ذات مظهر واقعي.

البيانات المحاكاة مماثلة ولكنها تنطوي على إنشاء بيئات افتراضية تحاكي كيفية تصرف العالم المادي، بما في ذلك انعكاس الضوء وتكوين الظلال وحركة الكائنات. في حين أن جميع البيانات البصرية المحاكاة هي بيانات اصطناعية، إلا أنه ليست كل البيانات الاصطناعية محاكاة. والفرق الرئيسي هو أن البيانات المحاكاة تكرر السلوك الواقعي، وليس المظهر فقط.
تعتبر هذه الأنواع من البيانات مفيدة لتدريب نماذج الرؤية الحاسوبية، خاصة عندما يكون من الصعب جمع البيانات الواقعية أو عندما تحتاج إلى محاكاة مواقف معينة ونادرة. يمكن للمطورين إنشاء مشاهد كاملة، واختيار أنواع الكائنات ومواقعها وإضاءتها، وإضافة تسميات تلقائيًا مثل المربعات المحيطة للتدريب. يساعد هذا في بناء مجموعات بيانات كبيرة ومتنوعة بسرعة، دون الحاجة إلى صور حقيقية أو وضع العلامات اليدوية، والتي قد تكون مكلفة وتستغرق وقتًا طويلاً.
على سبيل المثال، في مجال الرعاية الصحية، يمكن استخدام البيانات الاصطناعية لتدريب النماذج على تقسيم خلايا سرطان الثدي، حيث يصعب جمع وتسمية مجموعات بيانات كبيرة من الصور الحقيقية. توفر البيانات الاصطناعية والمحاكاة المرونة والتحكم، مما يسد الفجوات حيث تكون المرئيات الواقعية محدودة.
الآن بعد أن نظرنا في كيفية عمل الأنواع المختلفة من البيانات المرئية وما يمكنها فعله، دعنا نلقي نظرة فاحصة على أنواع البيانات الأفضل لمهام محددة:
في بعض الأحيان، قد لا يوفر نوع واحد من البيانات دقة أو سياقًا كافيًا في المواقف الواقعية. هذا هو المكان الذي يصبح فيه دمج أجهزة الاستشعار متعدد الوسائط أمرًا أساسيًا. من خلال الجمع بين RGB وأنواع البيانات الأخرى مثل الحرارة أو العمق أو الليدار، يمكن للأنظمة التغلب على القيود الفردية، وتحسين الموثوقية والقدرة على التكيف.
على سبيل المثال، في أتمتة المستودعات، فإن استخدام RGB للتعرف على الكائنات، والعمق لقياس المسافة، والحرارة لاكتشاف المعدات المحمومة يجعل العمليات أكثر كفاءة وأمانًا. في النهاية، تأتي أفضل النتائج من تحديد أو دمج أنواع البيانات بناءً على الاحتياجات المحددة لتطبيقك.
عند بناء نماذج Vision AI، يعد اختيار النوع المناسب من البيانات المرئية أمرًا بالغ الأهمية. لا تعتمد مهام مثل اكتشاف الكائنات وتقسيمها وتتبع الحركة على الخوارزميات فحسب، بل تعتمد أيضًا على جودة بيانات الإدخال. تساعد مجموعات البيانات النظيفة والمتنوعة والدقيقة على تقليل الضوضاء وتحسين الأداء.
من خلال الجمع بين أنواع البيانات مثل RGB والعمق والحرارة والليدار، تكتسب أنظمة الذكاء الاصطناعي رؤية أكثر اكتمالاً للبيئة، مما يجعلها أكثر موثوقية في مختلف الظروف. مع استمرار تحسن التكنولوجيا، فمن المحتمل أن يمهد الطريق لكي يصبح Vision AI أسرع وأكثر قابلية للتكيف وأكثر تأثيرًا عبر الصناعات.
انضم إلى مجتمعنا واستكشف مستودع GitHub الخاص بنا لمعرفة المزيد حول الرؤية الحاسوبية. اكتشف التطبيقات المختلفة المتعلقة بـ الذكاء الاصطناعي في الرعاية الصحية و الرؤية الحاسوبية في مجال البيع بالتجزئة في صفحات الحلول الخاصة بنا. تحقق من خيارات الترخيص الخاصة بنا للبدء في Vision AI.