استكشاف أنواع مختلفة من البيانات لتطبيقات الذكاء الاصطناعي البصري
اكتشف كيف تُمكّن أنواع البيانات المرئية مثل التصوير الحراري، وLiDAR، وصور الأشعة تحت الحمراء من استخدام تطبيقات متنوعة للرؤية الحاسوبية عبر مختلف الصناعات.

اعتادت التكنولوجيا مثل الطائرات بدون طيار أن تكون محدودة ومتاحة فقط للباحثين والمتخصصين، ولكن في الوقت الحاضر، أصبحت الأجهزة المتطورة في متناول جمهور أوسع. هذا التحول يغير الطريقة التي نجمع بها البيانات المرئية. فمع زيادة إمكانية الوصول إلى التكنولوجيا، يمكننا الآن التقاط الصور ومقاطع الفيديو من مصادر متنوعة، تتجاوز الكاميرات التقليدية.
بالتوازي مع ذلك، يتطور تحليل الصور، الذي يتيحه الرؤية الحاسوبية، وهو فرع من فروع الذكاء الاصطناعي (AI)، بسرعة، مما يسمح للآلات بتفسير ومعالجة البيانات المرئية بشكل أكثر فعالية. لقد فتح هذا التقدم إمكانيات جديدة للأتمتة، واكتشاف الأشياء، والتحليل في الوقت الفعلي. يمكن للآلات الآن التعرف على الأنماط، وتتبع الحركة، وفهم المدخلات المرئية المعقدة.
تشمل بعض الأنواع الرئيسية لـ البيانات المرئية صور RGB (الأحمر والأخضر والأزرق)، والتي تُستخدم عادةً للتعرف على الأشياء، والتصوير الحراري، الذي يساعد في اكتشاف البصمات الحرارية في ظروف الإضاءة المنخفضة، وبيانات العمق، التي تمكّن الآلات من فهم البيئات ثلاثية الأبعاد. يلعب كل نوع من هذه البيانات دورًا حيويًا في تشغيل تطبيقات مختلفة للذكاء الاصطناعي البصري، بدءًا من المراقبة وصولًا إلى التصوير الطبي.
في هذه المقالة، سوف نستكشف الأنواع الرئيسية للبيانات المرئية المستخدمة في الذكاء الاصطناعي البصري، ونستعرض كيف يساهم كل منها في تحسين الدقة والكفاءة والأداء عبر مختلف الصناعات. لنبدأ!
Link to this sectionالنوع الأكثر شيوعًا لمجموعات بيانات الصور والفيديو بالذكاء الاصطناعي#
عادةً، عندما تستخدم هاتفًا ذكيًا لالتقاط صورة أو مشاهدة لقطات كاميرات المراقبة (CCTV)، فإنك تتعامل مع صور RGB. يرمز RGB إلى الأحمر والأخضر والأزرق، وهي قنوات الألوان الثلاث التي تمثل المعلومات المرئية في الصور الرقمية.
صور ومقاطع فيديو RGB هي أنواع مترابطة من البيانات المرئية المستخدمة في الرؤية الحاسوبية، وكلاهما يتم التقاطه باستخدام كاميرات قياسية. الفرق الرئيسي هو أن الصور تلتقط لحظة واحدة، بينما مقاطع الفيديو هي سلسلة من الإطارات التي توضح كيفية تغير الأشياء بمرور الوقت.
تُستخدم صور RGB بشكل عام في مهام الرؤية الحاسوبية مثل اكتشاف الأشياء، وتجزئة المثيلات، وتقدير الوضعية، مدعومة بنماذج مثل Ultralytics YOLO11. تعتمد هذه التطبيقات على تحديد الأنماط أو الأشكال أو ميزات محددة في إطار واحد.
من ناحية أخرى، تعتبر مقاطع الفيديو ضرورية عندما تكون الحركة أو الوقت عاملاً مؤثرًا، كما هو الحال في التعرف على الإيماءات، أو المراقبة، أو تتبع الإجراءات. ونظرًا لأنه يمكن اعتبار مقاطع الفيديو سلسلة من الصور، فإن نماذج الرؤية الحاسوبية مثل YOLO11 تعالجها إطارًا تلو الآخر لفهم الحركة والسلوك بمرور الوقت.
على سبيل المثال، يمكن استخدام YOLO11 لتحليل صور أو مقاطع فيديو RGB لاكتشاف الأعشاب الضارة وعد النباتات في الحقول الزراعية. وهذا يعزز مراقبة المحاصيل ويساعد في تتبع التغيرات عبر دورات النمو لتحقيق إدارة أكثر كفاءة للمزارع.

Fig 1. يمكن لـ YOLO11 اكتشاف وعد النباتات من أجل مراقبة أكثر ذكاءً للمحاصيل.
Link to this sectionبيانات العمق في الذكاء الاصطناعي البصري: LiDAR والإدراك ثلاثي الأبعاد#
تضيف بيانات العمق بعدًا ثالثًا للمعلومات المرئية من خلال الإشارة إلى مدى بُعد الأشياء عن الكاميرا أو المستشعر. على عكس صور RGB التي تلتقط اللون والقوام فقط، توفر بيانات العمق سياقًا مكانيًا. فهي تعرض المسافة بين الأشياء والكاميرا، مما يجعل من الممكن تفسير التصميم ثلاثي الأبعاد للمشهد.
يتم التقاط هذا النوع من البيانات باستخدام تقنيات مثل LiDAR، والرؤية المجسمة (باستخدام كاميرتين لمحاكاة إدراك العمق البشري)، وكاميرات زمن الرحلة (قياس الوقت الذي يستغرقه الضوء للانتقال إلى جسم ما والعودة).
من بين هذه التقنيات، غالبًا ما تكون LiDAR (كشف الضوء وتحديد المدى) هي الأكثر موثوقية لقياس العمق. وهي تعمل عن طريق إرسال نبضات ليزر سريعة وقياس الوقت الذي تستغرقه للارتداد. والنتيجة هي خريطة ثلاثية الأبعاد عالية الدقة، تُعرف بسحابة النقاط، والتي تبرز شكل وموقع ومسافة الأشياء في الوقت الفعلي.
Link to this sectionالدور المتنامي لـ LiDAR في أنظمة الذكاء الاصطناعي البصري#
يمكن تقسيم تقنية LiDAR إلى نوعين رئيسيين، صُمم كل منهما لتطبيقات وبيئات محددة. إليك نظرة فاحصة على كلا النوعين:
- LiDAR المحمول جواً: يُستخدم عادةً لرسم خرائط للمناطق الكبيرة، حيث يتم تثبيت ماسحات LiDAR المحمولة جواً على طائرات بدون طيار أو طائرات لالتقاط بيانات عالية الدقة لرسم الخرائط الطبوغرافية واسعة النطاق. وهو مثالي لمسح التضاريس والغابات والمناظر الطبيعية.
- LiDAR الأرضي: يتم جمع هذا النوع من بيانات LiDAR من مستشعرات مثبتة على مركبات أو منصات ثابتة لتطبيقات مثل مراقبة البنية التحتية، والبناء، ورسم الخرائط الداخلية. وهو يوفر بيانات مفصلة للغاية للمناطق الأصغر والأكثر تحديدًا، مما يجعله مفيدًا لمهام مثل تخطيط المدن ومسح هياكل معينة.
من التطبيقات المؤثرة لبيانات LiDAR في المركبات ذاتية القيادة، حيث تلعب دورًا رئيسيًا في مهام مثل اكتشاف المسارات، وتجنب الاصطدام، وتحديد الأشياء القريبة. تولد LiDAR خرائط ثلاثية الأبعاد مفصلة في الوقت الفعلي للبيئة، مما يمكن المركبة من رؤية الأشياء وحساب مسافاتها والتنقل بأمان.

Fig 2. تقنية LiDAR تمكّن المركبات ذاتية القيادة من رسم خرائط العمق واكتشاف الأشياء.
Link to this sectionاستخدام البيانات الحرارية والأشعة تحت الحمراء في تطبيقات الذكاء الاصطناعي#
تلتقط صور RGB ما نراه في طيف الضوء المرئي؛ ومع ذلك، فإن تقنيات التصوير الأخرى، مثل التصوير الحراري والأشعة تحت الحمراء، تتجاوز ذلك. يلتقط التصوير بالأشعة تحت الحمراء ضوء الأشعة تحت الحمراء المنبعث أو المنعكس من الأشياء، مما يجعله مفيدًا في ظروف الإضاءة المنخفضة.
في المقابل، يكتشف التصوير الحراري الحرارة المنبعثة من الأشياء ويظهر اختلافات درجات الحرارة، مما يسمح له بالعمل في الظلام الدامس أو عبر الدخان والضباب والعوائق الأخرى. هذا النوع من البيانات مفيد بشكل خاص للمراقبة واكتشاف المشكلات، خاصة في الصناعات التي يمكن أن تشير فيها تغيرات درجات الحرارة إلى مشاكل محتملة.
من الأمثلة المثيرة للاهتمام استخدام التصوير الحراري لمراقبة المكونات الكهربائية بحثًا عن علامات السخونة الزائدة. ومن خلال اكتشاف فروق درجات الحرارة، يمكن للكاميرات الحرارية تحديد المشكلات قبل أن تؤدي إلى تعطل المعدات، أو حرائق، أو أضرار مكلفة.

Fig 3. مثال على التصوير الحراري المستخدم لمراقبة المكونات الكهربائية.
وبالمثل، يمكن لصور الأشعة تحت الحمراء أن تساعد في اكتشاف التسربات في خطوط الأنابيب أو العزل من خلال تحديد فروق درجات الحرارة التي تشير إلى هروب الغازات أو السوائل، وهو أمر بالغ الأهمية لمنع المواقف الخطرة وتحسين كفاءة الطاقة.
Link to this sectionالتصوير متعدد الأطياف وفائق الطيف في الذكاء الاصطناعي#
بينما يلتقط التصوير بالأشعة تحت الحمراء والحراري جوانب معينة من الطيف الكهرومغناطيسي، يجمع التصوير متعدد الأطياف الضوء من بضعة نطاقات طول موجي مختارة، يتم اختيار كل منها لغرض محدد، مثل اكتشاف الغطاء النباتي الصحي أو تحديد مواد السطح.
يأخذ التصوير فائق الطيف هذه الخطوة إلى أبعد من ذلك من خلال التقاط الضوء عبر مئات النطاقات الطولية الموجية الضيقة والمستمرة. وهذا يوفر توقيعًا ضوئيًا مفصلاً لكل بكسل في الصورة، مما يوفر فهمًا أعمق بكثير لأي مادة يتم مراقبتها.

Fig 4. مقارنة التصوير متعدد الأطياف وفائق الطيف.
يستخدم كل من التصوير متعدد الأطياف وفائق الطيف مستشعرات ومرشحات خاصة لالتقاط الضوء بأطوال موجية مختلفة. ثم يتم تنظيم البيانات في هيكل ثلاثي الأبعاد يسمى المكعب الطيفي، حيث تمثل كل طبقة طولًا موجيًا مختلفًا.
يمكن لنماذج الذكاء الاصطناعي تحليل هذه البيانات لاكتشاف ميزات لا تستطيع الكاميرات العادية أو العين البشرية رؤيتها. على سبيل المثال، في التنميط الظاهري للنبات، يمكن استخدام التصوير فائق الطيف لمراقبة صحة ونمو النباتات من خلال اكتشاف تغيرات دقيقة في أوراقها أو سيقانها، مثل نقص المغذيات أو الإجهاد. وهذا يساعد الباحثين على تقييم صحة النبات وتحسين الممارسات الزراعية دون الحاجة إلى طرق جراحية.
Link to this sectionتحليل صور الرادار والسونار باستخدام الذكاء الاصطناعي#
تصوير الرادار والسونار هما تقنيتان تكتشفان وتحدد خرائط للأشياء عن طريق إرسال إشارات وتحليل انعكاساتها، على غرار LiDAR. على عكس تصوير RGB، الذي يعتمد على موجات الضوء لالتقاط المعلومات المرئية، يستخدم الرادار موجات كهرومغناطيسية، عادةً موجات راديو، بينما يستخدم السونار موجات صوتية. تبعث كل من أنظمة الرادار والسونار نبضات وتقيس الوقت الذي تستغرقه الإشارة للارتداد من جسم ما، مما يوفر معلومات حول مسافته وحجمه وسرعته.
تصوير الرادار مفيد بشكل خاص عندما تكون الرؤية ضعيفة، مثل الضباب، أو المطر، أو أثناء الليل. ولأنه لا يعتمد على الضوء، فيمكنه اكتشاف الطائرات، أو المركبات، أو التضاريس في الظلام الدامس. وهذا يجعل الرادار خيارًا موثوقًا في الطيران، ومراقبة الطقس، والملاحة الذاتية.
بالمقارنة، يُستخدم تصوير السونار بشكل شائع في البيئات تحت الماء حيث لا يصل الضوء. وهو يستخدم موجات صوتية تنتقل عبر الماء وترتد عن الأجسام المغمورة، مما يسمح باكتشاف الغواصات، ورسم خرائط لقاع المحيطات، وتنفيذ مهام الإنقاذ تحت الماء. تتيح التطورات في الرؤية الحاسوبية الآن تعزيز الاكتشاف تحت الماء من خلال الجمع بين بيانات السونار والتحليل الذكي لتحسين الاكتشاف واتخاذ القرار.

Fig 5. كيف يستخدم نظام السونار (SONAR) نبضات الموجات فوق الصوتية لقياس عمق البحر.
Link to this sectionالبيانات المرئية الاصطناعية والمحاكية لتدريب نماذج الذكاء الاصطناعي#
حتى الآن، كانت أنواع البيانات المختلفة التي ناقشناها هي تلك التي يمكن جمعها من العالم الحقيقي. ومع ذلك، فإن البيانات المرئية الاصطناعية والمحاكية كلاهما نوعان من المحتوى الاصطناعي. يتم إنشاء البيانات الاصطناعية من الصفر باستخدام النمذجة ثلاثية الأبعاد أو الذكاء الاصطناعي التوليدي لإنتاج صور أو مقاطع فيديو ذات مظهر واقعي.

Fig 6. نظرة على الصور التي تم إنشاؤها اصطناعيًا.
البيانات المحاكية متشابهة ولكنها تنطوي على إنشاء بيئات افتراضية تكرر كيفية تصرف العالم المادي، بما في ذلك انعكاس الضوء، وتكوين الظل، وحركة الأشياء. بينما جميع البيانات المرئية المحاكية هي اصطناعية، فليس كل البيانات الاصطناعية هي محاكية. الفرق الرئيسي هو أن البيانات المحاكية تكرر السلوك الواقعي، وليس المظهر فقط.
تعد أنواع البيانات هذه مفيدة لتدريب نماذج الرؤية الحاسوبية، خاصة عندما يكون من الصعب جمع بيانات من العالم الحقيقي أو عندما تكون هناك حاجة لمحاكاة مواقف محددة ونادرة. يمكن للمطورين إنشاء مشاهد كاملة، واختيار أنواع الأشياء ومواقعها والإضاءة، وإضافة تسميات تلقائيًا مثل مربعات الإحاطة (bounding boxes) للتدريب. يساعد هذا في بناء مجموعات بيانات كبيرة ومتنوعة بسرعة، دون الحاجة إلى صور حقيقية أو وضع تسميات يدوية، وهو أمر قد يكون مكلفًا ومستهلكًا للوقت.
على سبيل المثال، في مجال الرعاية الصحية، يمكن استخدام البيانات الاصطناعية لتدريب النماذج على تجزئة خلايا سرطان الثدي، حيث يصعب جمع وتسمية مجموعات بيانات كبيرة من الصور الحقيقية. توفر البيانات الاصطناعية والمحاكية المرونة والتحكم، مما يسد الفجوات حيث تكون المرئيات الواقعية محدودة.
Link to this sectionاختيار النوع المناسب من البيانات المرئية لتطبيق الذكاء الاصطناعي الخاص بك#
الآن بعد أن نظرنا في كيفية عمل الأنواع المختلفة من البيانات المرئية وما يمكن أن تفعله، دعونا نلقي نظرة فاحصة على أنواع البيانات الأنسب لمهام محددة:
- صور RGB: إنها مثالية لمهام الرؤية الحاسوبية العامة مثل تصنيف الصور واكتشاف الأشياء. فهي تلتقط اللون والقوام ولكنها محدودة في الظروف الصعبة مثل الإضاءة المنخفضة أو ضعف الرؤية.
- تصوير LiDAR: يوفر هذا النوع من التصوير خرائط ثلاثية الأبعاد عالية الدقة باستخدام نبضات الليزر. إنه رائع للتطبيقات التي تتطلب قياسات مسافة دقيقة، مثل الروبوتات، والمركبات ذاتية القيادة، وفحص البنية التحتية.
- التصوير الحراري: نظرًا لأنه يمكنه اكتشاف فروق درجات الحرارة، فهو مفيد في ظروف الرؤية المنخفضة، مثل المراقبة الليلية، ومكافحة الحرائق، أو اكتشاف تسرب الحرارة في الآلات والمباني.
- التصوير متعدد الأطياف وفائق الطيف: مفيد للمهام التي تتطلب تحليلًا مفصلًا للمواد، مثل المراقبة الزراعية، ومراقبة جودة الأدوية، أو الاستشعار عن بعد. توفر هذه الطرق رؤى أعمق من خلال التقاط البيانات عبر نطاق واسع من الأطوال الموجية خارج الضوء المرئي.
- تصوير الرادار والسونار: يتم تفضيلهما في بيئات الرؤية المنخفضة. يستخدم الرادار موجات الراديو وهو مفيد في الطيران والملاحة، بينما يستخدم السونار موجات صوتية للعمل في الاكتشاف تحت الماء.
- البيانات المرئية الاصطناعية والمحاكية: مثالية لـ تدريب نماذج الذكاء الاصطناعي عندما تكون بيانات العالم الحقيقي محدودة، أو غير متوفرة، أو يصعب وضع تسميات لها. تساعد هذه المرئيات الاصطناعية في بناء مجموعات بيانات متنوعة لسيناريوهات معقدة مثل الأحداث النادرة أو الظروف الحساسة للسلامة.
في بعض الأحيان، قد لا يوفر نوع واحد من البيانات دقة أو سياقًا كافيًا في مواقف العالم الحقيقي. وهنا يأتي دور دمج المستشعرات متعددة الوسائط. من خلال الجمع بين RGB وأنواع بيانات أخرى مثل الحرارية، أو العمق، أو LiDAR، يمكن للأنظمة التغلب على القيود الفردية، مما يحسن الموثوقية والقدرة على التكيف.
على سبيل المثال، في أتمتة المستودعات، فإن استخدام RGB للتعرف على الأشياء، والعمق لقياس المسافة، والحرارة لاكتشاف المعدات التي ترتفع حرارتها يجعل العمليات أكثر كفاءة وأمانًا. في النهاية، تأتي أفضل النتائج من اختيار أو الجمع بين أنواع البيانات بناءً على الاحتياجات المحددة لتطبيقك.
Link to this sectionأبرز النقاط#
عند بناء نماذج الذكاء الاصطناعي البصري، يعد اختيار النوع المناسب من البيانات المرئية أمرًا بالغ الأهمية. المهام مثل اكتشاف الأشياء، والتجزئة، وتتبع الحركة لا تعتمد فقط على الخوارزميات ولكن أيضًا على جودة بيانات الإدخال. تساعد مجموعات البيانات النظيفة والمتنوعة والدقيقة في تقليل الضوضاء وتحسين الأداء.
من خلال الجمع بين أنواع البيانات مثل RGB، والعمق، والحرارة، وLiDAR، تكتسب أنظمة الذكاء الاصطناعي رؤية أكثر اكتمالًا للبيئة، مما يجعلها أكثر موثوقية في ظروف مختلفة. ومع استمرار تحسن التكنولوجيا، فمن المحتمل أن تمهد الطريق للذكاء الاصطناعي البصري ليصبح أسرع وأكثر قابلية للتكيف وأكثر تأثيرًا عبر الصناعات.
انضم إلى مجتمعنا واستكشف مستودع GitHub الخاص بنا لمعرفة المزيد عن الرؤية الحاسوبية. اكتشف تطبيقات مختلفة تتعلق بـ الذكاء الاصطناعي في الرعاية الصحية والرؤية الحاسوبية في التجزئة على صفحات الحلول الخاصة بنا. تحقق من خيارات الترخيص لدينا للبدء في استخدام الذكاء الاصطناعي البصري.






