تعرف على YOLO26: جيل جديد من ذكاء الرؤية الاصطناعي.
Ultralytics
الذكاء الاصطناعي المرئي

تاريخ نماذج الرؤية

استكشف تاريخ وإنجازات وتحديات واتجاهات المستقبل لنماذج الرؤية.

مصمصطفى إبراهيم
5 min read
تاريخ نماذج الرؤية

Link to this sectionما هي الرؤية الحاسوبية#

تخيل أنك تدخل متجرًا حيث تقوم كاميرا بتحديد وجهك، وتحليل حالتك المزاجية، واقتراح منتجات مصممة خصيصًا لتفضيلاتك - كل ذلك في الوقت الفعلي. هذا ليس من قبيل الخيال العلمي، بل واقع تتيحه نماذج الرؤية الحديثة. وفقًا لتقرير صادر عن Fortune Business Insight، تم تقييم حجم سوق الرؤية الحاسوبية العالمي بـ 20.31 مليار دولار أمريكي في عام 2023، ومن المتوقع أن ينمو من 25.41 مليار دولار أمريكي في عام 2024 إلى 175.72 مليار دولار أمريكي بحلول عام 2032، مما يعكس التقدم السريع والاعتماد المتزايد لهذه التكنولوجيا عبر مختلف الصناعات.

تمكّن الرؤية الحاسوبية أجهزة الكمبيوتر من اكتشاف الأشياء وتحديدها وتحليلها داخل الصور. ومثلها مثل المجالات الأخرى المتعلقة بالذكاء الاصطناعي، شهدت الرؤية الحاسوبية تطورًا سريعًا على مدى العقود القليلة الماضية، محققة تقدمًا ملحوظًا.

تاريخ الرؤية الحاسوبية واسع. في سنواتها الأولى، كانت نماذج الرؤية الحاسوبية قادرة على اكتشاف الأشكال والحواف البسيطة، وغالبًا ما كانت تقتصر على مهام أساسية مثل التعرف على الأنماط الهندسية أو التمييز بين المناطق المضيئة والمظلمة. ومع ذلك، يمكن لنماذج اليوم تنفيذ مهام معقدة مثل اكتشاف الكائنات في الوقت الفعلي، والتعرف على الوجوه، وحتى تفسير العواطف من تعابير الوجه بدقة وكفاءة استثنائيتين. يسلط هذا التقدم الكبير الضوء على الخطوات المذهلة التي تم تحقيقها في القوة الحسابية، وتطور الخوارزميات، وتوافر كميات هائلة من البيانات للتدريب.

في هذا المقال، سنستكشف المعالم الرئيسية في تطور الرؤية الحاسوبية. سنقوم برحلة عبر بداياتها الأولى، ونتعمق في التأثير التحويلي للشبكات العصبية التلافيفية (CNNs)، ونفحص التطورات المهمة التي تلت ذلك.

Link to this sectionالبدايات الأولى للرؤية الحاسوبية#

كما هو الحال مع مجالات الذكاء الاصطناعي الأخرى، بدأ التطور المبكر للرؤية الحاسوبية بأبحاث تأسيسية وعمل نظري. كان هناك معلم مهم وهو عمل لورانس جي. روبرتس الرائد في التعرف على الكائنات ثلاثية الأبعاد، الموثق في أطروحته "الإدراك الآلي للمواد الصلبة ثلاثية الأبعاد" في أوائل الستينيات. وضعت مساهماته حجر الأساس للتقدم المستقبلي في هذا المجال.

Link to this sectionالخوارزميات الأولى - اكتشاف الحواف#

ركزت أبحاث الرؤية الحاسوبية المبكرة على تقنيات معالجة الصور، مثل اكتشاف الحواف واستخراج الميزات. كانت خوارزميات مثل عامل سوبل (Sobel operator)، الذي تم تطويره في أواخر الستينيات، من بين الأوائل في اكتشاف الحواف عن طريق حساب تدرج شدة الصورة.

صورة توضح كشف الحواف

الشكل 1. صورة توضح اكتشاف الحواف، حيث يظهر الجانب الأيسر الكائن الأصلي ويعرض الجانب الأيمن النسخة التي تم اكتشاف حوافها.

لعبت تقنيات مثل مكتشفات الحواف سوبل وكانى دورًا حاسمًا في تحديد الحدود داخل الصور، وهي ضرورية للتعرف على الكائنات وفهم المشاهد.

Link to this sectionالتعلم الآلي والرؤية الحاسوبية#

Link to this sectionالتعرف على الأنماط#

في السبعينيات، برز التعرف على الأنماط كمجال رئيسي للرؤية الحاسوبية. طور الباحثون طرقًا للتعرف على الأشكال والقوام والكائنات في الصور، مما مهد الطريق لمهام رؤية أكثر تعقيدًا.

التعرف على الأنماط

الشكل 2. التعرف على الأنماط.

تضمنت إحدى الطرق المبكرة للتعرف على الأنماط مطابقة القوالب، حيث تتم مقارنة الصورة بمجموعة من القوالب للعثور على أفضل مطابقة. كان هذا النهج محدودًا بسبب حساسيته للاختلافات في الحجم والدوران والضوضاء.

مطابقة القوالب داخل صورة

الشكل 3. قالب على الجانب الأيسر تم العثور عليه داخل الصورة اليمنى.

كانت أنظمة الرؤية الحاسوبية المبكرة مقيدة بالقدرة الحسابية المحدودة في ذلك الوقت. كانت أجهزة الكمبيوتر في الستينيات والسبعينيات ضخمة ومكلفة وذات قدرات معالجة محدودة.

Link to this sectionتغيير قواعد اللعبة مع التعلم العميق#

Link to this sectionالتعلم العميق والشبكات العصبية التلافيفية#

شكل التعلم العميق والشبكات العصبية التلافيفية (CNNs) لحظة محورية في مجال الرؤية الحاسوبية. لقد أحدثت هذه التطورات تحولًا جذريًا في كيفية تفسير أجهزة الكمبيوتر للبيانات المرئية وتحليلها، مما أتاح مجموعة واسعة من التطبيقات التي كان يُعتقد سابقًا أنها مستحيلة.

Link to this sectionكيف تعمل شبكات CNN؟#

بنية الشبكة العصبية التلافيفية (CNN)

الشكل 4. بنية شبكة عصبية تلافيفية (CNN).

  1. الطبقات التلافيفية (Convolutional Layers): تستخدم شبكات CNN طبقات تلافيفية، وهي نوع من نماذج التعلم العميق المصممة لمعالجة البيانات المهيكلة التي تشبه الشبكة، مثل الصور أو المتواليات، عن طريق تعلم الأنماط الهرمية تلقائيًا، لمسح الصورة باستخدام مرشحات أو نوى. تكتشف هذه المرشحات ميزات مختلفة مثل الحواف والقوام والألوان عن طريق الانزلاق عبر الصورة وحساب النواتج النقطية. يقوم كل مرشح بتنشيط أنماط معينة في الصورة، مما يمكّن النموذج من تعلم الميزات الهرمية.
  2. وظائف التنشيط (Activation Functions): بعد الالتفاف، تُستخدم وظائف التنشيط مثل ReLU (وحدة خطية مصححة)، وهي وظيفة تنشيط شائعة في التعلم العميق تقوم بإخراج المدخلات مباشرة إذا كانت موجبة، وصفر بخلاف ذلك، مما يساعد الشبكات العصبية على تعلم العلاقات غير الخطية في البيانات بكفاءة. يساعد هذا الشبكة على تعلم أنماط وتمثيلات معقدة.
  3. طبقات التجميع (Pooling Layers): توفر طبقات التجميع عملية أخذ عينات لأسفل (downsampling) تقلل من أبعاد خريطة الميزات، مما يساعد في استخراج الميزات الأكثر صلة مع تقليل التكلفة الحسابية والفرط في التخصيص (overfitting).
  4. الطبقات المتصلة بالكامل (Fully Connected Layers): الطبقات النهائية لشبكة CNN هي طبقات متصلة بالكامل تفسر الميزات المستخرجة بواسطة الطبقات التلافيفية وطبقات التجميع لإجراء التنبؤات. هذه الطبقات مشابهة لتلك الموجودة في الشبكات العصبية التقليدية.

Link to this sectionتطور نماذج رؤية CNN#

كانت رحلة نماذج الرؤية واسعة، وتضمنت بعضًا من أبرزها:

  • LeNet (1989): كان LeNet أحد أوائل معماريات CNN، واستُخدم بشكل أساسي للتعرف على الأرقام في الشيكات المكتوبة بخط اليد. وضع نجاحه الأساس لشبكات CNN أكثر تعقيدًا، مما أثبت إمكانات التعلم العميق في معالجة الصور.

  • AlexNet (2012): تفوق AlexNet بشكل كبير على النماذج الموجودة في مسابقة ImageNet، مما أظهر قوة التعلم العميق. استخدم هذا النموذج تنشيطات ReLU، وdropout، وزيادة البيانات (data augmentation)، مما وضع معايير جديدة في تصنيف الصور وأثار اهتمامًا واسعًا بشبكات CNN.

  • VGGNet (2014): من خلال استخدام مرشحات تلافيفية أصغر (3x3)، حقق VGGNet نتائج مبهرة في مهام تصنيف الصور، مما عزز أهمية عمق الشبكة في تحقيق دقة أعلى.

  • ResNet (2015): عالج ResNet مشكلة التدهور في الشبكات العميقة من خلال تقديم التعلم المتبقي (residual learning). سمح هذا الابتكار بتدريب شبكات أعمق بكثير، مما أدى إلى أداء متطور في مختلف مهام الرؤية الحاسوبية.

  • YOLO (You Only Look Once): أحدث YOLO ثورة في اكتشاف الكائنات من خلال صياغته كمشكلة انحدار واحدة، والتنبؤ مباشرة بمربعات الإحاطة واحتمالات الفئة من الصور الكاملة في تقييم واحد. أتاح هذا النهج اكتشاف الكائنات في الوقت الفعلي بسرعة ودقة غير مسبوقتين، مما جعله مناسبًا للتطبيقات التي تتطلب معالجة فورية، مثل القيادة الذاتية والمراقبة.

Link to this sectionتطبيقات الرؤية الحاسوبية#

Link to this sectionالرعاية الصحية#

استخدامات الرؤية الحاسوبية عديدة. على سبيل المثال، تُستخدم نماذج الرؤية مثل Ultralytics YOLOv8 في التصوير الطبي لاكتشاف أمراض مثل السرطان واعتلال الشبكية السكري. فهي تحلل الأشعة السينية، والرنين المغناطيسي، والأشعة المقطعية بدقة عالية، وتحدد التشوهات في وقت مبكر. تسمح هذه القدرة على الاكتشاف المبكر بالتدخلات في الوقت المناسب وتحسين نتائج المرضى.

الكشف عن أورام الدماغ باستخدام Ultralytics YOLOv8

الشكل 5. اكتشاف أورام الدماغ باستخدام Ultralytics YOLOv8.

Link to this sectionالحفاظ على البيئة#

تساعد نماذج الرؤية الحاسوبية في مراقبة الأنواع المهددة بالانقراض وحمايتها من خلال تحليل الصور ومقاطع الفيديو من موائل الحياة البرية. فهي تحدد وتتتبع سلوك الحيوانات، وتوفر بيانات عن أعدادها وتحركاتها. تساهم هذه التكنولوجيا في توجيه استراتيجيات الحفظ وقرارات السياسة لحماية أنواع مثل النمور والفيلة.

بمساعدة رؤية الذكاء الاصطناعي، يمكن مراقبة التهديدات البيئية الأخرى مثل حرائق الغابات وإزالة الغابات، مما يضمن أوقات استجابة سريعة من السلطات المحلية.

صورة عبر الأقمار الصناعية لحريق غابات

الشكل 6. صورة عبر الأقمار الصناعية لحريق غابة.

Link to this sectionالتحديات والتوجهات المستقبلية#

على الرغم من أنها حققت بالفعل إنجازات كبيرة، ونظرًا لتعقيدها الشديد والطبيعة المتطلبة لتطويرها، تواجه نماذج الرؤية تحديات عديدة تتطلب بحثًا مستمرًا وتطورات مستقبلية.

Link to this sectionالقابلية للتفسير والشفافية#

غالبًا ما يُنظر إلى نماذج الرؤية، وخاصة نماذج التعلم العميق، على أنها "صناديق سوداء" ذات شفافية محدودة. يرجع هذا إلى كون هذه النماذج معقدة للغاية. يعيق نقص القابلية للتفسير الثقة والمساءلة، خاصة في التطبيقات الحرجة مثل الرعاية الصحية على سبيل المثال.

Link to this sectionالمتطلبات الحسابية#

يتطلب تدريب ونشر نماذج الذكاء الاصطناعي المتطورة موارد حسابية كبيرة. هذا صحيح بشكل خاص لنماذج الرؤية، التي غالبًا ما تتطلب معالجة كميات كبيرة من بيانات الصور والفيديو. تزيد الصور ومقاطع الفيديو عالية الدقة، كونها من أكثر مدخلات التدريب كثافة في البيانات، من العبء الحسابي. على سبيل المثال، يمكن لصورة واحدة عالية الدقة أن تشغل عدة ميجابايتات من التخزين، مما يجعل عملية التدريب كثيفة الموارد وتستغرق وقتًا طويلًا.

يستلزم هذا أجهزة قوية وخوارزميات رؤية حاسوبية محسنة للتعامل مع البيانات الموسعة والحسابات المعقدة التي ينطوي عليها تطوير نماذج رؤية فعالة. تعد الأبحاث حول معماريات أكثر كفاءة، وضغط النماذج، ومسرعات الأجهزة مثل GPUs وTPUs مجالات رئيسية ستدفع مستقبل نماذج الرؤية.

تهدف هذه التحسينات إلى تقليل المتطلبات الحسابية وزيادة كفاءة المعالجة. علاوة على ذلك، يمكن للاستفادة من النماذج المتقدمة المدربة مسبقًا مثل YOLOv8 أن تقلل بشكل كبير من الحاجة إلى تدريب مكثف، مما يبسط عملية التطوير ويعزز الكفاءة.

Link to this sectionمشهد دائم التطور#

في الوقت الحاضر، تطبيقات نماذج الرؤية منتشرة على نطاق واسع، وتتراوح من الرعاية الصحية، مثل اكتشاف الأورام، إلى الاستخدامات اليومية مثل مراقبة حركة المرور. لقد جلبت هذه النماذج المتقدمة الابتكار إلى عدد لا يحصى من الصناعات من خلال توفير دقة وكفاءة وقدرات محسنة كانت غير متصورة في السابق.

مع استمرار تقدم التكنولوجيا، تظل إمكانات نماذج الرؤية للابتكار وتحسين جوانب مختلفة من الحياة والصناعة بلا حدود. يؤكد هذا التطور المستمر أهمية مواصلة البحث والتطوير في مجال الرؤية الحاسوبية.

هل تشعر بالفضول بشأن مستقبل رؤية الذكاء الاصطناعي؟ لمزيد من المعلومات حول أحدث التطورات، استكشف وثائق Ultralytics، واطلع على مشاريعهم على GitHub الخاص بـ Ultralytics وGitHub الخاص بـ YOLOv8. بالإضافة إلى ذلك، للحصول على رؤى حول تطبيقات الذكاء الاصطناعي عبر مختلف الصناعات، تقدم صفحات الحلول الخاصة بـ السيارات ذاتية القيادة والتصنيع معلومات مفيدة بشكل خاص.

Explore solutions

Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.
اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.
اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.
اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.
اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.
اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.
اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.
اعرف المزيد

لنبنِ مستقبل الذكاء الاصطناعي معاً!

ابدأ رحلتك مع مستقبل تعلم الآلة