تعرف على كيفية عمل التعلم الذاتي للإزالة الضوضاء، ولماذا تصبح الصور مشوشة، والطرق والخطوات الرئيسية المستخدمة لاستعادة التفاصيل المرئية النقية.

تعرف على كيفية عمل التعلم الذاتي للإزالة الضوضاء، ولماذا تصبح الصور مشوشة، والطرق والخطوات الرئيسية المستخدمة لاستعادة التفاصيل المرئية النقية.

لا تلتقط الكاميرات دائمًا العالم بالطريقة التي نراه بها. قد تبدو الصورة الشخصية الملتقطة في إضاءة منخفضة أو صورة سيارة سريعة الحركة محببة أو ضبابية أو مشوهة.
يمكن أن تتسبب المستشعرات البطيئة والبيئات المظلمة والحركة في ظهور بقع صغيرة من الضوضاء التي تخفف الحواف وتخفي التفاصيل المهمة. عند فقدان هذه الوضوح، قد تجد حتى أنظمة الذكاء الاصطناعي والتعلم الآلي المتقدمة صعوبة في فهم محتوى الصورة، لأن العديد من الأنظمة الذكية تعتمد على تلك التفاصيل الدقيقة لتعمل بشكل جيد.
على سبيل المثال، الرؤية الحاسوبية هي أحد فروع الذكاء الاصطناعي التي تمكّن الآلات من تفسير الصور والفيديو. ولكن للقيام بذلك بدقة، تحتاج نماذج الذكاء الاصطناعي للرؤية إلى بيانات بصرية نظيفة وعالية الجودة لتتعلم منها.
على وجه التحديد، نماذج مثل Ultralytics YOLO11 و Ultralytics القادم مهام مثل اكتشاف الكائنات وتجزئة الحالات وتقدير الوضع، ويمكن تدريبها خصيصًا لحالات استخدام مختلفة. تعتمد هذه المهام على إشارات بصرية واضحة مثل الحواف والأنسجة والألوان والتفاصيل الهيكلية الدقيقة.
عندما تحجب الضوضاء هذه الميزات، يتلقى النموذج إشارات تدريب أضعف، مما يجعل من الصعب تعلم الأنماط الدقيقة. ونتيجة لذلك، يمكن أن تؤدي حتى الكميات الصغيرة من الضوضاء إلى تقليل الأداء في التطبيقات الحقيقية.
في المقال السابق، تناولنا كيفية إزالة الضوضاء من الصور باستخدام التعلم الذاتي. في هذا المقال، سنتعمق أكثر في كيفية عمل تقنيات إزالة الضوضاء الذاتية وكيف تساعد في استعادة المعلومات البصرية المهمة. لنبدأ!
قبل أن نستكشف كيفية استخدام التعلم الذاتي في إزالة الضوضاء من الصور، دعونا أولاً نعيد النظر في سبب ظهور الضوضاء في الصور في المقام الأول.
نادراً ما تكون صور الأجسام والمشاهد الواقعية مثالية. فقد تؤدي الإضاءة المنخفضة وجودة المستشعر المحدودة والحركة السريعة إلى حدوث اضطرابات عشوائية في وحدات البكسل الفردية عبر الصورة. وتقلل هذه الاضطرابات على مستوى وحدات البكسل، والمعروفة باسم الضوضاء، من الوضوح العام وتجعل من الصعب رؤية التفاصيل المهمة.
عندما يخفي الضجيج الحواف والأنسجة والأنماط الدقيقة، تجد أنظمة الرؤية الحاسوبية صعوبة في التعرف على الأشياء أو تفسير المشاهد بدقة. تنتج الظروف المختلفة أنواعًا مختلفة من الضجيج، يؤثر كل منها على الصورة بطريقته الخاصة.
.webp)
فيما يلي بعض أنواع الضوضاء الأكثر شيوعًا في الصور:
إذن، ما الذي يجعل إزالة الضوضاء الذاتية الإشراف مميزة؟ إنها تبرز في المواقف التي لا توجد فيها صور واضحة وحقيقية أو يصعب التقاطها.
يحدث هذا غالبًا في التصوير الفوتوغرافي في ظروف الإضاءة المنخفضة، والتصوير باستخدام ISO عالي، والتصوير الطبي والعلمي، أو أي بيئة لا يمكن تجنب الضوضاء فيها ويكون جمع بيانات مرجعية مثالية أمرًا غير واقعي. بدلاً من الحاجة إلى أمثلة واضحة، يتعلم النموذج مباشرة من الصور التي تحتوي على ضوضاء الموجودة لديك بالفعل، مما يجعله قابلاً للتكيف مع أنماط الضوضاء المحددة لكاميرتك أو مستشعرك.
يعد إزالة الضوضاء ذاتية الإشراف خيارًا رائعًا أيضًا عندما تريد تعزيز أداء مهام الرؤية الحاسوبية النهائية، ولكن مجموعة البيانات الخاصة بك مليئة بصور غير متسقة أو بها ضوضاء. من خلال استعادة حواف وملمس وهياكل أكثر وضوحًا، تساعد هذه الأساليب نماذج مثل YOLO detect المشاهد segment وفهمها بشكل أكثر موثوقية. باختصار، إذا كنت تعمل مع بيانات بها ضوضاء ولا تتوفر صور تدريب نظيفة، فإن إزالة الضوضاء ذاتية الإشراف غالبًا ما توفر الحل الأكثر عملية وفعالية.
كما رأينا سابقًا، فإن إزالة الضوضاء ذاتية الإشراف هي نهج ذكاء اصطناعي قائم على التعلم العميق يسمح للنماذج بالتعلم مباشرة من الصور المضطربة دون الاعتماد على علامات واضحة. وهو يعتمد على مبادئ التعلم ذاتي الإشراف، حيث تولد النماذج إشارات التدريب الخاصة بها من البيانات نفسها.
بعبارة أخرى، يمكن للنموذج أن يعلم نفسه بنفسه باستخدام الصور المشوشة كمدخلات ومصدر لإشارات التعلم. من خلال مقارنة الإصدارات المختلفة المشوشة من نفس الصورة أو توقع البكسلات المخفية، يتعلم النموذج الأنماط التي تمثل البنية الحقيقية وتلك التي تمثل مجرد تشويش. من خلال التحسين المتكرر والتعرف على الأنماط، تحسن الشبكة تدريجياً قدرتها على تمييز محتوى الصورة ذي المعنى عن التباين العشوائي.
.webp)
وقد أصبح ذلك ممكناً بفضل استراتيجيات تعلم محددة توجه النموذج لفصل بنية الصورة الثابتة عن الضوضاء العشوائية. بعد ذلك، دعونا نلقي نظرة فاحصة على التقنيات والخوارزميات الأساسية التي تبسط هذه العملية وكيف تساعد كل طريقة النماذج على إعادة بناء صور أنظف وأكثر موثوقية.
عملت العديد من طرق التعلم الذاتي المبكرة لإزالة الضوضاء من خلال مقارنة نسختين ضوضاء من نفس الصورة. نظرًا لأن الضوضاء تتغير بشكل عشوائي في كل مرة يتم فيها التقاط الصورة أو تلفها، ولكن البنية الحقيقية تظل كما هي، يمكن استخدام هذه الاختلافات كإشارة تعلم للنموذج.
يُشار إلى هذه الأساليب عادةً باسم طرق إزالة الضوضاء من الصور الزوجية لأنها تعتمد على استخدام أو إنشاء أزواج من الصور التي تحتوي على ضوضاء أثناء التدريب. على سبيل المثال، يقوم أسلوب Noise2Noise (الذي اقترحه Jaakko Lehtinen وفريقه) بتدريب نموذج باستخدام صورتين مستقلتين تحتويان على ضوضاء لنفس المشهد. ونظرًا لاختلاف أنماط الضوضاء بين النسختين، يتعلم النموذج تحديد التفاصيل المتسقة التي تمثل الصورة الأساسية الفعلية.

بمرور الوقت، يتعلم الشبكة قمع الضوضاء العشوائية والحفاظ على البنية الحقيقية، على الرغم من أنها لا ترى أبدًا صورة مرجعية واضحة. لنفترض سيناريو بسيطًا حيث تلتقط صورتين لشارع مضاء بإضاءة خافتة في الليل.
تحتوي كل صورة على نفس المباني والأضواء والظلال، ولكن الضوضاء الحبيبية تظهر في أماكن مختلفة. من خلال مقارنة هاتين الصورتين المضطربتين أثناء التدريب، يمكن للنموذج الذاتي الإشراف أن يتعلم أي الأنماط البصرية مستقرة وأيها ناتج عن الضوضاء، مما يؤدي في النهاية إلى تحسين قدرته على إعادة بناء صور أنظف.
بينما تعتمد الطرق الثنائية على مقارنة نسختين مختلفتين من نفس الصورة، تتبع طرق النقطة العمياء نهجًا مختلفًا. فهي تسمح للنموذج بالتعلم من صورة واحدة مشوشة عن طريق إخفاء وحدات بكسل محددة بحيث لا تستطيع الشبكة رؤية قيمها المشوشة.
ثم يجب على النموذج توقع البكسلات المخفية باستخدام السياق المحيط فقط. الفكرة الأساسية هي أن الضوضاء عشوائية، ولكن البنية الأساسية للصورة ليست كذلك.
من خلال منع النموذج من نسخ قيمة البكسل المشوشة، تشجع طرق النقطة العمياء النموذج على استنتاج ما يجب أن يكون عليه هذا البكسل استنادًا إلى أنماط الصورة الثابتة مثل الحواف القريبة أو الأنسجة أو تدرجات الألوان. تطبق تقنيات مثل Noise2Void (التي قدمها ألكسندر كرول وفريقه) و Noise2Self (التي طورها جوشوا باتسون ولويك روير) هذا المبدأ عن طريق إخفاء وحدات البكسل الفردية أو المناطق الصغيرة المجاورة وتدريب النموذج على إعادة بنائها.
تحسن الأساليب الأكثر تقدمًا، بما في ذلك Noise2Same و PN2V، من المتانة من خلال فرض تنبؤات متسقة عبر إصدارات مقنعة متعددة أو من خلال نمذجة توزيع الضوضاء بشكل صريح لتقدير درجة عدم اليقين. نظرًا لأن هذه الأساليب لا تتطلب سوى صورة واحدة بها ضوضاء، فهي مفيدة بشكل خاص في المجالات التي يكون فيها التقاط صور واضحة أو مزدوجة أمرًا غير عملي أو مستحيلًا، مثل الفحص المجهري وعلم الفلك والتصوير الطبي الحيوي أو التصوير الفوتوغرافي في الإضاءة المنخفضة.
تعتمد معظم طرق إزالة الضوضاء الذاتية المزدوجة والعمياء على الشبكات العصبية التلافيفية (CNN) أو شبكات إزالة الضوضاء. تعد الشبكات العصبية التلافيفية خيارًا رائعًا لهذه الأساليب لأنها تركز على الأنماط المحلية، أي الحواف والأنسجة والتفاصيل الصغيرة.
تستخدم هياكل مثل U-Net على نطاق واسع لأنها تجمع بين الميزات الدقيقة والمعلومات متعددة المستويات. ومع ذلك، تعمل شبكات CNN بشكل أساسي في نطاقات محدودة، مما يعني أنها قد تفوت علاقات مهمة تمتد عبر مناطق أكبر من الصورة.
تم إدخال طرق متطورة لإزالة الضوضاء مدعومة بمحولات لمعالجة هذا القيد. بدلاً من النظر فقط إلى وحدات البكسل المجاورة، تستخدم الطريقة المقترحة آليات الانتباه لفهم كيفية ارتباط أجزاء مختلفة من الصورة ببعضها البعض.
تستخدم بعض النماذج الانتباه الشامل الكامل، بينما تستخدم نماذج أخرى الانتباه القائم على النوافذ أو الانتباه الهرمي لتقليل الحساب، ولكن بشكل عام، فهي مصممة لالتقاط البنية طويلة المدى التي لا تستطيع شبكات CNNs التقاطها بمفردها. تساعد هذه الرؤية الأوسع النموذج على استعادة الأنسجة المتكررة أو الأسطح الملساء أو الكائنات الكبيرة التي تتطلب معلومات من جميع أنحاء الصورة.
بالإضافة إلى التقنيات ذاتية الإشراف، هناك أيضًا عدة طرق أخرى لتنظيف الصور التي تحتوي على ضوضاء. تستخدم الطرق التقليدية، مثل التصفية الثنائية وإزالة الضوضاء بالموجات الصغيرة والوسائل غير المحلية، قواعد رياضية بسيطة لتخفيف الضوضاء مع محاولة الحفاظ على التفاصيل المهمة.
وفي الوقت نفسه، توجد أيضًا مناهج التعلم العميق، بما في ذلك النماذج الخاضعة للإشراف التي تتعلم من أزواج الصور النقية والمشوشة والشبكات التنافسية التوليدية (GAN) التي تولد نتائج أكثر وضوحًا وواقعية. ومع ذلك، تتطلب هذه الأساليب عادةً جودة صورة أفضل للتدريب.
نظرًا لأننا استعرضنا للتو عدة تقنيات مختلفة، فقد تتساءل عما إذا كانت كل تقنية تعمل بطريقة مختلفة تمامًا، نظرًا لأنها تستخدم بنى خاصة بها. ومع ذلك، فإنها جميعًا تتبع مسارًا مشابهًا يبدأ بإعداد البيانات وينتهي بتقييم النموذج.
بعد ذلك، دعونا نلقي نظرة فاحصة على كيفية عمل عملية إزالة الضوضاء من الصور ذاتية الإشراف بشكل عام خطوة بخطوة.
قبل أن يبدأ النموذج في التعلم من الصور المشوشة، فإن الخطوة الأولى هي التأكد من أن جميع الصور تبدو متسقة. يمكن أن تختلف الصور الحقيقية كثيرًا.
قد تكون بعض الصور شديدة السطوع، وبعضها الآخر شديد الظلمة، وقد تكون ألوان بعضها غير دقيقة بعض الشيء. إذا أدخلنا هذه الاختلافات مباشرة في النموذج، فسيصعب عليه التركيز على تعلم شكل الضوضاء.
للتعامل مع هذا الأمر، تخضع كل صورة لعملية تطبيع ومعالجة أولية أساسية. وقد يشمل ذلك تغيير حجم قيم البكسل إلى نطاق قياسي، أو تصحيح تباينات الكثافة، أو الاقتصاص وتغيير الحجم. المفتاح هو أن النموذج يتلقى بيانات نظيفة يمكن استخدامها كمدخلات مستقرة وقابلة للمقارنة.
بمجرد أن يتم تطبيع الصور، فإن الخطوة التالية هي إنشاء إشارة تدريب تسمح للنموذج بالتعلم دون رؤية صورة واضحة. تقوم طرق إزالة الضوضاء ذاتية الإشراف بذلك عن طريق ضمان عدم تمكن النموذج من نسخ قيم البكسلات المشوشة التي يتلقاها.
بدلاً من ذلك، فإنها تخلق مواقف حيث يجب أن يعتمد النموذج على السياق المحيط بالصورة، الذي يحتوي على بنية مستقرة، بدلاً من الضوضاء غير المتوقعة. تحقق الطرق المختلفة ذلك بطرق مختلفة قليلاً، ولكن الفكرة الأساسية هي نفسها.
تقوم بعض الأساليب بإخفاء أو حجب بعض وحدات البكسل مؤقتًا بحيث يتعين على النموذج استنتاجها من وحدات البكسل المجاورة لها، بينما تقوم أساليب أخرى بإنشاء نسخة تالفة بشكل منفصل من نفس الصورة المشوشة بحيث تحتوي المدخلات والهدف على ضوضاء مستقلة. في كلتا الحالتين، تحمل الصورة المستهدفة معلومات هيكلية مهمة ولكنها تمنع الشبكة من الوصول إلى القيمة المشوشة الأصلية لوحدة البكسل التي من المفترض أن تتنبأ بها.
نظرًا لأن الضوضاء تتغير بشكل عشوائي بينما تظل الصورة الأساسية ثابتة، فإن هذا الإعداد يشجع النموذج بشكل طبيعي على تعلم الشكل الحقيقي للهيكل وتجاهل الضوضاء التي تختلف من نسخة إلى أخرى.
مع وجود إشارة التدريب، يمكن للنموذج أن يبدأ في تعلم كيفية فصل بنية الصورة ذات المعنى عن الضوضاء من خلال تدريب النموذج. في كل مرة يتنبأ فيها بوجود بكسل مقنع أو تالف، يجب أن يعتمد على السياق المحيط بدلاً من القيمة المشوشة التي كانت تشغل هذا المكان في الأصل.
على مدى العديد من التكرارات أو العصور، يعلم هذا الشبكة التعرف على أنواع الأنماط التي تظل ثابتة عبر الصورة، مثل الحواف والأنسجة والأسطح الملساء. كما يتعلم تجاهل التقلبات العشوائية التي تميز الضوضاء.
على سبيل المثال، لنأخذ صورة ذات إضاءة منخفضة حيث يبدو السطح شديد التحبب. على الرغم من أن التشويش يختلف من بكسل إلى آخر، إلا أن السطح الأساسي لا يزال أملسًا. من خلال الاستدلال المتكرر على البكسلات المخفية في مثل هذه المناطق، يصبح النموذج تدريجيًا أفضل في تحديد النمط الثابت تحت التشويش وإعادة بنائه بشكل أنظف.
من خلال عملية تدريب النموذج، يتعلم الشبكة تمثيل داخلي لهيكل الصورة. وهذا يتيح للنموذج استعادة التفاصيل المتسقة حتى عندما تكون المدخلات تالفة بشدة.
بعد أن يتعلم النموذج توقع البكسلات المخفية أو التالفة مرة أخرى، فإن الخطوة الأخيرة هي تقييم مدى كفاءته في التعامل مع الصور الكاملة. أثناء الاختبار، يتلقى النموذج صورة كاملة بها ضوضاء ويقوم بإنتاج نسخة كاملة خالية من الضوضاء بناءً على ما تعلمه عن بنية الصورة. لقياس مدى فعالية هذه العملية، تتم مقارنة الناتج مع صور مرجعية نظيفة أو مجموعات بيانات قياسية.
هناك مقياسان شائعان الاستخدام هما PSNR (نسبة الإشارة إلى الضوضاء القصوى)، الذي يقيس مدى قرب إعادة البناء من الحقيقة الأساسية النقية، و SSIM (مؤشر التشابه الهيكلي)، الذي يقيّم مدى جودة الحفاظ على الميزات المهمة مثل الحواف والأنسجة. تشير الدرجات الأعلى عمومًا إلى إزالة ضوضاء أكثر دقة وموثوقية بصريًا.
تستند الأبحاث المتعلقة بإزالة الضوضاء ذاتية الإشراف، التي تظهر في مجلات IEEE ومؤتمرات CVF، من بين أمور أخرى، CVPR و ICCV و ECCV، فضلاً عن توزيعها على نطاق واسع على arXiv، غالبًا إلى مزيج من مجموعات البيانات الاصطناعية والواقعية لتقييم أداء نموذج طرق التعلم العميق في ظل ظروف خاضعة للرقابة وظروف عملية. من ناحية، تبدأ مجموعات البيانات الاصطناعية بصور نظيفة وتضيف ضوضاء اصطناعية، مما يسهل مقارنة الطرق باستخدام مقاييس مثل PSNR و SSIM.
فيما يلي بعض مجموعات البيانات الشائعة التي تُستخدم عادةً مع إضافة ضوضاء اصطناعية لأغراض المقارنة المعيارية:
من ناحية أخرى، تحتوي مجموعات البيانات الواقعية المضطربة على صور تم التقاطها مباشرة من مستشعرات الكاميرا في ظروف الإضاءة المنخفضة أو ISO العالي أو غيرها من الظروف الصعبة. تختبر مجموعات البيانات هذه ما إذا كان النموذج قادرًا على التعامل مع الضوضاء المعقدة غير الغاوسية التي لا يمكن محاكاتها بسهولة.
فيما يلي بعض مجموعات البيانات الصاخبة الشائعة في العالم الواقعي:
.webp)
فيما يلي بعض العوامل والقيود التي يجب مراعاتها إذا كنت تنوي تدريب نموذج إزالة الضوضاء الذاتي الإشراف القائم على التعلم العميق:
توفر تقنية إزالة الضوضاء الذاتية لمحبي الذكاء الاصطناعي طريقة عملية لتنظيف الصور باستخدام البيانات المشوشة التي لدينا بالفعل. من خلال تعلم كيفية التعرف على البنية الحقيقية تحت الضوضاء، يمكن لهذه الأساليب استعادة التفاصيل المرئية المهمة. مع استمرار تحسن تقنية إزالة الضوضاء، من المرجح أن تجعل مجموعة واسعة من مهام الرؤية الحاسوبية أكثر موثوقية في الإعدادات اليومية.
انضم إلى مجتمعنا المتنامي! تصفح مستودع GitHub الخاص بنا لمعرفة المزيد عن الذكاء الاصطناعي. إذا كنت ترغب في تطوير حلول للرؤية الحاسوبية، فراجع خيارات الترخيص المتاحة لدينا. اكتشف مزايا الرؤية الحاسوبية في مجال البيع بالتجزئة وشاهد كيف يحدث الذكاء الاصطناعي فرقًا في مجال التصنيع!