"Tüm Çerezleri Kabul Et" seçeneğine tıklayarak, sitede gezinmeyi geliştirmek, site kullanımını analiz etmek ve pazarlama çabalarımıza yardımcı olmak için cihazınızda çerezlerin saklanmasını kabul edersiniz. Daha fazla bilgi
Çerez Ayarları
"Tüm Çerezleri Kabul Et" seçeneğine tıklayarak, sitede gezinmeyi geliştirmek, site kullanımını analiz etmek ve pazarlama çabalarımıza yardımcı olmak için cihazınızda çerezlerin saklanmasını kabul edersiniz. Daha fazla bilgi
Gürültü giderme için kendi kendine denetimli öğrenmenin nasıl çalıştığını, görüntülerin neden gürültülü hale geldiğini ve temiz görsel ayrıntıları geri kazanmak için kullanılan temel yöntemleri ve adımları görün.
Kameralar her zaman dünyayı bizim gördüğümüz gibi yakalamaz. Düşük ışıkta çekilen bir portre veya hızlı hareket eden bir arabanın fotoğrafı grenli, bulanık veya bozuk görünebilir.
Yavaş sensörler, karanlık ortamlar ve hareket, kenarları yumuşatan ve önemli ayrıntıları gizleyen küçük gürültü lekeleri oluşturabilir. Bu netlik kaybolduğunda, gelişmiş yapay zeka ve makine öğrenimi sistemleri bile görüntünün içeriğini anlamakta zorlanabilir, çünkü birçok akıllı sistem iyi çalışmak için bu ince ayrıntılara dayanır.
Örneğin, bilgisayar görme, makinelerin görüntüleri ve videoları yorumlamasını sağlayan yapay zeka dalıdır. Ancak bunu doğru bir şekilde yapmak için, Vision AI modellerinin öğrenmek için temiz, yüksek kaliteli görsel verilere ihtiyacı vardır.
Özellikle, Ultralytics YOLO11 ve yakında çıkacak olan Ultralytics gibi modeller, nesne algılama, örnek segmentasyonu ve poz tahmini gibi görevleri destekler ve farklı kullanım durumları için özel olarak eğitilebilir. Bu görevler, kenarlar, dokular, renkler ve ince yapısal ayrıntılar gibi net görsel ipuçlarına dayanır.
Gürültü bu özellikleri gizlediğinde, model daha zayıf eğitim sinyalleri alır ve bu da doğru kalıpları öğrenmeyi zorlaştırır. Sonuç olarak, çok az miktarda gürültü bile gerçek uygulamalarda performansı düşürebilir.
Daha önce, öz denetimli öğrenmenin görüntüleri nasıl gürültüden arındırdığını incelemiştik. Bu makalede, öz denetimli gürültü giderme tekniklerinin nasıl çalıştığını ve anlamlı görsel bilgilerin geri kazanılmasına nasıl yardımcı olduklarını daha ayrıntılı olarak ele alacağız. Hadi başlayalım!
Gerçek dünya görüntülerinde yaygın olarak görülen gürültü türleri
Görüntü gürültüsünün giderilmesinde öz denetimli öğrenmenin nasıl kullanıldığını incelemeden önce, öncelikle görüntülerin neden gürültülü hale geldiğini tekrar gözden geçirelim.
Gerçek dünyadaki nesnelerin ve sahnelerin görüntüleri nadiren mükemmeldir. Düşük aydınlatma, sınırlı sensör kalitesi ve hızlı hareket, görüntünün tek tek piksellerinde rastgele bozulmalara neden olabilir. Gürültü olarak bilinen bu piksel düzeyindeki bozulmalar, genel netliği azaltır ve önemli ayrıntıların görülmesini zorlaştırır.
Gürültü kenarları, dokuları ve ince desenleri gizlediğinde, bilgisayar görme sistemleri nesneleri tanımakta veya sahneleri doğru bir şekilde yorumlamakta zorlanır. Farklı koşullar farklı türde gürültüler üretir ve her biri görüntüyü kendine özgü bir şekilde etkiler.
Şekil 1. Gürültünün bir görüntüde belirsizliği nasıl artırabileceğine dair bir örnek. (Kaynak)
Görüntülerde en sık rastlanan gürültü türlerinden bazıları şunlardır:
Gauss gürültüsü: Bu tür gürültü, elektronik sensör paraziti veya termal dalgalanmaların neden olduğu yumuşak, rastgele grenler şeklinde ortaya çıkar. Gauss (normal) dağılımını izler ve küçük piksel varyasyonları ince ayrıntıları bulanıklaştırarak genel netliği azaltır.
Poisson gürültüsü: Atış gürültüsü olarak da adlandırılan bu tür gürültü, düşük ışık koşullarında veya kısa pozlama sürelerinde ortaya çıkar. Varyansı parlaklıkla artar, ancak gürültü genellikle daha karanlık bölgelerde daha belirgindir, çünkü daha az foton yakalanır ve bu da daha düşük sinyal-gürültü oranına neden olur.
Tuz ve karabiber gürültüsü: Bu tür gürültü, keskin siyah veya beyaz piksel sivri uçları olarak görünür. Genellikle iletim hataları, bit bozulması veya hatalı kamera sensörlerinden kaynaklanır ve çoğu zaman eksik veya bozuk piksel değerlerine neden olur.
Benek gürültüsü: Bu tür gürültü, grenli, nokta benzeri desenler olarak görünür ve tıp, radar ve ultrason görüntülemede yaygındır. Sinyal paraziti ve saçılmasından kaynaklanır, bu da kontrastı azaltır ve kenarların detect zorlaştırır.
Kendi kendine denetlenen gürültü gidermeyi ne zaman kullanmalısınız?
Peki, kendi kendine denetlenen gürültü giderme özelliğini özel kılan nedir? Bu özellik, temiz, gerçek görüntülerinin mevcut olmadığı veya yakalanmasının çok zor olduğu durumlarda öne çıkar.
Bu durum genellikle düşük ışıkta fotoğrafçılık, yüksek ISO görüntüleme, tıbbi ve bilimsel görüntüleme veya gürültünün kaçınılmaz olduğu ve mükemmel referans verileri toplamak gerçekçi olmayan herhangi bir ortamda ortaya çıkar. Model, temiz örnekler yerine, halihazırda sahip olduğunuz gürültülü görüntülerden doğrudan öğrenir ve böylece kameranızın veya sensörünüzün belirli gürültü modellerine uyum sağlar.
Öz denetimli gürültü giderme, aşağı akış bilgisayar görme görevlerinin performansını artırmak istediğinizde, ancak veri kümenizde tutarsız veya gürültülü görüntüler varsa da harika bir seçenektir. Daha net kenarlar, dokular ve yapılar elde ederek, bu yöntemler YOLO gibi modellerin sahneleri daha güvenilir bir şekildedetect, segment ve anlamasına yardımcı olur. Kısacası, gürültülü verilerle çalışıyorsanız ve temiz eğitim görüntüleri mevcut değilse, öz denetimli gürültü giderme genellikle en pratik ve etkili çözümü sunar.
Kendi kendine denetlenen gürültü gidermeyi sağlayan temel teknikler
Daha önce gördüğümüz gibi, kendi kendine denetlenen gürültü giderme, modellerin temiz etiketlere güvenmeden gürültülü görüntülerden doğrudan öğrenmesini sağlayan, derin öğrenmeye dayalı bir yapay zeka yaklaşımıdır. Bu yaklaşım, modellerin verilerin kendisinden kendi eğitim sinyallerini ürettiği kendi kendine denetlenen öğrenmenin ilkelerine dayanır.
Diğer bir deyişle, bir model gürültülü görüntüleri hem girdi hem de öğrenme sinyalinin kaynağı olarak kullanarak kendi kendine öğrenebilir. Aynı görüntünün farklı bozuk versiyonlarını karşılaştırarak veya maskelenmiş pikselleri tahmin ederek, model hangi desenlerin gerçek yapıyı temsil ettiğini ve hangilerinin sadece gürültü olduğunu öğrenir. Yinelemeli optimizasyon ve desen tanıma yoluyla, ağ anlamlı görüntü içeriğini rastgele varyasyondan ayırt etme yeteneğini kademeli olarak geliştirir.
Şekil 2. Ham görüntü ve gürültüden arındırılmış görüntü. (Kaynak)
Bu, modeli kararlı görüntü yapısını rastgele gürültüden ayırmaya yönlendiren özel öğrenme stratejileri sayesinde mümkün olmaktadır. Şimdi, bu süreci kolaylaştıran temel teknikleri ve algoritmaları ve her bir yaklaşımın modellerin daha temiz, daha güvenilir görüntüler oluşturmasına nasıl yardımcı olduğunu daha yakından inceleyelim.
Çiftli görüntü gürültü giderme yöntemleri
Gürültü giderme için kullanılan birçok erken dönem öz denetimli öğrenme yöntemi, aynı görüntünün iki gürültülü versiyonunu karşılaştırarak çalışıyordu. Görüntü her yakalandığında veya bozulduğunda gürültü rastgele değişir, ancak gerçek yapı aynı kalır, bu nedenle bu farklılıklar model için bir öğrenme sinyali olarak kullanılabilir.
Bu yaklaşımlar, eğitim sırasında gürültülü görüntü çiftlerini kullanmaya veya oluşturmaya dayandıkları için genellikle çiftli görüntü gürültü giderme yöntemleri olarak adlandırılır. Örneğin, Noise2Noise yaklaşımı (Jaakko Lehtinen ve ekibi tarafından önerilen), aynı sahnenin iki bağımsız gürültülü görüntüsünü kullanarak bir model eğitir. İki versiyon arasında gürültü desenleri farklı olduğu için, model gerçek altta yatan görüntüyü temsil eden tutarlı ayrıntıları tanımayı öğrenir.
Zamanla, bu, ağa temiz bir referans görüntüsü görmese bile rastgele gürültüyü bastırmayı ve gerçek yapıyı korumayı öğretir. Gece, ışığın az olduğu bir caddede iki fotoğraf çektiğiniz basit bir senaryo düşünün.
Her görüntüde aynı binalar, ışıklar ve gölgeler bulunur, ancak grenli gürültü farklı yerlerde görülür. Eğitim sırasında bu iki gürültülü fotoğrafı karşılaştırarak, kendi kendini denetleyen bir model hangi görsel desenlerin sabit olduğunu ve hangilerinin gürültüden kaynaklandığını öğrenebilir ve sonuçta daha temiz görüntüler oluşturma yeteneğini geliştirebilir.
Gürültü giderme için kör nokta tabanlı kendi kendine denetimli öğrenme yöntemleri
Çiftli yöntemler aynı görüntünün farklı şekilde bozulmuş iki versiyonunu karşılaştırmaya dayanırken, kör nokta yöntemleri farklı bir yaklaşım izler. Bu yöntemler, seçilen pikselleri gizleyerek modelin tek bir gürültülü görüntüden öğrenmesini sağlar, böylece ağ bozulmuş değerleri göremez.
Model daha sonra yalnızca çevredeki bağlamı kullanarak gizli pikselleri tahmin etmelidir. Temel fikir, gürültünün rastgele olduğu, ancak görüntünün temel yapısının rastgele olmadığıdır.
Model, bir pikselin gürültülü değerini kopyalamasını engelleyerek, kör nokta yöntemleri, modelin o pikselin ne olması gerektiğini, yakındaki kenarlar, dokular veya renk gradyanları gibi sabit görüntü desenlerine dayanarak tahmin etmesini teşvik eder. Noise2Void (Alexander Krull ve ekibi tarafından tanıtılan) ve Noise2Self (Joshua Batson ve Loïc Royer tarafından geliştirilen) gibi teknikler, tek tek pikselleri veya küçük komşulukları maskelemek ve modeli bunları yeniden oluşturmak için eğitmek suretiyle bu ilkeyi uygular.
Noise2Same ve PN2V gibi daha gelişmiş yaklaşımlar, birden fazla maskelenmiş versiyon arasında tutarlı tahminler uygulayarak veya belirsizliği tahmin etmek için gürültü dağılımını açıkça modelleyerek sağlamlığı artırır. Bu yöntemler yalnızca tek bir gürültülü görüntü gerektirdiğinden, mikroskopi, astronomi, biyomedikal görüntüleme veya düşük ışıkta fotoğrafçılık gibi temiz veya eşleştirilmiş görüntülerin yakalanmasının pratik olmadığı veya imkansız olduğu alanlarda özellikle yararlıdır.
Transformatör destekli gürültü giderme yöntemleri
Çoğu ikili ve kör nokta kendi kendine denetlenen gürültü giderme yöntemi, evrişimli sinir ağları (CNN) veya gürültü giderme ağlarına dayanır. CNN'ler, kenarlar, dokular ve küçük ayrıntılar gibi yerel desenlere odaklandıkları için bu yaklaşımlar için mükemmel bir seçenektir.
U-Net gibi mimariler, ince ayrıntılı özellikleri çok ölçekli bilgilerle birleştirdikleri için yaygın olarak kullanılmaktadır. Ancak CNN'ler çoğunlukla sınırlı komşuluklar içinde çalışır, bu da görüntünün daha geniş bölgelerini kapsayan önemli ilişkileri gözden kaçırabilecekleri anlamına gelir.
Bu sınırlamayı gidermek için, transformatör destekli son teknoloji gürültü giderme yöntemleri geliştirildi. Önerilen yöntem, yalnızca yakındaki pikselleri incelemek yerine, dikkat mekanizmalarını kullanarak görüntünün farklı bölümlerinin birbirleriyle nasıl ilişkili olduğunu anlamaya çalışır.
Bazı modeller tam küresel dikkat kullanırken, diğerleri hesaplamayı azaltmak için pencere tabanlı veya hiyerarşik dikkat kullanır, ancak genel olarak, CNN'lerin tek başına yapamadığı uzun menzilli yapıları yakalamak için tasarlanmıştır. Bu daha geniş bakış açısı, modelin tekrarlanan dokuları, pürüzsüz yüzeyleri veya görüntünün tamamından bilgi gerektiren büyük nesneleri geri yüklemesine yardımcı olur.
Diğer görüntü gürültü giderme yöntemleri
Kendi kendine denetlenen tekniklerin yanı sıra, gürültülü görüntüleri temizlemenin birkaç başka yolu da vardır. İki taraflı filtreleme, dalgacık gürültü giderme ve yerel olmayan araçlar gibi geleneksel yöntemler, önemli ayrıntıları korumaya çalışırken gürültüyü yumuşatmak için basit matematiksel kurallar kullanır.
Bu arada, temiz-gürültülü görüntü çiftlerinden öğrenen denetimli modeller ve daha keskin, daha gerçekçi sonuçlar üreten üretken rakip ağlar (GAN'lar) da dahil olmak üzere derin öğrenme yaklaşımları da mevcuttur. Ancak, bu yöntemler genellikle eğitim için daha iyi görüntü kalitesi gerektirir.
Kendi kendine denetlenen görüntü gürültü gidermenin nasıl çalıştığına adım adım bir bakış
Birkaç farklı tekniği inceledik, bu tekniklerin her birinin kendi mimarisini kullandığı için tamamen farklı şekilde çalışıp çalışmadığını merak ediyor olabilirsiniz. Ancak, hepsi veri hazırlama ile başlayan ve model değerlendirme ile biten benzer bir süreç izler.
Şimdi, genel olarak kendi kendine denetlenen gürültü giderme görüntü işleminin adım adım nasıl çalıştığını daha yakından inceleyelim.
Adım 1: Ön işleme ve normalleştirme
Model gürültülü görüntülerden öğrenmeye başlamadan önce, ilk adım tüm görüntülerin tutarlı görünmesini sağlamaktır. Gerçek fotoğraflar çok farklı olabilir.
Bazı görüntüler çok parlak, diğerleri çok karanlık olabilir ve bazılarının renkleri biraz farklı olabilir. Bu varyasyonları doğrudan bir modele beslersek, modelin gürültünün neye benzediğini öğrenmeye odaklanması zorlaşır.
Bunu gerçekleştirmek için, her görüntü normalleştirme ve temel ön işleme tabi tutulur. Bu işlemler arasında piksel değerlerinin standart bir aralığa ölçeklendirilmesi, yoğunluk farklılıklarının düzeltilmesi veya kırpma ve yeniden boyutlandırma yer alabilir. Önemli olan, modelin istikrarlı ve karşılaştırılabilir girdiler olarak kullanılabilecek temiz veriler almasıdır.
Adım 2: Kendi kendine denetlenen bir eğitim sinyali oluşturma
Görüntüler normalleştirildikten sonra, bir sonraki adım, modelin temiz bir görüntü görmeden öğrenmesini sağlayan bir eğitim sinyali oluşturmaktır. Kendi kendine denetlenen gürültü giderme yöntemleri, modelin aldığı gürültülü piksel değerlerini basitçe kopyalayamayacağından emin olarak bunu gerçekleştirir.
Bunun yerine, modelin öngörülemeyen gürültüden ziyade, sabit bir yapı içeren görüntünün çevresindeki bağlama güvenmesi gereken durumlar yaratırlar. Farklı yöntemler bunu biraz farklı şekillerde başarır, ancak temel fikir aynıdır.
Bazı yaklaşımlar belirli pikselleri geçici olarak gizler veya maskeler, böylece model bunları komşularından çıkarmak zorundadır, diğerleri ise aynı gürültülü görüntünün ayrı bir şekilde bozulmuş bir versiyonunu oluşturur, böylece girdi ve hedef bağımsız gürültü içerir. Her iki durumda da, hedef görüntü anlamlı yapısal bilgiler taşır, ancak ağın tahmin etmesi gereken pikselin orijinal gürültülü değerine erişmesini engeller.
Altta yatan görüntü sabit kalırken gürültü rastgele değiştiği için, bu yapılandırma modelin gerçek yapının nasıl olduğunu öğrenmesini ve bir versiyondan diğerine değişen gürültüyü görmezden gelmesini doğal olarak teşvik eder.
Adım 3: Görüntü yapısını kurtarmak için gürültü gidermeyi öğrenme
Eğitim sinyali hazır olduğunda, model, model eğitimi yoluyla anlamlı görüntü yapısını gürültüden ayırmayı öğrenmeye başlayabilir. Maskeli veya yeniden bozulmuş bir pikseli her tahmin ettiğinde, o noktayı başlangıçta işgal eden gürültülü değer yerine çevredeki bağlama güvenmelidir.
Birçok yineleme veya dönem boyunca, bu, ağa bir görüntüde sabit kalan kenarlar, dokular ve pürüzsüz yüzeyler gibi desen türlerini tanımayı öğretir. Ayrıca, gürültüyü karakterize eden rastgele dalgalanmaları görmezden gelmeyi de öğrenir.
Örneğin, bir yüzeyin aşırı grenli göründüğü düşük ışıklı bir fotoğrafı düşünün. Gürültü pikselden piksele değişse de, altta yatan yüzey hala pürüzsüzdür. Bu tür bölgelerdeki gizli pikselleri tekrar tekrar tahmin ederek, model gürültünün altındaki sabit deseni tanımada ve daha temiz bir şekilde yeniden oluşturmada giderek daha iyi hale gelir.
Model eğitim süreci boyunca, ağ görüntünün yapısının içsel temsilini öğrenir. Bu, girdi büyük ölçüde bozulmuş olsa bile modelin tutarlı ayrıntıları kurtarmasını sağlar.
Adım 4: Doğrulama ve gürültü azaltma sonuçları
Model, gizli veya yeniden bozulmuş pikselleri tahmin etmeyi öğrendikten sonra, son adım tam görüntüler üzerinde ne kadar iyi performans gösterdiğini değerlendirmektir. Test sırasında, model gürültülü bir görüntünün tamamını alır ve görüntü yapısı hakkında öğrendiklerine dayanarak gürültüsüz bir versiyon üretir. Bu sürecin ne kadar etkili olduğunu ölçmek için, çıktı temiz referans görüntüler veya standart karşılaştırma veri kümeleriyle karşılaştırılır.
Yaygın olarak kullanılan iki ölçüt, yeniden yapılandırmanın temiz gerçek verilere ne kadar yakın olduğunu ölçen PSNR (Tepe Sinyal-Gürültü Oranı) ve kenarlar ve dokular gibi önemli özelliklerin ne kadar iyi korunduğunu değerlendiren SSIM (Yapısal Benzerlik Endeksi) dir. Daha yüksek puanlar genellikle daha doğru ve görsel olarak daha güvenilir gürültü giderme işlemini gösterir.
Eğitim ve karşılaştırma için kullanılan görüntü veri kümeleri
IEEE dergilerinde ve CVF konferanslarında, CVPR, ICCV ve ECCV gibi konferanslarda yayınlanan ve arXiv'de yaygın olarak dağıtılan kendi kendine denetlenen gürültü giderme araştırmaları, genellikle kontrollü ve pratik koşullar altında derin öğrenme yöntemlerinin model performansını değerlendirmek için sentetik ve gerçek dünya veri kümelerinin bir karışımına dayanır. Bir yandan, sentetik veri kümeleri temiz görüntülerle başlar ve yapay gürültü ekler, bu da PSNR ve SSIM gibi metrikleri kullanarak yöntemleri karşılaştırmayı kolaylaştırır.
İşte, karşılaştırma için sentetik gürültü eklenmiş, yaygın olarak kullanılan bazı popüler veri kümeleri:
Kodak24: Bu veri kümesi, gürültü giderme sonuçlarını görsel olarak karşılaştırmak için yaygın olarak kullanılan yüksek kaliteli doğal sahne fotoğrafları sağlar.
DIV2K: Bu yüksek çözünürlüklü veri seti, doku doğruluğunu ve genel restorasyon kalitesini değerlendirmek için kullanılan çeşitli, ayrıntılı görüntüler içerir.
Öte yandan, gerçek dünyadaki gürültülü veri kümeleri, düşük ışık, yüksek ISO veya diğer zorlu koşullar altında kamera sensörlerinden doğrudan yakalanan görüntüleri içerir. Bu veri kümeleri, bir modelin kolayca simüle edilemeyen karmaşık, Gauss olmayan gürültüyü işleyip işleyemeyeceğini test eder.
İşte bazı popüler gerçek dünya gürültülü veri kümeleri:
SIDD: Bu veri seti, çeşitli aydınlatma ortamlarında akıllı telefon sensörleriyle çekilmiş gerçek gürültülü ve temiz görüntü çiftlerini içerir.
DND: Tüketici kameralarında bulunan gerçekçi sensör gürültü modellerini yakalayan yüksek ISO fotoğrafları içerir.
Kendi kendini denetleyen gürültü giderme modelini eğitirken dikkate alınması gereken faktörler
Derin öğrenme tabanlı, kendi kendini denetleyen gürültü giderme modelini eğitecekseniz dikkate almanız gereken bazı faktörler ve sınırlamalar şunlardır:
Gürültü dağılımını eşleştirin: Eğitim için kullanılan gürültülü görüntüler, modelin gerçek kullanımda karşılaşacağı gürültüyü yansıtmalıdır; uyumsuz gürültü, zayıf genellemeye yol açar.
Eğitim verilerinin çeşitliliğini sağlayın: Sınırlı çeşitlilik, karmaşık dokularda aşırı uyum veya aşırı yumuşatmaya neden olabilir.
Gürültü türü sınırlamalarının farkında olun: Kendi kendini denetleyen yöntemler, yapılandırılmış, ilişkili veya rastgele olmayan gürültülerle daha fazla zorluk çeker.
Cihazlar veya sensörler arasında test yapın: Gürültü giderme performansı, kameralar veya görüntüleme sistemleri arasında büyük farklılıklar gösterebilir.
Önemli çıkarımlar
Kendi kendine denetlenen gürültü giderme, AI meraklılarına, yalnızca halihazırda sahip olduğumuz gürültülü verileri kullanarak görüntüleri temizlemenin pratik bir yolunu sunar. Gürültünün altındaki gerçek yapıyı tanımayı öğrenerek, bu yöntemler önemli görsel ayrıntıları geri kazanabilir. Gürültü giderme teknolojisi gelişmeye devam ettikçe, günlük ortamlarda çok çeşitli bilgisayar görme görevlerini daha güvenilir hale getirecektir.