Görüntü işlemede kenar algılama. Kenarları doğru bir şekilde tespit etmek ve sağlam kenar tanıma elde etmek için Sobel, Canny ve diğer kenar algılama algoritmalarını öğrenin.

Görüntü işlemede kenar algılama. Kenarları doğru bir şekilde tespit etmek ve sağlam kenar tanıma elde etmek için Sobel, Canny ve diğer kenar algılama algoritmalarını öğrenin.
İnsanlar olarak, bir görüntüye bakarken doğal olarak nesnelerin kenarlarını tanır, eğrilerini takip eder ve yüzeylerindeki dokuları fark ederiz. Ancak bir bilgisayar için anlama tek tek pikseller düzeyinde başlar.
Dijital bir görüntünün en küçük birimi olan piksel, renk ve parlaklığı tek bir noktada depolar. Bir bilgisayar, bir görüntü boyunca bu piksel değerlerindeki değişiklikleri izleyerek, önemli ayrıntıları ortaya çıkaran desenleri tespit edebilir.
Özellikle görüntü işleme, temel özellikleri vurgulamak ve dikkat dağıtıcı unsurları ortadan kaldırmak için piksel verilerini kullanır. Yaygın görüntü işleme tekniklerinden biri, nesnelerin ana hatlarını çizmek, sınırları işaretlemek ve yapı eklemek için parlaklık veya rengin keskin bir şekilde değiştiği noktaları tanımlayan kenar algılamadır.
Bu, bilgisayarların şekilleri ayırmasını, boyutları ölçmesini ve bir sahnenin parçalarının nasıl bağlandığını yorumlamasını sağlar. Kenar algılama genellikle gelişmiş görüntü analizinin ilk adımıdır.
Bu makalede, kenar algılamanın ne olduğuna, nasıl çalıştığına ve gerçek dünyadaki uygulamalarına göz atacağız. Hadi başlayalım!
Kenar algılama, bir görüntüde parlaklığın veya rengin bir noktadan diğerine belirgin şekilde değiştiği yerleri aramaya odaklanır. Değişim küçükse, alan pürüzsüz görünür. Değişim keskinse, genellikle iki farklı bölge arasındaki sınırı işaret eder.
İşte bu piksel değişikliklerinin meydana gelmesinin nedenlerinden bazıları:
Kenar algılama genellikle renkli bir görüntüyü gri tonlamalı bir görüntüye dönüştürerek başlar, böylece her nokta yalnızca parlaklığı gösterir. Bu, algoritmanın renk yerine açık ve koyu farklılıklara odaklanmasını kolaylaştırır.
Daha sonra, özel filtreler parlaklığın aniden değiştiği yerleri bulmak için görüntüyü tarayabilir. Bu filtreler, gradyan adı verilen parlaklığın ne kadar dik değiştiğini hesaplar. Daha yüksek bir gradyan, yakındaki noktalar arasındaki daha büyük bir farktan kaynaklanır ve bu da genellikle bir kenara işaret eder.
Algoritma daha sonra görüntüyü rafine etmeye devam eder, küçük ayrıntıları kaldırır ve yalnızca en önemli çizgileri ve şekilleri korur. Sonuç, daha fazla analiz için kullanılabilecek net bir taslak ve çıktı görüntüsüdür.
Kenar algılamayı daha ayrıntılı olarak incelemeden önce, zaman içinde nasıl geliştiğini ele alalım.
Görüntü işleme, resimleri temizlemek ve iyileştirmek için eşikleme ve filtreleme gibi basit, kural tabanlı yöntemlerle başladı. Analog çağda bu, ayrıntıları ortaya çıkarmak için optik filtreler, büyüteçler veya kimyasal işlemler kullanarak fotoğraflarla veya filmlerle çalışmak anlamına geliyordu.
Kontrast ayarı, gürültü azaltma, görüntü yoğunluğunu ayarlama ve temel kenar algılama gibi teknikler, giriş görüntülerini daha net hale getirmeye ve şekilleri ve dokuları vurgulamaya yardımcı oldu. 1960'larda ve 70'lerde analogdan dijital işlemeye geçiş astronomi, tıbbi görüntüleme ve uydu izleme gibi alanlarda modern analizlerin önünü açtı.
1980'ler ve 90'lara gelindiğinde, daha hızlı bilgisayarlar özellik çıkarma, şekil algılama ve temel nesne tanıma gibi daha karmaşık görevlerin üstesinden gelmeyi mümkün kıldı. Sobel operatörü ve Canny gibi algoritmalar daha hassas kenar tespiti sunarken, örüntü tanıma endüstriyel otomasyondan optik karakter tanıma yoluyla basılı metin okumaya kadar her alanda uygulama alanı buldu.
Günümüzde, teknolojideki istikrarlı ilerlemeler bilgisayarla görmenin gelişmesine yol açmıştır. Görme yapay zekası veya bilgisayarla görme, makinelere görsel bilgileri yorumlamayı ve anlamayı öğretmeye odaklanan bir yapay zeka dalıdır.
Çift eşikleme (güçlü kenarları koruyarak ve zayıf olanları kaldırarak görüntüleri daha net hale getirir) ve kenar algılama gibi geleneksel görüntü işleme, sabit kuralları takip ederken ve yalnızca belirli görevleri yerine getirebilirken, bilgisayarla görme, örneklerden öğrenebilen ve yeni durumlara uyum sağlayabilen veri odaklı modeller kullanır.
Günümüzde görüntüleme sistemleri, görüntüleri iyileştirmenin veya kenarları tespit etmenin çok ötesine geçmiştir. Nesneleri tanıyabilir, hareketi izleyebilir ve tüm sahnenin bağlamını anlayabilirler.
Bunu mümkün kılan temel tekniklerden biri konvolüsyondur. Konvolüsyon işlemi, küçük filtrelerin (kernel olarak da adlandırılır) kenarlar, köşeler ve dokular gibi önemli desenleri bulmak için bir görüntüyü taradığı bir işlemdir. Bu desenler, bilgisayarla görme modellerinin nesneleri tanımak ve anlamak için kullandığı yapı taşları haline gelir.
Örneğin, Ultralytics YOLO11 gibi bilgisayarla görme modelleri, örnek segmentasyonu gibi gelişmiş görevleri gerçekleştirmek için bu konvolüsyon tabanlı özellikleri kullanır. Bu, kenar algılama ile yakından ilgilidir çünkü örnek segmentasyonu, bir görüntüdeki her nesnenin sınırlarının doğru bir şekilde çizilmesini gerektirir.
Kenar algılama, nesne kenarlarını işaretlemek için kenar piksellerindeki yoğunluk değişikliklerini bulmaya odaklanırken, örnek segmentasyonu, kenarları tespit etmek, sınıflandırmak ve her nesneyi kendi bölgesine ayırmak için bu fikri temel alır.
Bilgisayarlı görü alanındaki büyümeye rağmen, görüntü işleme hala birçok uygulamanın önemli bir parçasıdır. Bunun nedeni, bilgisayarla görmenin genellikle temel görüntü ön işleme adımları üzerine inşa edilmesidir.
Nesneleri tespit etmeden veya bir sahneyi anlamadan önce, sistemler genellikle görüntüyü temizler, gürültüyü azaltır ve önemli ayrıntıları öne çıkarmak için kenarları bulur. Bu adımlar gelişmiş modelleri daha doğru ve verimli hale getirir.
Şimdi, kenarları tespit etmek için kullanılan en yaygın görüntü işleme algoritmalarından bazılarını ve nasıl çalıştıklarını inceleyelim.
Sobel kenar algılama, bir görüntüdeki nesnelerin ana hatlarını bulmak için kullanılan önemli bir yöntemdir. Her ayrıntıyı bir kerede analiz etmek yerine, parlaklığın bir pikselden bir sonraki komşu piksele keskin bir şekilde değiştiği alanlara odaklanır.
Bu ani kaymalar genellikle bir nesnenin bitip diğerinin başladığı ya da bir nesnenin arka planla buluştuğu noktayı işaret eder. Sobel, bu kenarları izole ederek karmaşık bir görüntüyü, diğer sistemlerin hareketi izleme, şekilleri algılama veya nesneleri tanıma gibi görevler için işlemesi daha kolay olan daha temiz bir taslağa dönüştürür.
Sobel kenar algılamayı, bir görüntü boyunca yoğunluğun nasıl değiştiğini ölçen bir gradyan dedektörü olarak düşünebilirsiniz. Özünde, bu bir konvolüsyon işlemi ile çalışır: kernel adı verilen küçük matrisleri görüntü boyunca kaydırmak ve komşu piksel değerlerinin ağırlıklı toplamlarını hesaplamak.
Bu çekirdekler, yatay ve dikey yönler boyunca parlaklıktaki değişiklikleri vurgulamak için tasarlanmıştır. Çekirdeklerin verilerden öğrenildiği derin öğrenme modellerinin aksine Sobel, eğitim gerektirmeden kenarları verimli bir şekilde vurgulamak için sabit çekirdekler kullanır.
İşte Sobel kenar algılama yönteminin nasıl çalıştığına daha yakından bir bakış:
Canny kenar algılama, bir görüntüdeki kenarları bulmak için kullanılan bir diğer popüler yöntemdir. Temiz ve kesin ana hatlar üretmesiyle bilinir. Temel kenar algılama tekniklerinin aksine, gürültüyü filtrelemek, sınırları keskinleştirmek ve en önemli kenarlara odaklanmak için dikkatle tasarlanmış bir dizi adımı izler.
İşte Canny kenar dedektörünün nasıl çalıştığına dair hızlı bir genel bakış:
Gürültüyü filtrelerken doğru sonuçlar verdiği için Canny kenar algılama, hassasiyetin önemli olduğu alanlarda yaygın olarak kullanılmaktadır. Örneğin, tıbbi görüntüleme, uydu haritalama, belge tarama ve robotik görüş gibi sektörlerde kullanılır.
Şimdiye kadar incelediğimiz iki kenar algılama örneği Sobel ve Canny idi. Her ikisi de kenarları bulmayı amaçlasa da, soruna farklı şekilde yaklaşırlar.
Gradyan tabanlı yöntemler (Sobel, Prewitt ve Scharr gibi), gradyan olarak bilinen parlaklıktaki keskin değişiklikleri arayarak kenarları tespit eder. Görüntüyü tararlar ve bu değişimin en güçlü olduğu yerleri işaretlerler. Bu yöntemler basit, hızlı ve görüntüler net olduğunda iyi çalışır. Ancak gürültüye karşı hassastırlar - parlaklıktaki küçük değişimler kenar sanılabilir.
Gauss tabanlı yöntemler (Canny veya Laplacian of Gaussian gibi) bu sorunu çözmek için ekstra bir adım ekler: önce görüntüyü bulanıklaştırmak. Genellikle bir Gauss filtresiyle yapılan bu yumuşatma, yanlış kenarlar oluşturabilecek küçük varyasyonları azaltır. Düzleştirmeden sonra, bu yöntemler hala keskin parlaklık değişiklikleri arar, ancak sonuçlar gürültülü veya düşük kaliteli görüntüler için daha temiz ve daha doğrudur.
Kenar algılamanın nasıl çalıştığını daha iyi anladıktan sonra, gerçek dünya koşullarında nasıl uygulandığını inceleyelim.
Köprüler ve yüksek binalar gibi büyük beton yapıların denetimi genellikle zorlu ve tehlikeli bir iştir. Bu yapılar uzun mesafelere yayılabilir veya yüksek kotlara ulaşabilir, bu da geleneksel denetimleri yavaş, pahalı ve riskli hale getirir. Bu denetimler ayrıca tipik olarak iskele, iple erişim, manuel yakın çekim ölçümler veya fotoğrafçılık gerektirir.
Araştırmacıların, beton yüzeylerin ayrıntılı giriş görüntülerini yakalamak için yüksek çözünürlüklü kameralarla donatılmış dronları kullanarak daha güvenli ve daha hızlı bir yöntemi test ettikleri 2019'da ilginç bir yaklaşım keşfedildi. Bu görüntüler daha sonra çatlakları otomatik olarak tanımlamak için çeşitli kenar algılama teknikleriyle işlendi.
Çalışma, bu yöntemin tehlikeli alanlara doğrudan insan erişimi ihtiyacını önemli ölçüde azalttığını ve denetimleri hızlandırdığını gösterdi. Ancak doğruluğu yine de aydınlatma koşulları, görüntü netliği ve drone'un istikrarlı çalışması gibi faktörlere bağlıydı. Bazı durumlarda, yanlış pozitifleri ortadan kaldırmak için hala insan incelemesi gerekiyordu.
X-ışınları ve MRI'lar genellikle gürültü olarak bilinen ve ince ayrıntıların görülmesini zorlaştırabilen görsel bozukluklar içerir. Bu durum, bir tümörün kenarlarını tespit etmeye, bir organın ana hatlarını çizmeye veya zaman içindeki ince değişiklikleri izlemeye çalışan doktorlar için bir zorluk haline gelir.
Yakın zamanda yapılan bir tıbbi görüntüleme çalışması, Sobel, Canny, Prewitt ve Laplacian gibi yaygın kenar algılama yöntemlerinin gürültülü görüntülerle ne kadar iyi başa çıktığını test etti. Araştırmacılar görüntülere farklı tür ve seviyelerde gürültü ekleyerek her bir yöntemin önemli özellikleri ne kadar doğru bir şekilde ortaya çıkarabildiğini kontrol etti.
Canny, gürültü yoğun olduğunda bile genellikle en temiz kenarları üretti, ancak her durumda en iyisi değildi. Bazı yöntemler belirli gürültü modellerinde daha iyi sonuç verdi, bu nedenle tek bir mükemmel çözüm yok.
Bu, bilgisayarla görme gibi teknolojilerin neden bu kadar önemli olduğunu vurgulamaktadır. Gelişmiş algoritmaları ve Vision AI modellerini bir araya getiren bu tür çözümler, zorlu koşullarda bile daha doğru ve güvenilir sonuçlar sunmak için temel kenar algılamanın ötesine geçebilir.
Kenar algılama ve görüntü işleme kullanmanın faydalarından bazıları şunlardır:
Görüntü işlemede kenar algılamanın birçok faydası olsa da, bazı zorlukları da beraberinde getirir. İşte dikkate alınması gereken bazı temel sınırlamalar:
Kenar algılama, gözlerimizin ve beynimizin dünyayı anlamlandırmak için birlikte nasıl çalıştığından ilham alır. İnsan görüşü söz konusu olduğunda, görsel korteksteki özel nöronlar kenarlara, çizgilere ve sınırlara karşı oldukça hassastır.
Bu görsel ipuçları, bir nesnenin nerede bitip diğerinin nerede başladığını hızlıca belirlememize yardımcı olur. Bu nedenle basit bir çizgi çizimi bile anında tanınabilir - beynimiz şekilleri ve nesneleri tanımlamak için büyük ölçüde kenarlara güvenir.
Bilgisayarla görme bu yeteneği taklit etmeyi amaçlar ancak bunu bir adım öteye taşır. Ultralytics YOLO11 gibi modeller temel kenar vurgulama ve görüntü iyileştirmenin ötesine geçer. Nesneleri tespit edebilir, hassas bir şekilde ana hatlarını çizebilir ve gerçek zamanlı olarak hareketi izleyebilirler. Bu daha derin anlayış seviyesi, kenar algılamanın tek başına yeterli olmadığı senaryolarda onları gerekli kılar.
İşte YOLO11 tarafından desteklenen ve kenar algılamanın ötesine geçen bazı temel bilgisayarla görme görevleri:
Geleneksel olarak kenar tespitine dayanan bir uygulamayı geliştiren bilgisayarla görmeye iyi bir örnek, altyapı ve endüstriyel varlıklarda çatlak tespitidir. YOLO11 gibi bilgisayarlı görü modelleri yollar, köprüler ve boru hatlarındaki çatlakları doğru bir şekilde tespit etmek için eğitilebilir. Aynı teknik uçak bakımında, bina denetimlerinde ve üretim kalite kontrolünde de uygulanarak denetimlerin hızlandırılmasına ve güvenliğin artırılmasına yardımcı olabilir.
Kenar algılama, basit ilk yöntemlerden karmaşık görüntülerdeki ince sınırları bile tespit edebilen gelişmiş tekniklere kadar uzun bir yol kat etti. Önemli ayrıntıları ortaya çıkarmaya, kilit alanları vurgulamaya ve görüntüleri daha derin analizler için hazırlamaya yardımcı olarak görüntü işlemenin temel bir parçası haline gelmiştir.
Bilgisayarla görmede kenar algılama, şekillerin tanımlanmasında, nesnelerin ayrılmasında ve faydalı bilgilerin çıkarılmasında önemli bir rol oynar. Doğru ve güvenilir görsel anlayış sağlamak için tıbbi görüntüleme, endüstriyel denetimler, otonom sürüş ve güvenlik gibi birçok alanda kullanılır.
Topluluğumuza katılın ve yapay zeka hakkında daha fazlasını keşfetmek için GitHub depomuzu keşfedin. Kendi Vision AI projenizi başlatmak istiyorsanız lisanslama seçeneklerimize göz atın. Çözüm sayfalarımızı ziyaret ederek sağlık hizmetlerinde yapay zeka ve perakendede Vision AI gibi uygulamalar hakkında daha fazlasını keşfedin.