Görüntü işlemede kenar algılama. Kenarları doğru bir şekilde algılamak ve sağlam kenar tanıma elde etmek için Sobel, Canny ve diğer kenar algılama algoritmalarını öğrenin.

Görüntü işlemede kenar algılama. Kenarları doğru bir şekilde algılamak ve sağlam kenar tanıma elde etmek için Sobel, Canny ve diğer kenar algılama algoritmalarını öğrenin.
İnsanlar olarak, bir resme baktığımızda nesnelerin kenarlarını doğal olarak tanır, eğrilerini takip eder ve yüzeylerindeki dokuları fark ederiz. Ancak bir bilgisayar için anlama, tek tek pikseller düzeyinde başlar.
Dijital bir görüntünün en küçük birimi olan bir piksel, tek bir noktada renk ve parlaklığı depolar. Bir görüntüdeki bu piksel değerlerindeki değişiklikleri izleyerek, bir bilgisayar önemli ayrıntıları ortaya çıkaran kalıpları algılayabilir.
Özellikle, görüntü işleme, temel özellikleri vurgulamak ve dikkat dağıtıcı unsurları kaldırmak için piksel verilerini kullanır. Yaygın bir görüntü işleme tekniği, nesnelerin ana hatlarını çizmek, sınırları işaretlemek ve yapı eklemek için parlaklık veya rengin keskin bir şekilde değiştiği noktaları tanımlayan kenar algılamadır.
Bu, bilgisayarların şekilleri ayırmasını, boyutları ölçmesini ve bir sahnenin parçalarının nasıl bağlandığını yorumlamasını sağlar. Kenar algılama genellikle gelişmiş görüntü analizinde ilk adımdır.
Bu makalede, kenar algılamanın ne olduğuna, nasıl çalıştığına ve gerçek dünya uygulamalarına bakacağız. Hadi başlayalım!
Kenar algılama, bir görüntüde parlaklık veya rengin bir noktadan diğerine belirgin şekilde değiştiği yerleri aramaya odaklanır. Değişim küçükse, alan pürüzsüz görünür. Değişim keskinse, genellikle iki farklı bölge arasındaki sınırı işaret eder.
Piksel değişikliklerinin meydana gelmesinin bazı nedenleri şunlardır:
Kenar algılama genellikle bir renkli görüntüyü gri tonlamalı bir görüntüye dönüştürerek başlar, böylece her nokta yalnızca parlaklığı gösterir. Bu, algoritmanın renk yerine ışık ve karanlık farklılıklarına odaklanmasını kolaylaştırır.
Daha sonra, özel filtreler parlaklığın aniden değiştiği yerleri bulmak için görüntüyü tarayabilir. Bu filtreler, parlaklığın ne kadar dik değiştiğini hesaplar ve buna gradyan denir. Daha yüksek bir gradyan, yakındaki noktalar arasındaki daha büyük bir farktan kaynaklanır ve bu genellikle bir kenarı işaret eder.
Algoritma daha sonra görüntüyü iyileştirmeye devam eder, küçük ayrıntıları kaldırır ve yalnızca en önemli çizgileri ve şekilleri tutar. Sonuç, daha fazla analiz için kullanılabilecek net bir ana hat ve çıktı görüntüsüdür.
Kenar algılamaya daha ayrıntılı olarak dalmadan önce, zaman içinde nasıl geliştiğini tartışalım.
Görüntü işleme, resimleri temizlemek ve iyileştirmek için eşikleme ve filtreleme gibi basit, kural tabanlı yöntemlerle başladı. Analog çağda bu, ayrıntıları ortaya çıkarmak için optik filtreler, büyüteçler veya kimyasal işlemler kullanılarak fotoğraflar veya filmlerle çalışmak anlamına geliyordu.
Kontrast ayarı, gürültü azaltma, görüntü yoğunluğunu ayarlama ve temel kenar algılama gibi teknikler, girdi görüntülerini daha net hale getirmeye ve şekilleri ve dokuları vurgulamaya yardımcı oldu. 1960'larda ve 70'lerde, analogdan dijital işlemeye geçiş, astronomi, tıbbi görüntüleme ve uydu izleme gibi alanlarda modern analizin yolunu açtı.
1980'ler ve 90'larda, daha hızlı bilgisayarlar özellik çıkarımı, şekil tespiti ve temel nesne tanıma gibi daha karmaşık görevlerin üstesinden gelmeyi mümkün kıldı. Sobel operatörü ve Canny gibi algoritmalar daha hassas kenar tespiti sunarken, örüntü tanıma endüstriyel otomasyondan optik karakter tanıma yoluyla basılı metin okumaya kadar her alanda uygulama alanı buldu.
Günümüzde, teknolojideki sürekli ilerlemeler bilgisayarla görmenin geliştirilmesine yol açmıştır. Görü YZ'si veya bilgisayarla görme, makinelerin görsel bilgileri yorumlamayı ve anlamayı öğretmeye odaklanan bir YZ dalıdır.
Çift eşikleme (güçlü kenarları koruyarak ve zayıf olanları kaldırarak görüntüleri daha net hale getiren) ve kenar algılama gibi geleneksel görüntü işleme, sabit kuralları izledi ve yalnızca belirli görevleri yerine getirebilirken, bilgisayar görüşü örneklerden öğrenebilen ve yeni durumlara uyum sağlayabilen veri odaklı modeller kullanır.
Günümüzde, görüntüleme sistemleri sadece görüntüleri iyileştirmenin veya kenarları algılamanın çok ötesine geçiyor. Nesneleri tanıyabilir, hareketi takip edebilir ve tüm bir sahnenin bağlamını anlayabilirler.
Bunu mümkün kılan temel tekniklerden biri de evrişimdir. Evrişim işlemi, kenarlar, köşeler ve dokular gibi önemli desenleri bulmak için küçük filtrelerin (çekirdekler olarak da adlandırılır) bir görüntüyü taradığı bir işlemdir. Bu desenler, bilgisayarlı görü modellerinin nesneleri tanımak ve anlamak için kullandığı yapı taşları haline gelir.
Örneğin, Ultralytics YOLO11 gibi bilgisayar görüşü modelleri, örnek segmentasyonu gibi gelişmiş görevleri gerçekleştirmek için bu konvolüsyon tabanlı özellikleri kullanır. Bu, kenar tespiti ile yakından ilişkilidir, çünkü örnek segmentasyonu bir görüntüdeki her nesnenin sınırlarını doğru bir şekilde ana hatlarıyla belirtmeyi gerektirir.
Kenar tespiti, nesne kenarlarını işaretlemek için kenar piksellerindeki yoğunluk değişikliklerini bulmaya odaklanırken, örnek segmentasyonu bu fikri temel alarak kenarları algılar, sınıflandırır ve her nesneyi kendi bölgesine ayırır.
Bilgisayarlı görmenin büyümesine rağmen, görüntü işleme hala birçok uygulamanın önemli bir parçasıdır. Bunun nedeni, bilgisayarlı görmenin genellikle temel görüntü ön işleme adımları üzerine inşa edilmesidir.
Nesneleri algılamadan veya bir sahneyi anlamadan önce, sistemler genellikle görüntüyü temizler, gürültüyü azaltır ve önemli ayrıntıların öne çıkmasını sağlamak için kenarları bulur. Bu adımlar, gelişmiş modelleri daha doğru ve verimli hale getirir.
Şimdi de kenarları tespit etmek için kullanılan en yaygın görüntü işleme algoritmalarından bazılarını ve bunların nasıl çalıştığını inceleyelim.
Sobel kenar algılama, bir görüntüdeki nesnelerin ana hatlarını bulmak için kullanılan önemli bir yöntemdir. Her ayrıntıyı aynı anda analiz etmek yerine, parlaklığın bir pikselden bir sonraki komşu piksele keskin bir şekilde değiştiği alanlara odaklanır.
Bu ani kaymalar genellikle bir nesnenin bittiği ve diğerinin başladığı veya bir nesnenin arka planla buluştuğu noktayı işaretler. Bu kenarları izole ederek, Sobel, karmaşık bir görüntüyü, hareketleri izleme, şekilleri algılama veya nesneleri tanıma gibi görevler için diğer sistemlerin işlemesi daha kolay olan daha temiz bir ana hatta dönüştürür.
Sobel kenar tespitini, bir görüntüdeki yoğunluk değişimini ölçen bir gradyan dedektörü olarak düşünebilirsiniz. Temelde bu, bir konvolüsyon işlemiyle çalışır: çekirdek adı verilen küçük matrisleri görüntü üzerinde kaydırarak komşu piksel değerlerinin ağırlıklı toplamlarını hesaplar.
Bu çekirdekler, yatay ve dikey yönlerdeki parlaklık değişikliklerini vurgulamak için tasarlanmıştır. Çekirdeklerin verilerden öğrenildiği derin öğrenme modellerinin aksine, Sobel, eğitim gerektirmeden kenarları verimli bir şekilde vurgulamak için sabit çekirdekler kullanır.
İşte Sobel kenar algılama yönteminin nasıl çalıştığına dair daha yakından bir bakış:
Canny kenar tespiti, bir görüntüdeki kenarları bulmak için kullanılan bir diğer popüler yöntemdir. Temiz ve hassas ana hatlar üretmesiyle bilinir. Temel kenar algılama tekniklerinden farklı olarak, gürültüyü filtrelemek, sınırları keskinleştirmek ve en önemli kenarlara odaklanmak için dikkatlice tasarlanmış bir dizi adımı izler.
İşte bir Canny kenar tespit edicinin nasıl çalıştığına dair hızlı bir genel bakış:
Gürültüyü filtrelerken doğru sonuçlar verdiği için, Canny kenar algılama, hassasiyetin önemli olduğu alanlarda yaygın olarak kullanılır. Örneğin, tıbbi görüntüleme, uydu haritalama, belge tarama ve robotik görme gibi endüstrilerde kullanılır.
Şimdiye kadar baktığımız kenar algılama örnekleri Sobel ve Canny idi. Her ikisi de kenarları bulmayı amaçlasa da, soruna farklı yaklaşıyorlar.
Gradyan tabanlı yöntemler (Sobel, Prewitt ve Scharr gibi), gradyan olarak bilinen parlaklıktaki keskin değişiklikleri arayarak kenarları algılar. Görüntüyü tarar ve bu değişikliğin en güçlü olduğu yerleri işaretler. Bu yöntemler basit, hızlıdır ve görüntüler net olduğunda iyi çalışır. Ancak, gürültüye karşı hassastırlar - parlaklıktaki küçük değişiklikler kenar olarak algılanabilir.
Gauss tabanlı yöntemler (Canny veya Gaussian'ın Laplace'ı gibi) bu sorunu çözmek için ekstra bir adım ekler: önce görüntüyü bulanıklaştırmak. Genellikle bir Gauss filtresiyle yapılan bu yumuşatma, yanlış kenarlar oluşturabilecek küçük varyasyonları azaltır. Yumuşatmadan sonra, bu yöntemler hala keskin parlaklık değişiklikleri arar, ancak sonuçlar gürültülü veya düşük kaliteli görüntüler için daha temiz ve daha doğrudur.
Kenar algılamanın nasıl çalıştığına dair daha iyi bir anlayışla, bunun gerçek dünya durumlarında nasıl uygulandığını keşfedelim.
Köprüler ve yüksek binalar gibi büyük beton yapıları incelemek genellikle zorlu ve tehlikeli bir iştir. Bu yapılar uzun mesafelere yayılabilir veya yüksek noktalara ulaşabilir, bu da geleneksel incelemeleri yavaş, pahalı ve riskli hale getirir. Bu incelemeler ayrıca tipik olarak iskele, halat erişimi, manuel yakın çekim ölçümleri veya fotoğrafçılık gerektirir.
İlginç bir yaklaşım 2019'da keşfedildi; araştırmacılar, beton yüzeylerin ayrıntılı girdi görüntülerini yakalamak için yüksek çözünürlüklü kameralarla donatılmış dronlar kullanarak daha güvenli ve daha hızlı bir yöntem test ettiler. Bu görüntüler daha sonra çatlakları otomatik olarak tanımlamak için çeşitli kenar algılama teknikleriyle işlendi.
Çalışma, bu yöntemin tehlikeli alanlara doğrudan insan erişimi ihtiyacını önemli ölçüde azalttığını ve denetimleri hızlandırdığını gösterdi. Ancak, doğruluğu hala aydınlatma koşulları, görüntü netliği ve istikrarlı drone çalışması gibi faktörlere bağlıydı. Bazı durumlarda, yanlış pozitifleri ortadan kaldırmak için insan incelemesi hala gerekliydi.
Röntgen filmleri ve MR'lar genellikle ince detayları görmeyi zorlaştıran gürültü olarak bilinen görsel bozukluklar içerir. Bu durum, doktorların bir tümörün kenarlarını tespit etmeye, bir organın ana hattını çizmeye veya zaman içindeki ince değişiklikleri izlemeye çalışırken zorluk yaratır.
Yakın zamanda yapılan bir tıbbi görüntüleme çalışması, Sobel, Canny, Prewitt ve Laplacian gibi yaygın kenar algılama yöntemlerinin gürültülü görüntülerle ne kadar iyi başa çıktığını test etti. Araştırmacılar, görüntülere farklı türlerde ve seviyelerde gürültü ekledi ve her yöntemin önemli özellikleri ne kadar doğru bir şekilde ana hatlarıyla belirleyebildiğini kontrol etti.
Canny genellikle gürültü yoğun olduğunda bile en temiz kenarları üretse de, her durumda en iyi sonucu vermedi. Bazı yöntemler belirli gürültü desenleriyle daha iyi çalıştı, bu nedenle tek bir mükemmel çözüm yok.
Bu, bilgisayarlı görü gibi teknolojilerin neden bu kadar önemli olduğunu vurgulamaktadır. Gelişmiş algoritmaları ve Görsel Yapay Zeka modellerini bir araya getiren bu tür çözümler, temel kenar algılamanın ötesine geçerek zorlu koşullarda bile daha doğru ve güvenilir sonuçlar sunabilir.
Kenar algılama ve görüntü işlemenin bazı faydaları şunlardır:
Görüntü işlemede kenar tespitinin birçok faydası olmasına rağmen, bazı zorluklarla da birlikte gelir. İşte dikkate alınması gereken bazı temel sınırlamalar:
Kenar algılama, gözlerimizin ve beynimizin dünyayı anlamak için birlikte nasıl çalıştığından ilham almıştır. İnsan görme yeteneği söz konusu olduğunda, görsel korteksteki özel nöronlar kenarlara, çizgilere ve sınırlara karşı oldukça duyarlıdır.
Bu görsel ipuçları, bir nesnenin nerede bittiğini ve diğerinin nerede başladığını hızlı bir şekilde belirlememize yardımcı olur. Bu nedenle basit bir çizgi çizimi bile anında tanınabilir - beynimiz şekilleri ve nesneleri tanımlamak için büyük ölçüde kenarlara güvenir.
Bilgisayarlı görü bu yeteneği taklit etmeyi amaçlar, ancak bir adım daha ileri götürür. Ultralytics YOLO11 gibi modeller, temel kenar vurgulama ve görüntü iyileştirmenin ötesine geçer. Nesneleri algılayabilir, hassas bir şekilde ana hatlarını çizebilir ve gerçek zamanlı olarak hareketi izleyebilirler. Bu daha derin anlayış düzeyi, tek başına kenar algılamanın yeterli olmadığı senaryolarda onları vazgeçilmez kılar.
İşte YOLO11 tarafından desteklenen ve kenar algılamanın ötesine geçen bazı temel bilgisayar görüşü görevleri:
Bilgisayarlı görünün, geleneksel olarak kenar algılamaya dayanan bir uygulamayı geliştirmesine iyi bir örnek, altyapı ve endüstriyel varlıklarda çatlak tespiti yapılmasıdır. YOLO11 gibi bilgisayarlı görü modelleri, yollarda, köprülerde ve boru hatlarında çatlakları doğru bir şekilde tanımlamak için eğitilebilir. Aynı teknik, uçak bakımı, bina denetimleri ve üretim kalite kontrolünde de uygulanabilir, bu da denetimleri hızlandırmaya ve güvenliği artırmaya yardımcı olur.
Kenar algılama, basit erken yöntemlerden karmaşık görüntülerdeki en ince sınırları bile tespit edebilen gelişmiş tekniklere kadar uzun bir yol kat etti. Önemli ayrıntıları ortaya çıkarmaya, kilit alanları vurgulamaya ve görüntüleri daha derinlemesine analiz için hazırlamaya yardımcı olarak görüntü işlemenin temel bir parçası haline geliyor.
Bilgisayarlı görmede, kenar algılama şekilleri tanımlamada, nesneleri ayırmada ve faydalı bilgileri çıkarmada önemli bir rol oynar. Doğru ve güvenilir görsel anlayış sağlamak için tıbbi görüntüleme, endüstriyel denetimler, otonom sürüş ve güvenlik gibi birçok alanda kullanılır.
Topluluğumuza katılın ve yapay zeka hakkında daha fazla bilgi edinmek için GitHub depomuzu keşfedin. Kendi Görüntü İşleme Yapay Zeka projenize başlamak istiyorsanız, lisanslama seçeneklerimize göz atın. Çözüm sayfalarımızı ziyaret ederek sağlık hizmetlerinde yapay zeka ve perakende sektöründe görüntü işleme yapay zekası gibi uygulamalar hakkında daha fazla bilgi edinin.