Görsel Yapay Zeka uygulamaları için çeşitli veri türlerini keşfetme

9 May 2025
Termal görüntüleme, LiDAR ve kızılötesi görüntüler gibi görsel veri türlerinin çeşitli sektörlerdeki bilgisayar görüşü uygulamalarını nasıl mümkün kıldığını keşfedin.

9 May 2025
Termal görüntüleme, LiDAR ve kızılötesi görüntüler gibi görsel veri türlerinin çeşitli sektörlerdeki bilgisayar görüşü uygulamalarını nasıl mümkün kıldığını keşfedin.
Eskiden sadece araştırmacılar ve uzmanların erişebildiği dronlar gibi teknolojiler, günümüzde daha geniş bir kitlenin erişimine açık hale geliyor. Bu değişim, görsel veri toplama yöntemlerimizi değiştiriyor. Daha erişilebilir teknoloji sayesinde, artık sadece geleneksel kameraların ötesinde, çeşitli kaynaklardan görüntüler ve videolar yakalayabiliyoruz.
Paralel olarak, yapay zekanın (YZ) bir dalı olan bilgisayar görüşü ile mümkün kılınan görüntü analitiği hızla gelişiyor ve makinelerin görsel verileri daha etkili bir şekilde yorumlamasına ve işlemesine olanak tanıyor. Bu gelişme, otomasyon, nesne tespiti ve gerçek zamanlı analiz için yeni olanaklar sunuyor. Makineler artık örüntüleri tanıyabilir, hareketi izleyebilir ve karmaşık görsel girdileri anlayabilir.
Görsel verilerin temel türlerinden bazıları, nesne tanıma için yaygın olarak kullanılan RGB (Kırmızı, Yeşil, Mavi) görüntüleri, düşük ışık koşullarında ısı izlerini tespit etmeye yardımcı olan termal görüntüleme ve makinelerin 3D ortamları anlamasını sağlayan derinlik verileridir. Bu veri türlerinin her biri, gözetimden tıbbi görüntülemeye kadar Görsel Yapay Zeka'nın çeşitli uygulamalarına güç vermede hayati bir rol oynamaktadır.
Bu makalede, Görsel Yapay Zeka'da kullanılan temel görsel veri türlerini ve her birinin çeşitli sektörlerde doğruluğu, verimliliği ve performansı nasıl artırmaya katkıda bulunduğunu inceleyeceğiz. Haydi başlayalım!
Genellikle, bir fotoğraf çekmek veya CCTV görüntülerini izlemek için bir akıllı telefon kullandığınızda, RGB görüntüleriyle çalışırsınız. RGB, kırmızı, yeşil ve mavi anlamına gelir ve dijital görüntülerdeki görsel bilgileri temsil eden üç renk kanalıdır.
RGB görüntüleri ve videoları, bilgisayar görüşünde kullanılan ve standart kameralar kullanılarak yakalanan yakından ilişkili görsel veri türleridir. Temel fark, görüntülerin tek bir anı yakalaması, videoların ise zaman içindeki değişiklikleri gösteren bir dizi kareden oluşmasıdır.
RGB görüntüleri genellikle bilgisayar görüşü görevleri için kullanılır; örneğin Ultralytics YOLO11 gibi modeller tarafından desteklenen nesne tespiti, örnek segmentasyonu ve poz tahmini. Bu uygulamalar, tek bir karedeki örüntüleri, şekilleri veya belirli özellikleri tanımlamaya dayanır.
Videolar ise hareket veya zamanın bir faktör olduğu durumlarda önemlidir; örneğin, hareket tanıma, gözetim veya eylemleri izleme gibi. Videolar bir dizi görüntü olarak kabul edilebileceğinden, YOLO11 gibi bilgisayar görüşü modelleri, zaman içindeki hareketi ve davranışı anlamak için bunları kare kare işler.
Örneğin, YOLO11, tarım alanlarındaki yabani otları tespit etmek ve bitkileri saymak için RGB görüntülerini veya videolarını analiz etmek için kullanılabilir. Bu, ürün takibini geliştirir ve daha verimli çiftlik yönetimi için büyüme döngüleri boyunca değişiklikleri izlemeye yardımcı olur.

Derinlik verisi, nesnelerin kameraya veya sensöre ne kadar uzakta olduğunu belirterek görsel bilgilere üçüncü bir boyut ekler. Sadece renk ve dokuyu yakalayan RGB görüntülerinin aksine, derinlik verisi mekansal bağlam sağlar. Nesneler ile kamera arasındaki mesafeyi göstererek, bir sahnenin 3D düzenini yorumlamayı mümkün kılar.
Bu tür veriler, LiDAR, stereo görüş (insan derinlik algısını taklit etmek için iki kamera kullanılarak) ve Time-of-Flight (ışığın bir nesneye gidip geri gelmesi için geçen süreyi ölçen) kameralar gibi teknolojiler kullanılarak yakalanır.
Bunlar arasında LiDAR (Light Detection and Ranging), derinlik ölçümü için genellikle en güvenilir olanıdır. Hızlı lazer darbeleri göndererek ve bunların geri dönmesinin ne kadar sürdüğünü ölçerek çalışır. Sonuç, nesnelerin şeklini, konumunu ve mesafesini gerçek zamanlı olarak vurgulayan, nokta bulutu olarak bilinen son derece doğru bir 3D haritadır.
LiDAR teknolojisi, her biri belirli uygulamalar ve ortamlar için tasarlanmış iki ana türe ayrılabilir. İşte her iki türe daha yakından bir bakış:
LiDAR verilerinin etkili bir uygulaması, otonom araçlardır; burada şerit algılama, çarpışma önleme ve yakındaki nesneleri tanımlama gibi görevlerde önemli bir rol oynar. LiDAR, ortamın ayrıntılı, gerçek zamanlı 3D haritalarını oluşturarak aracın nesneleri görmesini, mesafelerini hesaplamasını ve güvenli bir şekilde hareket etmesini sağlar.

RGB görüntüleri, görünür ışık spektrumunda gördüklerimizi yakalar; ancak termal ve kızılötesi görüntüleme gibi diğer görüntüleme teknolojileri bunun ötesine geçer. Kızılötesi görüntüleme, nesneler tarafından yayılan veya yansıtılan kızılötesi ışığı yakalar ve bu da onu düşük ışık koşullarında kullanışlı hale getirir.
Termal görüntüleme ise nesneler tarafından yayılan ısıyı algılar ve sıcaklık farklılıklarını gösterir, bu da onun tam karanlıkta veya duman, sis ve diğer engellerin içinden çalışmasını sağlar. Bu tür veriler, özellikle sıcaklık değişikliklerinin potansiyel sorunlara işaret edebileceği endüstrilerde, sorunları izlemek ve tespit etmek için özellikle kullanışlıdır.
İlginç bir örnek, elektrik bileşenlerini aşırı ısınma belirtileri açısından izlemek için kullanılan termal görüntülemedir. Termal kameralar, sıcaklık farklılıklarını tespit ederek, ekipman arızası, yangın veya maliyetli hasarlara yol açmadan önce sorunları belirleyebilir.

Benzer şekilde, kızılötesi görüntüler, tehlikeli durumları önlemek ve enerji verimliliğini artırmak için çok önemli olan kaçan gazları veya sıvıları gösteren sıcaklık farklılıklarını belirleyerek boru hatlarındaki veya yalıtımdaki sızıntıları tespit etmeye yardımcı olabilir.
Kızılötesi ve termal görüntüleme, elektromanyetik spektrumun belirli yönlerini yakalarken, çok spektralli görüntüleme, sağlıklı bitki örtüsünü tespit etmek veya yüzey malzemelerini tanımlamak gibi belirli bir amaç için seçilen birkaç seçilmiş dalga boyu aralığından ışık toplar.
Hiperspektral görüntüleme, yüzlerce çok dar ve sürekli dalga boyu aralığında ışık yakalayarak bunu bir adım öteye taşır. Bu, görüntüdeki her piksel için ayrıntılı bir ışık imzası sağlayarak, gözlemlenen herhangi bir malzeme hakkında çok daha derin bir anlayış sunar.

Hem çok spektralli hem de hiperspektralli görüntüleme, farklı dalga boylarında ışık yakalamak için özel sensörler ve filtreler kullanır. Veriler daha sonra her katmanın farklı bir dalga boyunu temsil ettiği spektral küp adı verilen 3B bir yapıda düzenlenir.
AI modelleri, normal kameraların veya insan gözünün göremediği özellikleri tespit etmek için bu verileri analiz edebilir. Örneğin, bitki fenotiplemesinde, hiperspektral görüntüleme, besin eksiklikleri veya stres gibi yapraklarında veya saplarında meydana gelen ince değişiklikleri tespit ederek bitkilerin sağlığını ve büyümesini izlemek için kullanılabilir. Bu, araştırmacıların bitki sağlığını değerlendirmesine ve tarım uygulamalarını invaziv yöntemlere ihtiyaç duymadan optimize etmesine yardımcı olur.
Radar ve sonar görüntüleme, LiDAR'a benzer şekilde sinyaller göndererek ve yansımalarını analiz ederek nesneleri tespit eden ve haritalayan teknolojilerdir. Görsel bilgileri yakalamak için ışık dalgalarına dayanan RGB görüntülemenin aksine, radar tipik olarak radyo dalgaları olan elektromanyetik dalgaları kullanırken, sonar ses dalgalarını kullanır. Hem radar hem de sonar sistemleri, bir nesneden geri sıçraması için gereken süreyi ölçerek mesafesi, boyutu ve hızı hakkında bilgi sağlayan darbeler yayar.
Radar görüntüleme, sis, yağmur veya gece gibi görüşün zayıf olduğu durumlarda özellikle kullanışlıdır. Işığa dayanmadığı için uçakları, araçları veya araziyi tam karanlıkta tespit edebilir. Bu, radarı havacılık, hava durumu izleme ve otonom navigasyonda güvenilir bir seçim haline getirir.
Karşılaştırma yapıldığında, sonar görüntüleme genellikle ışığın ulaşamadığı su altı ortamlarında kullanılır. Su içinde hareket eden ve su altı nesnelerinden seken ses dalgalarını kullanarak denizaltıların tespit edilmesini, okyanus tabanlarının haritalanmasını ve su altı kurtarma görevlerinin yürütülmesini sağlar. Bilgisayarlı görüdeki gelişmeler, sonar verilerini gelişmiş algılama ve karar verme için akıllı analizle birleştirerek su altı algılamasının daha da geliştirilmesini sağlıyor.

Şimdiye kadar tartıştığımız farklı veri türleri, gerçek dünyadan toplanabilenlerdi. Ancak, sentetik ve simüle edilmiş görsel verilerin her ikisi de yapay içerik türleridir. Sentetik veriler, gerçekçi görünen görüntüler veya videolar üretmek için 3D modelleme veya üretken AI kullanılarak sıfırdan oluşturulur.

Simüle edilmiş veriler benzerdir, ancak fiziksel dünyanın ışık yansıması, gölge oluşumu ve nesne hareketi dahil olmak üzere nasıl davrandığını taklit eden sanal ortamlar oluşturmayı içerir. Tüm simüle edilmiş görsel veriler sentetik olsa da, tüm sentetik veriler simüle edilmiş değildir. Temel fark, simüle edilmiş verilerin sadece görünümü değil, gerçekçi davranışı da taklit etmesidir.
Bu veri türleri, özellikle gerçek dünya verilerinin toplanması zor olduğunda veya belirli, nadir durumların simüle edilmesi gerektiğinde, bilgisayarlı görü modellerini eğitmek için kullanışlıdır. Geliştiriciler tüm sahneleri oluşturabilir, nesne türlerini, konumlarını ve aydınlatmayı seçebilir ve eğitim için sınırlayıcı kutular gibi etiketleri otomatik olarak ekleyebilir. Bu, gerçek fotoğraflara veya maliyetli ve zaman alıcı olabilen manuel etiketlemeye ihtiyaç duymadan büyük, çeşitli veri kümeleri oluşturmaya yardımcı olur.
Örneğin, sağlık hizmetlerinde, gerçek görüntülerin büyük veri kümelerini toplamak ve etiketlemek zor olduğunda, sentetik veriler meme kanseri hücrelerini segmentlere ayırmak için modelleri eğitmek için kullanılabilir. Sentetik ve simüle edilmiş veriler, gerçek dünya görsellerinin sınırlı olduğu boşlukları doldurarak esneklik ve kontrol sağlar.
Farklı görsel veri türlerinin nasıl çalıştığına ve neler yapabileceğine baktığımıza göre, hangi veri türlerinin belirli görevler için en uygun olduğuna daha yakından bakalım:
Bazen, tek bir veri türü gerçek dünya durumlarında yeterli doğruluk veya bağlam sağlamayabilir. İşte bu noktada multimodal sensör füzyonu devreye giriyor. RGB'yi termal, derinlik veya LiDAR gibi diğer veri türleriyle birleştirerek, sistemler bireysel sınırlamaların üstesinden gelebilir, güvenilirliği ve uyarlanabilirliği artırabilir.
Örneğin, depo otomasyonunda, nesne tanıma için RGB, mesafe ölçümü için derinlik ve aşırı ısınan ekipmanı tespit etmek için termal kullanmak, operasyonları daha verimli ve güvenli hale getirir. Sonuç olarak, en iyi sonuçlar, uygulamanızın özel ihtiyaçlarına göre veri türlerini seçmek veya birleştirmekten gelir.
Vision AI modelleri oluştururken, doğru görsel veri türünü seçmek çok önemlidir. Nesne algılama, segmentasyon ve hareket takibi gibi görevler yalnızca algoritmalara değil, aynı zamanda girdi verilerinin kalitesine de bağlıdır. Temiz, çeşitli ve doğru veri kümeleri gürültüyü azaltmaya ve performansı artırmaya yardımcı olur.
RGB, derinlik, termal ve LiDAR gibi veri türlerini birleştirerek, AI sistemleri ortamın daha eksiksiz bir görünümünü elde eder ve bu da onları çeşitli koşullarda daha güvenilir hale getirir. Teknoloji gelişmeye devam ettikçe, Vision AI'nın endüstriler genelinde daha hızlı, daha uyarlanabilir ve daha etkili hale gelmesinin önünü açması muhtemeldir.
Bilgisayarlı görü hakkında daha fazla bilgi edinmek için topluluğumuza katılın ve GitHub depomuzu keşfedin. Çözüm sayfalarımızda sağlık hizmetlerinde AI ve perakendede bilgisayarlı görü ile ilgili çeşitli uygulamaları keşfedin. Vision AI'ya başlamak için lisanslama seçeneklerimize göz atın.


