Görüntüleme yapay zekası uygulamaları için çeşitli veri türlerini keşfetmek
Termal görüntüleme, LiDAR ve kızılötesi görüntüler gibi görsel veri türlerinin sektörler genelinde nasıl çeşitli bilgisayarlı görü uygulamalarına olanak tanıdığını keşfet.

Dron gibi teknolojiler eskiden sınırlıydı ve yalnızca araştırmacılar ve uzmanlar tarafından erişilebiliyordu, ancak günümüzde son teknoloji donanımlar daha geniş bir kitle için erişilebilir hale geliyor. Bu değişim, görsel veri toplama yöntemlerimizi değiştiriyor. Daha erişilebilir teknoloji sayesinde artık sadece geleneksel kameraların ötesinde, çeşitli kaynaklardan görüntü ve videolar yakalayabiliyoruz.
Buna paralel olarak, yapay zekanın (YZ) bir dalı olan bilgisayarlı görü ile desteklenen görüntü analitiği hızla gelişiyor ve makinelerin görsel verileri daha etkili bir şekilde yorumlamasını ve işlemesini sağlıyor. Bu ilerleme; otomasyon, nesne algılama ve gerçek zamanlı analiz için yeni olanaklar sundu. Makineler artık desenleri tanıyabiliyor, hareketi takip edebiliyor ve karmaşık görsel girdileri anlamlandırabiliyor.
Bazı temel görsel veri türleri arasında nesne tanıma için yaygın olarak kullanılan RGB (Kırmızı, Yeşil, Mavi) görüntüleri; düşük ışık koşullarında ısı imzalarını algılamaya yardımcı olan termal görüntüleme; ve makinelerin 3D ortamları anlamasını sağlayan derinlik verileri bulunur. Bu veri türlerinin her biri, gözetimden tıbbi görüntülemeye kadar çeşitli yapay zeka uygulamalarını desteklemede hayati bir rol oynar.
Bu makalede, görsel yapay zekada kullanılan temel görsel veri türlerini inceleyeceğiz ve her birinin çeşitli sektörlerde doğruluğu, verimliliği ve performansı artırmaya nasıl katkıda bulunduğunu keşfedeceğiz. Haydi başlayalım!
Link to this sectionEn yaygın yapay zeka görüntü ve video veri kümesi türü#
Genellikle, fotoğraf çekmek veya güvenlik kamerası görüntülerini izlemek için akıllı telefon kullandığında RGB görüntüleriyle çalışırsın. RGB; kırmızı, yeşil ve mavi anlamına gelir ve dijital görüntülerdeki görsel bilgiyi temsil eden üç renk kanalıdır.
RGB görüntüleri ve videoları, bilgisayarlı görüde kullanılan ve her ikisi de standart kameralar kullanılarak yakalanan birbiriyle yakından ilişkili görsel veri türleridir. Aralarındaki temel fark, görüntülerin tek bir anı yakalaması, videoların ise nesnelerin zaman içinde nasıl değiştiğini gösteren bir kare dizisi olmasıdır.
RGB görüntüleri genellikle nesne algılama, örnek bölümleme ve poz kestirimi gibi bilgisayarlı görü görevleri için kullanılır ve Ultralytics YOLO11 gibi modeller tarafından desteklenir. Bu uygulamalar, tek bir karedeki desenleri, şekilleri veya belirli özellikleri tanımlamaya dayanır.
Öte yandan videolar, jest tanıma, gözetim veya hareket takibi gibi hareketin veya zamanın önemli olduğu durumlarda gereklidir. Videolar bir dizi görüntü olarak kabul edilebileceğinden, YOLO11 gibi bilgisayarlı görü modelleri, hareket ve davranışı zaman içinde anlamak için bunları kare kare işler.
Örneğin, YOLO11 tarım alanlarındaki yabani otları algılamak ve bitkileri saymak için RGB görüntülerini veya videolarını analiz etmek amacıyla kullanılabilir. Bu, mahsul izlemeyi geliştirir ve daha verimli bir çiftlik yönetimi için büyüme döngüleri boyunca meydana gelen değişimlerin izlenmesine yardımcı olur.

Şekil 1. YOLO11, daha akıllı mahsul izleme için bitkileri algılayabilir ve sayabilir.
Link to this sectionYapay zekada derinlik verisi: LiDAR ve 3D algılama#
Derinlik verisi, nesnelerin kameradan veya sensörden ne kadar uzakta olduğunu belirterek görsel bilgiye üçüncü bir boyut ekler. Sadece renk ve doku yakalayan RGB görüntülerinin aksine, derinlik verisi uzamsal bağlam sağlar. Nesneler ile kamera arasındaki mesafeyi göstererek bir sahnenin 3D düzenini yorumlamayı mümkün kılar.
Bu veri türü; LiDAR, stereo görme (insan derinlik algısını taklit etmek için iki kamera kullanma) ve Uçuş Süresi (ışığın bir nesneye gidip dönmesi için geçen süreyi ölçme) kameraları gibi teknolojiler kullanılarak yakalanır.
Bunlar arasında LiDAR (Işık Algılama ve Uzaklık Belirleme), derinlik ölçümü için genellikle en güvenilir olanıdır. Hızlı lazer darbeleri göndererek ve bunların geri dönmesinin ne kadar sürdüğünü ölçerek çalışır. Sonuç, nesnelerin şeklini, konumunu ve mesafesini gerçek zamanlı olarak vurgulayan, nokta bulutu olarak bilinen son derece doğru bir 3D haritadır.
Link to this sectionLiDAR'ın görsel yapay zeka sistemlerindeki artan rolü#
LiDAR teknolojisi, her biri belirli uygulamalar ve ortamlar için tasarlanmış iki ana türe ayrılabilir. İşte her iki türe daha yakından bir bakış:
- Hava LiDAR'ı: Genellikle büyük alanları haritalamak için kullanılan hava LiDAR tarayıcıları, büyük ölçekli topografik haritalama için yüksek çözünürlüklü veriler yakalamak amacıyla dronlara veya hava araçlarına monte edilir. Arazi, orman ve peyzaj etüdü için idealdir.
- Karasal LiDAR: Bu LiDAR verisi türü; altyapı izleme, inşaat ve iç mekan haritalama gibi uygulamalar için araçlara veya sabit platformlara monte edilmiş sensörlerden toplanır. Şehir planlama ve belirli yapıların etüdü gibi görevler için faydalı kılan, daha küçük, yerel alanlar için son derece ayrıntılı veriler sağlar.
LiDAR verisinin etkili bir uygulaması, şerit takibi, çarpışma önleme ve yakındaki nesneleri tanımlama gibi görevlerde kilit rol oynadığı otonom araçlardadır. LiDAR, ortamın ayrıntılı ve gerçek zamanlı 3D haritalarını oluşturarak aracın nesneleri görmesini, mesafelerini hesaplamasını ve güvenli bir şekilde ilerlemesini sağlar.

Şekil 2. LiDAR teknolojisi, otonom araçların derinliği haritalamasını ve nesneleri algılamasını sağlar.
Link to this sectionYapay zeka uygulamalarında termal ve kızılötesi veri kullanımı#
RGB görüntüleri görünür ışık spektrumunda gördüklerimizi yakalar; ancak termal ve kızılötesi görüntüleme gibi diğer görüntüleme teknolojileri bunun ötesine geçer. Kızılötesi görüntüleme, nesneler tarafından yayılan veya yansıtılan kızılötesi ışığı yakalar, bu da onu düşük ışık koşullarında yararlı kılar.
Termal görüntüleme ise nesneler tarafından yayılan ısıyı algılar ve sıcaklık farklarını gösterir; bu da tam karanlıkta veya duman, sis ve diğer engellerin içinden çalışmasını sağlar. Bu veri türü, özellikle sıcaklık değişimlerinin potansiyel sorunlara işaret edebildiği endüstrilerde izleme ve sorun algılama için özellikle yararlıdır.
İlginç bir örnek, elektrik bileşenlerinin aşırı ısınma belirtileri için izlenmesinde kullanılan termal görüntülemedir. Sıcaklık farklarını algılayarak, termal kameralar ekipman arızasına, yangınlara veya maliyetli hasarlara yol açmadan önce sorunları tanımlayabilir.

Şekil 3. Elektrik bileşenlerini izlemek için kullanılan termal görüntüleme örneği.
Benzer şekilde, kızılötesi görüntüler; sızan gazları veya sıvıları gösteren sıcaklık farklarını tanımlayarak boru hatlarındaki veya yalıtımdaki sızıntıları tespit etmeye yardımcı olabilir; bu da tehlikeli durumları önlemek ve enerji verimliliğini artırmak için çok önemlidir.
Link to this sectionYapay zekada çok spektrumlu ve hiper spektrumlu görüntüleme#
Kızılötesi ve termal görüntüleme elektromanyetik spektrumun belirli yönlerini yakalarken, çok spektrumlu görüntüleme ışığı birkaç seçilmiş dalga boyu aralığından toplar ve her biri sağlıklı bitki örtüsünü tespit etmek veya yüzey malzemelerini tanımlamak gibi belirli bir amaç için seçilir.
Hiper spektrumlu görüntüleme, ışığı yüzlerce çok dar ve sürekli dalga boyu aralığında yakalayarak bunu bir adım öteye taşır. Bu, görüntüdeki her piksel için ayrıntılı bir ışık imzası sağlayarak gözlemlenen herhangi bir materyalin çok daha derin bir şekilde anlaşılmasını sunar.

Şekil 4. Çok spektrumlu ve hiper spektrumlu görüntülemeyi karşılaştırma.
Hem çok spektrumlu hem de hiper spektrumlu görüntüleme, ışığı farklı dalga boylarında yakalamak için özel sensörler ve filtreler kullanır. Veriler daha sonra, her katman farklı bir dalga boyunu temsil edecek şekilde spektral küp adı verilen 3D bir yapıda düzenlenir.
Yapay zeka modelleri, normal kameraların veya insan gözünün göremediği özellikleri tespit etmek için bu verileri analiz edebilir. Örneğin, bitki fenotiplemede, hiper spektrumlu görüntüleme; yaprak veya gövdelerindeki besin eksikliği veya stres gibi ince değişimleri algılayarak bitkilerin sağlığını ve büyümesini izlemek için kullanılabilir. Bu, araştırmacıların istilacı yöntemlere gerek kalmadan bitki sağlığını değerlendirmesine ve tarım uygulamalarını optimize etmesine yardımcı olur.
Link to this sectionYapay zeka kullanarak radar ve sonar görüntülemesini analiz etme#
Radar ve sonar görüntüleme; LiDAR'a benzer şekilde sinyaller göndererek ve yansımalarını analiz ederek nesneleri algılayan ve haritalayan teknolojilerdir. Görsel bilgiyi yakalamak için ışık dalgalarına dayanan RGB görüntülemesinin aksine, radar radyo dalgaları gibi elektromanyetik dalgalar kullanırken, sonar ses dalgaları kullanır. Hem radar hem de sonar sistemleri darbeler yayar ve sinyalin bir nesneden geri dönmesi için geçen süreyi ölçerek nesnenin mesafesi, boyutu ve hızı hakkında bilgi sağlar.
Radar görüntüleme, özellikle sis, yağmur veya gece gibi görüş mesafesinin zayıf olduğu durumlarda yararlıdır. Işığa dayanmadığı için, tam karanlıkta uçakları, araçları veya araziyi tespit edebilir. Bu, radarı havacılık, hava durumu izleme ve otonom navigasyonda güvenilir bir seçenek haline getirir.
Karşılaştırmalı olarak sonar görüntüleme, ışığın ulaşamadığı su altı ortamlarında yaygın olarak kullanılır. Suda ilerleyen ve batık nesnelerden seken ses dalgalarını kullanarak denizaltıların tespit edilmesine, okyanus tabanlarının haritalanmasına ve su altı kurtarma görevlerinin yürütülmesine olanak tanır. Bilgisayarlı görüdeki gelişmeler, gelişmiş algılama ve karar verme için sonar verilerini akıllı analizle birleştirerek su altı algılamasının daha da iyileştirilmesini sağlıyor.

Şekil 5. Bir SONAR sisteminin deniz derinliğini ölçmek için ultrason darbelerini nasıl kullandığı.
Link to this sectionYapay zeka modeli eğitimi için sentetik ve simüle edilmiş görsel veri#
Şimdiye kadar tartıştığımız farklı veri türleri, gerçek dünyadan toplanabilenlerdi. Ancak sentetik ve simüle edilmiş görsel veriler yapay içerik türleridir. Sentetik veri, gerçekçi görünen görüntüler veya videolar üretmek için 3D modelleme veya üretken yapay zeka kullanılarak sıfırdan oluşturulur.

Şekil 6. Sentetik olarak oluşturulmuş görüntülere bir bakış.
Simüle edilmiş veri benzerdir ancak ışık yansıması, gölge oluşumu ve nesne hareketi dahil olmak üzere fiziksel dünyanın nasıl davrandığını kopyalayan sanal ortamlar oluşturmayı içerir. Tüm simüle edilmiş görsel veriler sentetik olsa da, tüm sentetik veriler simüle edilmiş değildir. Temel fark, simüle edilmiş verilerin sadece görünümü değil, gerçekçi davranışı da kopyalamasıdır.
Bu veri türleri, özellikle gerçek dünya verilerini toplamak zor olduğunda veya belirli, nadir durumların simüle edilmesi gerektiğinde bilgisayarlı görü modellerini eğitmek için yararlıdır. Geliştiriciler tüm sahneler oluşturabilir, nesne türlerini, konumlarını ve aydınlatmayı seçebilir ve eğitim için sınırlayıcı kutular gibi etiketleri otomatik olarak ekleyebilirler. Bu, maliyetli ve zaman alıcı olabilen gerçek fotoğraflara veya manuel etiketlemeye ihtiyaç duymadan hızla büyük ve çeşitli veri kümeleri oluşturmaya yardımcı olur.
Örneğin sağlık hizmetlerinde sentetik veri, gerçek görüntülerin büyük veri kümelerini toplamanın ve etiketlemenin zor olduğu meme kanseri hücrelerini bölütlemek için modelleri eğitmek amacıyla kullanılabilir. Sentetik ve simüle edilmiş veriler esneklik ve kontrol sağlayarak gerçek dünya görsellerinin sınırlı olduğu boşlukları doldurur.
Link to this sectionYapay zeka uygulamanız için doğru görsel veri türünü seçme#
Artık farklı görsel veri türlerinin nasıl çalıştığına ve neler yapabileceğine baktığımıza göre, belirli görevler için hangi veri türlerinin en uygun olduğuna daha yakından bakalım:
- RGB görüntüleri: Görüntü sınıflandırma ve nesne algılama gibi genel bilgisayarlı görü görevleri için mükemmeldir. Rengi ve dokuyu yakalar, ancak düşük ışık veya zayıf görüş gibi zorlu koşullarda sınırlıdır.
- LiDAR görüntüleme: Bu görüntüleme türü, lazer darbeleri kullanarak yüksek hassasiyetli 3D haritalama sunar. Robotik, otonom araçlar ve altyapı denetimi gibi doğru mesafe ölçümleri gerektiren uygulamalar için harikadır.
- Termal görüntüleme: Sıcaklık farklarını algılayabildiği için gece izleme, itfaiyecilik veya makine ve binalardaki ısı sızıntılarını tespit etme gibi düşük görüş koşullarında yararlıdır.
- Çok spektrumlu ve hiper spektrumlu görüntüleme: Tarımsal izleme, farmasötik kalite kontrolü veya uzaktan algılama gibi ayrıntılı malzeme analizi gerektiren görevler için yararlıdır. Bu yöntemler, görünür ışığın ötesindeki geniş bir dalga boyu aralığında veri yakalayarak daha derin içgörüler sağlar.
- Radar ve sonar görüntüleme: Düşük görüş ortamlarında tercih edilirler. Radar radyo dalgalarını kullanır ve havacılık ile navigasyonda yardımcıdır; sonar ise su altı algılama için ses dalgalarını kullanır.
- Sentetik ve simüle edilmiş görsel veri: Gerçek dünya verileri sınırlı olduğunda, kullanılamadığında veya etiketlenmesi zor olduğunda yapay zeka modellerini eğitmek için idealdir. Bu yapay görseller, nadir olaylar veya güvenlik açısından kritik durumlar gibi karmaşık senaryolar için çeşitli veri kümeleri oluşturmaya yardımcı olur.
Bazen tek bir veri türü gerçek dünya durumlarında yeterli doğruluk veya bağlam sağlamayabilir. Çok modlu sensör füzyonunun kilit rol oynadığı yer burasıdır. RGB'yi termal, derinlik veya LiDAR gibi diğer veri türleriyle birleştirerek sistemler bireysel sınırlamaların üstesinden gelebilir, güvenilirliği ve uyarlanabilirliği artırabilir.
Örneğin, depo otomasyonunda nesne tanıma için RGB, mesafe ölçümü için derinlik ve aşırı ısınan ekipmanları tespit etmek için termal kullanmak operasyonları daha verimli ve güvenli hale getirir. Sonuçta en iyi sonuçlar, uygulamanızın özel ihtiyaçlarına göre veri türlerini seçmekten veya birleştirmekten gelir.
Link to this sectionÖne çıkanlar#
Görsel yapay zeka modelleri oluştururken, doğru görsel veri türünü seçmek çok önemlidir. Nesne algılama, bölütleme ve hareket takibi gibi görevler sadece algoritmalara değil, aynı zamanda girdi verilerinin kalitesine de dayanır. Temiz, çeşitli ve doğru veri kümeleri gürültüyü azaltmaya ve performansı artırmaya yardımcı olur.
RGB, derinlik, termal ve LiDAR gibi veri türlerini birleştirerek yapay zeka sistemleri ortamın daha eksiksiz bir görünümünü elde eder ve bu da onları çeşitli koşullarda daha güvenilir kılar. Teknoloji gelişmeye devam ettikçe, görsel yapay zekanın daha hızlı, daha uyarlanabilir ve sektörler genelinde daha etkili hale gelmesinin yolunu açması muhtemeldir.
Topluluğumuza katıl ve bilgisayarlı görü hakkında daha fazla bilgi edinmek için GitHub depomuzu keşfet. Çözüm sayfalarımızda sağlıkta yapay zeka ve perakendede bilgisayarlı görü ile ilgili çeşitli uygulamaları keşfet. Görsel yapay zeka ile çalışmaya başlamak için lisanslama seçeneklerimize göz at.






