Yeşil çek
Panoya kopyalanan bağlantı

Vision AI uygulamaları için çeşitli veri türlerini keşfetme

Termal görüntüleme, LiDAR ve kızılötesi görüntüler gibi görsel veri türlerinin sektörler arasında farklı bilgisayarla görme uygulamalarını nasıl mümkün kıldığını keşfedin.

Drone gibi teknolojiler eskiden sınırlı ve yalnızca araştırmacılar ve uzmanlar tarafından erişilebilirdi, ancak günümüzde son teknoloji donanımlar daha geniş bir kitle tarafından daha erişilebilir hale geliyor. Bu değişim görsel veri toplama şeklimizi de değiştiriyor. Daha erişilebilir teknoloji sayesinde artık geleneksel kameraların ötesinde çeşitli kaynaklardan görüntü ve video çekebiliyoruz.

Buna paralel olarak, yapay zekanın (AI) bir dalı olan bilgisayarla görmenin sağladığı görüntü analitiği hızla gelişmekte ve makinelerin görsel verileri daha etkili bir şekilde yorumlamasına ve işlemesine olanak sağlamaktadır. Bu ilerleme otomasyon, nesne algılama ve gerçek zamanlı analiz için yeni olanaklar yaratmıştır. Makineler artık desenleri tanıyabiliyor, hareketleri takip edebiliyor ve karmaşık görsel girdileri anlamlandırabiliyor.

Bazı önemli görsel veri türleri arasında nesne tanıma için yaygın olarak kullanılan RGB (Kırmızı, Yeşil, Mavi) görüntüler, düşük ışık koşullarında ısı izlerini tespit etmeye yardımcı olan termal görüntüleme ve makinelerin 3D ortamları anlamasını sağlayan derinlik verileri yer alır. Bu veri türlerinin her biri, gözetimden tıbbi görüntülemeye kadar çeşitli Vision AI uygulamalarını güçlendirmede hayati bir rol oynamaktadır.

Bu makalede, Vision AI'da kullanılan temel görsel veri türlerini inceleyecek ve her birinin çeşitli sektörlerde doğruluk, verimlilik ve performansı artırmaya nasıl katkıda bulunduğunu keşfedeceğiz. Hadi başlayalım!

En yaygın yapay zeka görüntü ve video veri kümeleri türü

Genellikle, fotoğraf çekmek veya CCTV görüntülerini izlemek için bir akıllı telefon kullandığınızda, RGB görüntülerle çalışırsınız. RGB, kırmızı, yeşil ve mavi anlamına gelir ve dijital görüntülerde görsel bilgileri temsil eden üç renk kanalıdır. 

RGB görüntüler ve videolar, bilgisayarla görmede kullanılan ve her ikisi de standart kameralar kullanılarak çekilen, birbiriyle yakından ilişkili görsel veri türleridir. Temel fark, görüntülerin tek bir anı yakalaması, videoların ise olayların zaman içinde nasıl değiştiğini gösteren bir dizi kare olmasıdır.

RGB görüntüler genellikle nesne algılama, örnek segmentasyonu ve poz tahmini gibi bilgisayarla görme görevleri için kullanılır ve aşağıdaki gibi modellerle desteklenir Ultralytics YOLO11. Bu uygulamalar, tek bir karedeki desenleri, şekilleri veya belirli özellikleri tanımlamaya dayanır. 

Öte yandan videolar, hareket tanıma, gözetleme veya eylemleri izleme gibi hareket veya zamanın bir faktör olduğu durumlarda çok önemlidir. Videolar bir dizi görüntü olarak kabul edilebildiğinden, YOLO11 gibi bilgisayarla görme modelleri zaman içindeki hareket ve davranışları anlamak için bunları kare kare işler.

Örneğin YOLO11 , tarım alanlarındaki yabani otları tespit etmek ve bitkileri saymak için RGB görüntülerini veya videolarını analiz etmek için kullanılabilir. Bu, mahsul izlemeyi geliştirir ve daha verimli çiftlik yönetimi için büyüme döngüleri boyunca değişiklikleri izlemeye yardımcı olur.

Şekil 1. YOLO11 , daha akıllı mahsul izleme için bitkileri tespit edebilir ve sayabilir.

Vision AI'da derinlik verileri: LiDAR ve 3D algılama

Derinlik verileri, nesnelerin kamera veya sensörden ne kadar uzakta olduğunu göstererek görsel bilgilere üçüncü bir boyut ekler. Yalnızca renk ve dokuyu yakalayan RGB görüntülerin aksine, derinlik verileri uzamsal bağlam sağlar. Nesneler ile kamera arasındaki mesafeyi göstererek bir sahnenin 3D düzenini yorumlamayı mümkün kılar.

Bu tür veriler LiDAR, stereo görüş (insan derinlik algısını taklit etmek için iki kamera kullanılması) ve Uçuş Süresi (ışığın bir nesneye gidip gelmesi için geçen sürenin ölçülmesi) kameraları gibi teknolojiler kullanılarak yakalanır. 

Bunlar arasında LiDAR (Light Detection and Ranging) derinlik ölçümü için genellikle en güvenilir olanıdır. Hızlı lazer darbeleri göndererek ve bunların ne kadar sürede geri döndüğünü ölçerek çalışır. Sonuç, nokta bulutu olarak bilinen ve nesnelerin şeklini, konumunu ve mesafesini gerçek zamanlı olarak vurgulayan son derece hassas bir 3B haritadır.

LiDAR'ın Vision AI sistemlerindeki artan rolü

LiDAR teknolojisi, her biri belirli uygulamalar ve ortamlar için tasarlanmış iki ana türe ayrılabilir. İşte her iki türe de daha yakından bir bakış:

  • Havadan LiDAR: Genellikle geniş alanların haritalanması için kullanılan havadan LiDAR tarayıcıları, büyük ölçekli topografik haritalama için yüksek çözünürlüklü verileri yakalamak üzere dronlara veya uçaklara monte edilir. Araziyi, ormanları ve manzaraları ölçmek için idealdir.

  • Karasal LiDAR: Bu tür LiDAR verileri, altyapı izleme, inşaat ve iç mekan haritalama gibi uygulamalar için araçlara veya sabit platformlara monte edilen sensörlerden toplanır. Daha küçük, yerelleştirilmiş alanlar için son derece ayrıntılı veriler sağlayarak şehir planlaması ve belirli yapıların ölçülmesi gibi görevler için kullanışlı hale getirir.

LiDAR verilerinin etkili bir uygulaması, şerit algılama, çarpışmadan kaçınma ve yakındaki nesneleri tanımlama gibi görevlerde kilit rol oynadığı otonom araçlardır. LiDAR, çevrenin ayrıntılı, gerçek zamanlı 3D haritalarını oluşturarak aracın nesneleri görmesini, mesafelerini hesaplamasını ve güvenli bir şekilde seyretmesini sağlar.

Şekil 2. LiDAR teknolojisi otonom araçların derinliği haritalamasını ve nesneleri tespit etmesini sağlar.

Yapay zeka uygulamalarında termal ve kızılötesi verilerin kullanılması

RGB görüntüler görünür ışık spektrumunda gördüklerimizi yakalar; ancak termal ve kızılötesi görüntüleme gibi diğer görüntüleme teknolojileri bunun ötesine geçer. Kızılötesi görüntüleme, nesneler tarafından yayılan veya yansıtılan kızılötesi ışığı yakalayarak düşük ışık koşullarında kullanışlı hale getirir.

Buna karşın termal görüntüleme, nesnelerin yaydığı ısıyı algılar ve sıcaklık farklılıklarını göstererek tamamen karanlıkta veya duman, sis ve diğer engellerin arasından çalışmasına olanak tanır. Bu tür veriler, özellikle sıcaklık değişikliklerinin potansiyel sorunlara işaret edebileceği sektörlerde sorunları izlemek ve tespit etmek için özellikle yararlıdır.

Elektrikli bileşenlerin aşırı ısınma belirtilerine karşı izlenmesi için termal görüntülemenin kullanılması ilginç bir örnektir. Termal kameralar sıcaklık farklılıklarını tespit ederek sorunları ekipman arızası, yangın veya yüksek maliyetli hasara yol açmadan önce belirleyebilir. 

Şekil 3. Elektrikli bileşenleri izlemek için kullanılan bir termal görüntüleme örneği.

Benzer şekilde kızılötesi görüntüler, gazların veya sıvıların kaçtığını gösteren sıcaklık farklılıklarını tespit ederek boru hatlarındaki veya yalıtımdaki sızıntıların tespit edilmesine yardımcı olabilir; bu da tehlikeli durumların önlenmesi ve enerji verimliliğinin artırılması için çok önemlidir.

Yapay zekada multispektral ve hiperspektral görüntüleme

Kızılötesi ve termal görüntüleme elektromanyetik spektrumun belirli yönlerini yakalarken, multispektral görüntüleme, her biri sağlıklı bitki örtüsünü tespit etmek veya yüzey malzemelerini tanımlamak gibi belirli bir amaç için seçilen birkaç dalga boyu aralığından ışık toplar. 

Hiperspektral görüntüleme, yüzlerce çok dar ve sürekli dalga boyu aralığında ışığı yakalayarak bunu bir adım öteye taşır. Bu, görüntüdeki her piksel için ayrıntılı bir ışık imzası sağlar ve gözlemlenen herhangi bir malzemenin çok daha derin bir şekilde anlaşılmasını sağlar.

Şekil 4. Multispektral ve hiperspektral görüntülemenin karşılaştırılması.

Hem multispektral hem de hiperspektral görüntüleme, farklı dalga boylarındaki ışığı yakalamak için özel sensörler ve filtreler kullanır. Veriler daha sonra spektral küp adı verilen ve her katmanı farklı bir dalga boyunu temsil eden 3 boyutlu bir yapı halinde düzenlenir. 

Yapay zeka modelleri, normal kameraların veya insan gözünün göremediği özellikleri tespit etmek için bu verileri analiz edebilir. Örneğin, bitki fenotiplemede, hiperspektral görüntüleme, yapraklarında veya gövdelerinde besin eksiklikleri veya stres gibi ince değişiklikleri tespit ederek bitkilerin sağlığını ve büyümesini izlemek için kullanılabilir. Bu, araştırmacıların invaziv yöntemlere ihtiyaç duymadan bitki sağlığını değerlendirmelerine ve tarımsal uygulamaları optimize etmelerine yardımcı olur.

Yapay zeka kullanarak radar ve sonar görüntülerini analiz etme

Radar ve sonar görüntüleme, LiDAR'a benzer şekilde sinyal göndererek ve yansımalarını analiz ederek nesneleri tespit eden ve haritalayan teknolojilerdir. Görsel bilgileri yakalamak için ışık dalgalarına dayanan RGB görüntülemenin aksine, radar elektromanyetik dalgaları, tipik olarak radyo dalgalarını kullanırken, sonar ses dalgalarını kullanır. Hem radar hem de sonar sistemleri darbeler yayar ve sinyalin bir nesneden geri dönmesi için geçen süreyi ölçerek nesnenin mesafesi, boyutu ve hızı hakkında bilgi sağlar.

Radar görüntüleme özellikle sis, yağmur veya gece vakti gibi görüşün zayıf olduğu durumlarda kullanışlıdır. Işığa dayanmadığı için, tamamen karanlıkta uçakları, araçları veya araziyi tespit edebilir. Bu da radarı havacılık, hava durumu izleme ve otonom navigasyon alanlarında güvenilir bir seçenek haline getirir.

Buna karşılık, sonar görüntüleme genellikle ışığın ulaşamadığı su altı ortamlarında kullanılır. Suda ilerleyen ve su altındaki nesnelerden seken ses dalgalarını kullanarak denizaltıların tespit edilmesine, okyanus tabanlarının haritalanmasına ve su altı kurtarma görevlerinin yürütülmesine olanak tanır. Bilgisayarla görme alanındaki ilerlemeler, gelişmiş tespit ve karar verme için sonar verilerini akıllı analizle birleştirerek su altı tespitinin daha da geliştirilmesini sağlıyor.

Şekil 5. Bir SONAR sistemi deniz derinliğini ölçmek için ultrason darbelerini nasıl kullanır?

Yapay zeka modeli eğitimi için sentetik ve simüle edilmiş görsel veriler

Şimdiye kadar ele aldığımız farklı veri türleri gerçek dünyadan toplanabilen verilerdi. Ancak, sentetik ve simüle edilmiş görsel verilerin her ikisi de yapay içerik türleridir. Sentetik veriler, gerçekçi görünen görüntüler veya videolar üretmek için 3D modelleme veya üretken yapay zeka kullanılarak sıfırdan oluşturulur. 

Şekil 6. Sentetik olarak oluşturulan görüntülere bir bakış.

Simüle edilmiş veriler benzerdir ancak ışık yansıması, gölge oluşumu ve nesne hareketi dahil olmak üzere fiziksel dünyanın nasıl davrandığını taklit eden sanal ortamlar oluşturmayı içerir. Simüle edilmiş tüm görsel veriler sentetik olsa da, tüm sentetik veriler simüle edilmiş değildir. Aradaki temel fark, simüle edilmiş verilerin sadece görünümü değil, gerçekçi davranışı da kopyalamasıdır.

Bu veri türleri, özellikle gerçek dünya verilerinin toplanması zor olduğunda veya belirli, nadir durumların simüle edilmesi gerektiğinde bilgisayarla görme modellerinin eğitimi için kullanışlıdır. Geliştiriciler tüm sahneleri oluşturabilir, nesne türlerini, konumlarını ve aydınlatmayı seçebilir ve eğitim için sınırlayıcı kutular gibi etiketleri otomatik olarak ekleyebilir. Bu, gerçek fotoğraflara veya maliyetli ve zaman alıcı olabilen manuel etiketlemeye gerek kalmadan hızlı bir şekilde büyük, çeşitli veri kümeleri oluşturmaya yardımcı olur.

Örneğin, sağlık hizmetlerinde sentetik veriler, gerçek görüntülerden oluşan büyük veri kümelerini toplamanın ve etiketlemenin zor olduğu meme kanseri hücrelerini segmentlere ayıracak modelleri eğitmek için kullanılabilir. Sentetik ve simüle edilmiş veriler esneklik ve kontrol sağlayarak gerçek dünya görsellerinin sınırlı olduğu boşlukları doldurur.

Yapay zeka uygulamanız için doğru görsel veri türünü seçme

Farklı görsel veri türlerinin nasıl çalıştığına ve neler yapabildiğine baktığımıza göre, şimdi hangi veri türlerinin belirli görevler için en iyisi olduğuna daha yakından bakalım:

  • RGB görüntüler: Görüntü sınıflandırma ve nesne algılama gibi genel bilgisayarla görme görevleri için mükemmeldir. Renk ve dokuyu yakalar ancak düşük ışık veya zayıf görüş gibi zorlu koşullarda sınırlıdır.

  • LiDAR görüntüleme: Bu tür görüntüleme, lazer darbeleri kullanarak yüksek hassasiyetli 3D haritalama sunar. Robotik, otonom araçlar ve altyapı denetimi gibi doğru mesafe ölçümleri gerektiren uygulamalar için mükemmeldir.
  • Termal görüntüleme: Sıcaklık farklılıklarını tespit edebildiğinden, gece izleme, yangınla mücadele veya makine ve binalardaki ısı sızıntılarını tespit etme gibi düşük görünürlük koşullarında kullanışlıdır.
  • Multispektral ve hiperspektral görüntüleme: Tarımsal izleme, farmasötik kalite kontrolü veya uzaktan algılama gibi ayrıntılı malzeme analizi gerektiren görevler için kullanışlıdır. Bu yöntemler, görünür ışığın ötesinde geniş bir dalga boyu aralığında veri yakalayarak daha derin bilgiler sağlar.

  • Radar ve sonar görüntüleme: Düşük görünürlüklü ortamlarda tercih edilirler. Radar radyo dalgalarını kullanır ve havacılık ve navigasyonda yardımcı olurken, sonar su altı tespiti için çalışmak üzere ses dalgalarını kullanır.

  • Sentetik ve simüle edilmiş görsel veriler: Gerçek dünya verileri sınırlı olduğunda, mevcut olmadığında veya etiketlenmesi zor olduğunda yapay zek a modellerini eğitmek için idealdir. Bu yapay görseller, nadir olaylar veya güvenlik açısından kritik koşullar gibi karmaşık senaryolar için çeşitli veri kümeleri oluşturmaya yardımcı olur.

Bazen tek bir veri türü gerçek dünya koşullarında yeterli doğruluk veya bağlam sağlayamayabilir. İşte bu noktada multimodal sensör füzyonu kilit önem kazanır. Sistemler RGB'yi termal, derinlik veya LiDAR gibi diğer veri türleriyle birleştirerek bireysel sınırlamaların üstesinden gelebilir, güvenilirliği ve uyarlanabilirliği artırabilir. 

Örneğin, depo otomasyonunda nesne tanıma için RGB, mesafe ölçümü için derinlik ve aşırı ısınan ekipmanı tespit etmek için termal kullanılması işlemleri daha verimli ve daha güvenli hale getirir. Nihayetinde en iyi sonuçlar, uygulamanızın özel ihtiyaçlarına göre veri türlerini seçerek veya birleştirerek elde edilir.

Önemli çıkarımlar

Vision AI modelleri oluştururken, doğru görsel veri türünü seçmek çok önemlidir. Nesne algılama, segmentasyon ve hareket takibi gibi görevler sadece algoritmalara değil aynı zamanda girdi verilerinin kalitesine de bağlıdır. Temiz, çeşitli ve doğru veri kümeleri gürültüyü azaltmaya ve performansı artırmaya yardımcı olur.

Yapay zeka sistemleri RGB, derinlik, termal ve LiDAR gibi veri türlerini birleştirerek çevrenin daha eksiksiz bir görünümünü elde eder ve bu da onları çeşitli koşullarda daha güvenilir hale getirir. Teknoloji gelişmeye devam ettikçe, Vision AI'nın daha hızlı, daha uyarlanabilir ve sektörler arasında daha etkili hale gelmesinin önü açılacaktır.

Bilgisayarla görme hakkında daha fazla bilgi edinmek için topluluğumuza katılın ve GitHub depomuzu keşfedin. Çözüm sayfalarımızda sağlık hizmetlerinde yapay zeka ve perakendede bilgisayarla görme ile ilgili çeşitli uygulamaları keşfedin. Vision AI ile çalışmaya başlamak için lisanslama seçeneklerimize göz atın.

LinkedIn logosuTwitter logosuFacebook logosuKopya-bağlantı sembolü

Bu kategoride daha fazlasını okuyun

Yapay zekanın gelecekteki
adresini birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın