Görüntü işleme nedir? Hızlı bir giriş
Görüntü işlemenin (image computing) ne olduğunu, nasıl çalıştığını ve sağlık, otonom sürüş ile diğer modern akıllı sistemlerde nasıl uygulandığını öğren.

Bir alışveriş merkezinde veya kalabalık bir caddede yürürken, girişlerin ve yürüme yollarının üzerine monte edilmiş kameralar faaliyetleri kaydeder. Her saniye görsel veri üretirler ve çoğu zaman bunu fark bile etmeyiz.
Bu sürekli veri akışı, akıllı güvenlik sistemlerinden kendi kendine giden araçlara kadar günümüzün yapay zeka destekli sistemlerini besler. Bu yenilikler, bilgisayar bilimi, matematik ve fiziği bir araya getiren çok yönlü bir alan olan görüntü bilişimi tarafından desteklenir.
Görüntü bilişimi, makinelerin bir görüntüde ne gördüklerini anlamalarına yardımcı olur. Sistemlerin bir sahnede neler olup bittiğini tanımasını ve örneğin bir engel çıktığında kendi kendine giden bir aracı durdurmak gibi, nasıl işlev göstereceğine veya tepki vereceğine karar vermesini sağlar.
Bu makalede, görüntü bilişiminin ne olduğunu ve en gelişmiş yapay zeka (YZ) sistemlerinde nasıl kullanıldığını keşfedeceğiz. Hadi başlayalım!
Link to this sectionGörüntü bilişimini anlamak#
Görüntü bilişimi, gelişmiş algoritmalar kullanarak görüntüleri yakalama, işleme ve analiz etme sürecidir. Görüntüleri, makinelerin anlayabileceği ve üzerinde çalışabileceği veriler olarak ele alır.
Diğer bir deyişle, her görüntü bir sayı ızgarası olarak işlenir. Bu, bir görüntünün en küçük birimleri olan piksellerin, satır ve sütunlardan oluşan bir matrise dönüştürülmesiyle yapılır. Her pikselin, makineye görüntünün belirli bir alanının ne kadar parlak veya karanlık olduğunu söyleyen sayısal bir değeri vardır.
Bu değerlerin düzenlenme şekli, görüntünün gri tonlamalı mı yoksa renkli mi olduğuna bağlıdır. Gri tonlamalı görüntülerde, piksel değerleri tipik olarak 0 (siyah) ile 255 (beyaz) arasında değişir. Renkli görüntülerde, Kırmızı, Yeşil ve Mavi (RGB) veya Ton, Doygunluk ve Değer (HSV) gibi farklı renk kanallarını temsil etmek için birden fazla matris kullanılır.

Şekil 1. Görüntülerin matris temsilleri (Kaynak)
Piksel matrislerine ek olarak, bir görüntü genellikle meta veri olarak bilinen gizli bağlamsal bilgiler içerir. Meta veriler; görüntü çözünürlüğü, bit derinliği, kamera veya sensör ayarları ve görüntünün çekildiği tam zaman gibi önemli ayrıntıları sağlar. Görüntüler, hem görsel verileri hem de meta verileri korumak için belirli dosya formatlarında saklanır.
Örneğin, biyomedikal görüntü bilişiminde görüntüler genellikle DICOM (Digital Imaging and Communications in Medicine) formatı kullanılarak saklanır. DICOM, görsel görüntü verilerini kimlik bilgileri ve ekipman ayarları gibi hasta bilgileriyle birleştirerek tıbbi görüntü analizinin doğru, tutarlı ve güvenli olmasını sağlar.
Link to this sectionGörüntü bilişimi nasıl çalışır#
Artık görüntü bilişiminin ne olduğuna dair daha iyi bir anlayışa sahip olduğumuza göre, bir kamera beslemesini yararlı içgörülere dönüştürmek için kullanılan adımlara bakalım.
Tam iş akışı uygulamaya göre değişebilse de, çoğu görüntü bilişim sistemi şu ana aşamaları takip eder:
- Görüntü edinme: İlk olarak, görsel veriler kameralar ve sensörler kullanılarak yakalanır veya açık kaynaklı görüntü veri kümelerinden toplanır.
- Görüntü ön işleme: Ardından, elde edilen görüntüler yeniden boyutlandırılır, gürültüden arındırılır, iyileştirilir ve girişleri standart hale getirmek için belirli bir renk alanına dönüştürülür.
- Öznitelik çıkarımı: Görüntüdeki kenarlar, şekiller ve dokular gibi önemli desenleri öğrenmek için derin öğrenme algoritmaları kullanılır.
- Yorumlama: Çıkarılan öznitelikler; nesne algılama, görüntü segmentasyonu ve nesne izleme gibi görevleri gerçekleştirmek için analiz edilir.
- Çıktı: Son olarak sistem, sınıf etiketleri veya sınırlayıcı kutular gibi yapılandırılmış çıktılar üretir ve bunları insanların veya diğer sistemlerin kolayca anlayabileceği ve görselleştirme için kullanabileceği şekilde sunar.
Link to this sectionGörüntü bilişimi vs. bilgisayarlı görü vs. görüntü işleme#
Görüntü bilişimi ile karşılaştığında, görüntü işleme ve bilgisayarlı görü gibi terimlerle de karşılaşabilirsin. Bu terimler genellikle birbirinin yerine kullanılsa da, yapay zeka sistemlerinin görsel verilerle etkileşime girmesinin farklı yollarını tanımlarlar.
Örneğin, görüntü işleme görüntülerin iyileştirilmesine veya gürültü giderme, yeniden boyutlandırma ve kontrast ayarlama gibi temel işlemler kullanılarak girdi görüntülerinin kalitesinin artırılmasına odaklanır. Bu arada, bir yapay zeka dalı olan bilgisayarlı görü, makinelerin nesneleri tanımasını, sahneleri yorumlamasını ve görüntülerde veya videolarda neler olup bittiğini anlamasını sağlayarak görüntü işlemenin üzerine inşa edilir.
Görüntü bilişimi, görsel verileri akıllı sistemler için anlamlı ve kullanılabilir çıktılara dönüştürmek amacıyla görüntü işleme ve bilgisayarlı görüyü birleştirir.

Şekil 2. Görüntü işleme vs. bilgisayarlı görü vs. görüntü bilişimi. Görsel yazara aittir.
Link to this sectionGörüntü bilişimi bugün nasıl uygulanıyor#
Şimdi, görüntü bilişiminin bugün nasıl uygulandığına bir göz atalım.
Görüntü bilişiminin ilk aşamalarında, kenarlar, köşeler ve dokular gibi öznitelikler, kural tabanlı ve el yapımı algoritmalar kullanılarak manuel olarak tanımlanıyordu. Bu metodolojiler kontrollü ortamlarda oldukça iyi çalışsa da, karmaşık, gerçek dünya koşullarına ölçeklenmekte ve uyum sağlamakta zorlanıyorlardı.
Modern görüntü bilişim sistemleri, derin öğrenme tabanlı yaklaşımlar kullanarak bu sınırlamaları ele alır. Evrişimli sinir ağları (CNN'ler) ve vision transformer'lar gibi modeller, büyük görüntü veri kümelerinden ilgili öznitelikleri otomatik olarak öğrenir. Bu, nesne algılama, örnek segmentasyonu ve nesne izleme gibi görevleri daha yüksek doğruluk ve dayanıklılıkla gerçekleştirmelerini sağlar.
Günümüzde görüntü bilişimi iş akışları, genellikle en yeni yapay zeka sistemlerinde dağıtım için tasarlanmış gerçek zamanlı görü modellerine dayanır. Örneğin, Ultralytics YOLO26 gibi görü YZ modelleri, hem uç cihazlarda hem de bulut ortamlarında nesne algılama ve örnek segmentasyonu gibi hızlı ve verimli bilgisayarlı görü yetenekleri sağlar.

Şekil 3. Bir görüntüdeki nesneleri algılamak ve segmentlemek için YOLO26 kullanımına bir örnek
Link to this sectionGörüntü bilişiminin gerçek dünya uygulamaları#
Görüntü bilişimi, görsel verileri anlamak ve bunlara göre hareket etmek için gerçek dünya uygulamalarında yaygın olarak kullanılmaktadır. Görüntü bilişiminin farklı alanlarda nasıl uygulandığını keşfedelim.
Link to this sectionErken hastalık teşhisi için tıbbi görüntü bilişimi#
Görüntü bilişimi, doktorların ve klinisyenlerin hastalıkları daha erken fark etmelerine ve tıbbi taramaları daha verimli bir şekilde analiz etmelerine yardımcı olabilir. Bu yenilikçi sağlık sistemleri, röntgen ve manyetik rezonans görüntüleme (MRI) taramaları gibi tıbbi görüntüleme verilerini hızla işleyebilir ve genellikle manuel incelemeden daha tutarlı sonuçlar sağlar.
Örneğin, Ultralytics YOLO26 gibi modeller, enfeksiyonlar ve anormalliklerle bağlantılı desenleri öğrenmek için büyük göğüs röntgeni görüntü kümeleri üzerinde eğitilebilir. Eğitildikten sonra bu modeller, bir taramanın normal mi göründüğünü yoksa zatürre veya COVID-19 gibi durumların belirtilerini mi gösterdiğini belirlemeye yardımcı olabilir.
Link to this sectionOtonom sürüş için görüntü bilişimi#
Otonom araçlar, etraflarında neler olup bittiğini anlamak ve sürüş kararları almak için görüntü bilişimini kullanır. Teknoloji, ham kamera görüntülerini aracın güvenli ve sorunsuz hareket etmesine yardımcı olan gerçek zamanlı bilgilere dönüştürür.
Görüntü bilişimi, gelişmiş sürücü destek sistemlerinde (ADAS) yaygın olarak kullanılır. Bu modüller sadece video kaydetmekle kalmaz, şerit işaretlerini, diğer araçları, yayaları ve engelleri tespit etmek için her kareyi analiz eder. Bu, aracın değişen yol koşullarına çok az insan müdahalesiyle tepki vermesini mümkün kılar.
Bir diğer yaygın kullanım durumu, aracın çevresinin 360 derecelik bir görünümünü oluşturmak için birden fazla kameradan gelen görüntülerin birleştirilmesidir. Görüntü bilişimi; lens bozulmasını düzeltmeye, görüntü netliğini artırmaya ve tüm kamera beslemelerinde parlaklık ve rengi dengelemeye yardımcı olur. Sonuç, aracın kötü hava koşullarında veya düşük ışıkta bile güvenli bir şekilde seyretmesini sağlayan net ve kesintisiz bir görünümdür.

Şekil 4. Derin öğrenme kullanarak görüntü birleştirme (Kaynak)
Link to this sectionGörüntü bilişiminin artıları ve eksileri#
Görüntü bilişiminin avantajlarından bazıları şunlardır:
- Ölçeklenebilirlik: Eğitildikten sonra görüntü bilişim sistemleri, büyük hacimli görsel verileri sürekli olarak ve ölçekli bir şekilde analiz edebilir.
- Karar verme: Otonom sürüş, tıbbi tarama ve endüstriyel izleme gibi zamana duyarlı uygulamaları destekler.
- Zaman içinde maliyet verimliliği: İlk kurulum pahalı olabilse de, otomatik görsel analiz uzun vadeli operasyonel maliyetleri düşürebilir.
Görüntü bilişimiyle ilgili birçok fayda olsa da bazı sınırlamalar da vardır. İşte göz önünde bulundurman gereken bazı faktörler:
- Veri kalitesi: Görüntü bilişimi yöntemleri, oluşturulması maliyetli ve zaman alıcı olabilen doğru etiketlemeye ve yüksek kaliteli veri kümelerine büyük ölçüde bağımlıdır.
- Koşullara duyarlılık: Aydınlatma, tıkanma, hareket bulanıklığı, hava durumu veya kamera açılarındaki değişiklikler model performansını olumsuz etkileyebilir.
- Sınırlı açıklanabilirlik: Derin öğrenme tabanlı görüntü modelleri kara kutu gibi davranabilir, bu da kararların nasıl verildiğini açıklamayı zorlaştırır.
Link to this sectionÖne çıkanlar#
Görüntü bilişimi, temel görüntü işlemeden, yapay zeka sistemlerinin gerçek dünyayı gerçek zamanlı olarak algılamasını ve anlamasını sağlayan bir teknolojiye dönüştü. Derin öğrenme ilerlemeye devam ettikçe, görüntü bilişimi daha akıllı, daha pratik araç setleri ve uygulamalar oluşturmanın önemli bir parçası haline geliyor.
Yapay zeka hakkında bilgi edinmek için topluluğumuza katıl ve GitHub depomuza göz at. Tarımda yapay zeka ve lojistikte bilgisayarlı görü uygulamaları hakkında bilgi edinmek için çözüm sayfalarımızı keşfet. Lisanslama seçeneklerimizi keşfet ve görü YZ modelleri oluşturmaya başla.






