YOLO26 ile tanış: yeni nesil görsel AI.
Ultralytics
Yapay Zeka Görüşü

Görüntü modellerinin bir geçmişi

Görüntü modellerinin geçmişini, başarılarını, zorluklarını ve gelecek yönelimlerini keşfet.

MOMostafa Ibrahim
5 min read
Görüntü modellerinin bir geçmişi

Link to this sectionBilgisayarlı görü nedir#

Bir kameranın yüzünü tanımladığı, ruh halini analiz ettiği ve tercihlerine göre ürünler önerdiği bir mağazaya girdiğini hayal et; üstelik tüm bunlar gerçek zamanlı olarak gerçekleşiyor. Bu bir bilim kurgu değil, modern görüntü modelleriyle mümkün kılınan bir gerçeklik. Fortune Business Insight tarafından hazırlanan bir rapora göre, küresel bilgisayarlı görü pazarının büyüklüğü 2023 yılında 20,31 milyar USD olarak değerlendi ve 2024'teki 25,41 milyar USD seviyesinden 2032'ye kadar 175,72 milyar USD seviyesine çıkması öngörülüyor; bu da teknolojinin çeşitli endüstrilerdeki hızlı ilerleyişini ve artan benimsenme oranını yansıtıyor.

Bilgisayarlı görü alanı, bilgisayarların görüntülerdeki nesneleri algılamasını, tanımlamasını ve analiz etmesini sağlar. Diğer yapay zeka ile ilgili alanlara benzer şekilde, bilgisayarlı görü de son birkaç on yılda hızlı bir evrim geçirerek dikkate değer ilerlemeler kaydetti.

Bilgisayarlı görünün geçmişi oldukça geniştir. İlk yıllarında, bilgisayarlı görü modelleri basit şekilleri ve kenarları algılayabiliyordu ve genellikle geometrik desenleri tanımak ya da aydınlık ve karanlık alanları ayırt etmek gibi temel görevlerle sınırlıydı. Ancak, günümüz modelleri gerçek zamanlı nesne algılama, yüz tanıma ve hatta yüz ifadelerinden duyguları yorumlama gibi karmaşık görevleri olağanüstü bir doğruluk ve verimlilikle gerçekleştirebiliyor. Bu çarpıcı ilerleme, hesaplama gücü, algoritmik karmaşıklık ve eğitim için geniş veri miktarlarının kullanılabilirliği konusunda kaydedilen inanılmaz adımları öne çıkarıyor.

Bu makalede, bilgisayarlı görünün evrimindeki temel dönüm noktalarını keşfedeceğiz. İlk başlangıçlarına yolculuk yapacak, Konvolüsyonel Sinir Ağlarının (CNN) dönüştürücü etkisini inceleyecek ve sonrasında gelen önemli gelişmeleri ele alacağız.

Link to this sectionBilgisayarlı görünün ilk başlangıçları#

Diğer yapay zeka alanlarında olduğu gibi, bilgisayarlı görünün erken gelişimi de temel araştırmalar ve teorik çalışmalarla başladı. Önemli bir dönüm noktası, Lawrence G. Roberts'ın 1960'ların başında "Üç Boyutlu Katıların Makine Algısı" adlı tezinde belgelenen 3D nesne tanıma konusundaki öncü çalışmasıydı. Onun katkıları, alandaki gelecekteki ilerlemeler için temel oluşturdu.

Link to this sectionİlk algoritmalar - kenar algılama#

Erken bilgisayarlı görü araştırmaları, kenar algılama ve öznitelik çıkarma gibi görüntü işleme tekniklerine odaklandı. 1960'ların sonunda geliştirilen Sobel operatörü gibi algoritmalar, görüntü yoğunluğunun gradyanını hesaplayarak kenarları algılayan ilk yöntemlerden biriydi.

Kenar algılamayı gösteren bir görüntü

Şekil 1. Sol tarafta orijinal nesnenin, sağ tarafta ise kenar algılanmış sürümün gösterildiği, kenar algılamayı gösteren bir görüntü.

Sobel ve Canny kenar dedektörleri gibi teknikler, görüntülerdeki sınırların tanımlanmasında hayati bir rol oynadı; bu sınırlar nesneleri tanımak ve sahneleri anlamak için gereklidir.

Link to this sectionMakine öğrenimi ve bilgisayarlı görü#

Link to this sectionÖrüntü tanıma#

1970'lerde örüntü tanıma, bilgisayarlı görünün önemli bir alanı olarak ortaya çıktı. Araştırmacılar, görüntülerdeki şekilleri, dokuları ve nesneleri tanımak için yöntemler geliştirdiler; bu yöntemler daha karmaşık görü görevlerinin önünü açtı.

Örüntü tanıma

Şekil 2. Örüntü Tanıma.

Örüntü tanıma için kullanılan ilk yöntemlerden biri, bir görüntünün en iyi eşleşmeyi bulmak için bir şablon kümesiyle karşılaştırıldığı şablon eşleştirmesiydi. Bu yaklaşım, ölçek, döndürme ve gürültü değişimlerine karşı hassasiyeti nedeniyle sınırlıydı.

Bir görüntü içinde şablon eşleştirme

Şekil 3. Sol tarafta bir şablon ve sağ görüntüde bulunan hali.

Erken bilgisayarlı görü sistemleri, zamanın sınırlı hesaplama gücüyle kısıtlıydı. 1960'lar ve 1970'lerdeki bilgisayarlar hantal, pahalı ve sınırlı işleme yeteneklerine sahipti.

Link to this sectionDerin Öğrenme ile oyunun kurallarını değiştirmek#

Link to this sectionDerin Öğrenme ve Konvolüsyonel Sinir Ağları#

Derin öğrenme ve Konvolüsyonel Sinir Ağları (CNN), bilgisayarlı görü alanında çok önemli bir anı işaret etti. Bu ilerlemeler, bilgisayarların görsel verileri yorumlama ve analiz etme şeklini çarpıcı biçimde değiştirdi ve daha önce imkansız olduğu düşünülen çok çeşitli uygulamaları mümkün kıldı.

Link to this sectionCNN'ler nasıl çalışır?#

Bir Konvolüsyonel Sinir Ağının (CNN) mimarisi

Şekil 4. Bir Konvolüsyonel Sinir Ağının (CNN) mimarisi.

  1. Konvolüsyonel Katmanlar: CNN'ler, görüntü veya dizi gibi yapılandırılmış ızgara benzeri verileri işlemek için tasarlanmış ve hiyerarşik kalıpları otomatik olarak öğrenen bir derin öğrenme modeli türü olan konvolüsyonel katmanları kullanarak bir görüntüyü filtreler veya çekirdekler aracılığıyla tararlar. Bu filtreler, görüntü boyunca kayarak ve nokta çarpımları hesaplayarak kenarlar, dokular ve renkler gibi çeşitli özellikleri algılar. Her filtre görüntüdeki belirli desenleri aktive ederek modelin hiyerarşik özellikleri öğrenmesini sağlar.
  2. Aktivasyon Fonksiyonları: Konvolüsyondan sonra, derin öğrenmede popüler olan ve pozitifse girdiyi doğrudan, değilse sıfırı çıktı veren ReLU (Rectified Linear Unit) gibi aktivasyon fonksiyonları kullanılır; bu, sinir ağlarının verilerdeki doğrusal olmayan ilişkileri verimli bir şekilde öğrenmesine yardımcı olur. Bu, ağın karmaşık kalıpları ve temsilleri öğrenmesini sağlar.
  3. Havuzlama (Pooling) Katmanları: Havuzlama katmanları, öznitelik haritasının boyutluluğunu azaltan bir alt örnekleme işlemi sağlayarak, en alakalı özellikleri çıkarmaya yardımcı olurken aynı zamanda hesaplama maliyetini ve aşırı uyumu (overfitting) azaltır.
  4. Tam Bağlantılı (Fully Connected) Katmanlar: Bir CNN'in son katmanları, tahminler yapmak için konvolüsyonel ve havuzlama katmanları tarafından çıkarılan özellikleri yorumlayan tam bağlantılı katmanlardır. Bu katmanlar geleneksel sinir ağlarındakilere benzerdir.

Link to this sectionCNN görüntü modellerinin evrimi#

Görüntü modellerinin yolculuğu oldukça geniş kapsamlıdır ve en dikkat çekici olanlardan bazıları şunlardır:

  • LeNet (1989): LeNet, ilk CNN mimarilerinden biriydi ve öncelikle el yazısı çeklerdeki rakamları tanımak için kullanıldı. Başarısı, daha karmaşık CNN'ler için temel oluşturdu ve derin öğrenmenin görüntü işlemedeki potansiyelini kanıtladı.

  • AlexNet (2012): AlexNet, ImageNet yarışmasında mevcut modellerden önemli ölçüde daha iyi performans göstererek derin öğrenmenin gücünü ortaya koydu. Bu model ReLU aktivasyonlarını, dropout'u ve veri artırmayı kullanarak görüntü sınıflandırmada yeni standartlar belirledi ve CNN'lere karşı yaygın bir ilgi uyandırdı.

  • VGGNet (2014): Daha küçük konvolüsyonel filtreler (3x3) kullanarak VGGNet, görüntü sınıflandırma görevlerinde etkileyici sonuçlar elde etti ve daha yüksek doğruluk elde etmede ağ derinliğinin önemini pekiştirdi.

  • ResNet (2015): ResNet, kalıntı öğrenmeyi (residual learning) tanıtarak derin ağlardaki bozulma sorununu ele aldı. Bu yenilik, çok daha derin ağların eğitilmesine olanak tanıdı ve çeşitli bilgisayarlı görü görevlerinde en üst düzey performansa yol açtı.

  • YOLO (You Only Look Once): YOLO, nesne algılamayı tek bir regresyon problemi olarak çerçeveleyerek devrim yarattı ve tek bir değerlendirmede tüm görüntülerden doğrudan bounding box ve sınıf olasılıklarını tahmin etti. Bu yaklaşım, benzeri görülmemiş bir hız ve doğrulukla gerçek zamanlı nesne algılamayı mümkün kıldı ve otonom sürüş ve gözetim gibi anlık işleme gerektiren uygulamalar için uygun hale getirdi.

Link to this sectionBilgisayarlı görü uygulamaları#

Link to this sectionSağlık hizmetleri#

Bilgisayarlı görünün kullanım alanları çok sayıdadır. Örneğin, Ultralytics YOLOv8 gibi görüntü modelleri, kanser ve diyabetik retinopati gibi hastalıkları tespit etmek için tıbbi görüntülemede kullanılır. X-ışınlarını, MR'ları ve BT taramalarını yüksek hassasiyetle analiz ederek anormallikleri erken teşhis ederler. Bu erken teşhis yeteneği, zamanında müdahalelere ve hasta sonuçlarının iyileştirilmesine olanak tanır.

Ultralytics YOLOv8 kullanarak beyin tümörü tespiti

Şekil 5. Ultralytics YOLOv8 kullanarak Beyin Tümörü Tespiti.

Link to this sectionÇevresel koruma#

Bilgisayarlı görü modelleri, vahşi yaşam habitatlarından alınan görüntüleri ve videoları analiz ederek nesli tükenmekte olan türlerin izlenmesine ve korunmasına yardımcı olur. Hayvan davranışlarını tanımlar ve takip ederler, bu da popülasyonları ve hareketleri hakkında veri sağlar. Bu teknoloji, kaplanlar ve filler gibi türleri korumak için koruma stratejilerini ve politika kararlarını bilgilendirir.

Görüntü yapay zekasının yardımıyla, orman yangınları ve ormanların yok olması gibi diğer çevresel tehditler izlenebilir ve yerel yetkililerin hızlı tepki süreleri sağlaması garanti altına alınabilir.

Bir orman yangınının uydu görüntüsü

Şekil 6. Bir orman yangınının uydu görüntüsü.

Link to this sectionZorluklar ve gelecek yönelimleri#

Zaten önemli başarılar elde etmiş olsalar da, aşırı karmaşıklıkları ve geliştirilmelerinin zorlu doğası nedeniyle, görüntü modelleri sürekli araştırma ve gelecekteki ilerlemeler gerektiren çok sayıda zorlukla karşı karşıyadır.

Link to this sectionYorumlanabilirlik ve açıklanabilirlik#

Görüntü modelleri, özellikle derin öğrenme modelleri, genellikle sınırlı şeffaflığa sahip "kara kutular" olarak görülür. Bunun nedeni, bu tür modellerin inanılmaz derecede karmaşık olmasıdır. Yorumlanabilirlik eksikliği, özellikle sağlık hizmetleri gibi kritik uygulamalarda güven ve hesap verebilirliği engeller.

Link to this sectionHesaplama gereksinimleri#

En son teknoloji yapay zeka modellerini eğitmek ve dağıtmak, önemli hesaplama kaynakları gerektirir. Bu durum, genellikle büyük miktarlarda görüntü ve video verisinin işlenmesini gerektiren görüntü modelleri için özellikle geçerlidir. En veri yoğun eğitim girdileri arasında yer alan yüksek çözünürlüklü görüntüler ve videolar, hesaplama yükünü artırır. Örneğin, tek bir HD görüntü birkaç megabayt depolama alanı kaplayabilir, bu da eğitim sürecini kaynak yoğun ve zaman alıcı hale getirir.

Bu durum, etkili görüntü modelleri geliştirmede yer alan kapsamlı verileri ve karmaşık hesaplamaları yönetmek için güçlü donanım ve optimize edilmiş bilgisayarlı görü algoritmaları gerektirir. Daha verimli mimariler, model sıkıştırma ve GPU'lar ve TPU'lar gibi donanım hızlandırıcıları üzerine yapılan araştırmalar, görüntü modellerinin geleceğini ilerletecek kilit alanlardır.

Bu iyileştirmeler, hesaplama taleplerini azaltmayı ve işleme verimliliğini artırmayı amaçlamaktadır. Ayrıca, YOLOv8 gibi gelişmiş önceden eğitilmiş modellerden yararlanmak, kapsamlı eğitim ihtiyacını önemli ölçüde azaltabilir, geliştirme sürecini kolaylaştırabilir ve verimliliği artırabilir.

Link to this sectionSürekli gelişen bir manzara#

Günümüzde, görüntü modellerinin uygulamaları, tümör tespiti gibi sağlık hizmetlerinden, trafik izleme gibi günlük kullanımlara kadar yaygındır. Bu gelişmiş modeller, daha önce hayal edilemeyen artırılmış doğruluk, verimlilik ve yetenekler sağlayarak sayısız endüstriye yenilik getirdi.

Teknoloji ilerlemeye devam ettikçe, görüntü modellerinin yaşamın ve endüstrinin çeşitli yönlerini yenileme ve iyileştirme potansiyeli sınırsız kalmaya devam ediyor. Bu süregelen evrim, bilgisayarlı görü alanında devam eden araştırma ve geliştirmenin önemini vurgulamaktadır.

Görüntü yapay zekasının geleceğini mi merak ediyorsun? En son gelişmeler hakkında daha fazla bilgi için Ultralytics Docs sayfasını keşfet ve Ultralytics GitHub ile YOLOv8 GitHub üzerindeki projelerine göz at. Ayrıca, çeşitli endüstrilerdeki yapay zeka uygulamaları hakkında içgörüler için Otonom Araçlar ve Üretim üzerine olan çözümler sayfaları özellikle yararlı bilgiler sunar.

Explore solutions

Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.

Daha fazla bilgi edin
Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.

Daha fazla bilgi edin
Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.

Daha fazla bilgi edin

Yapay zekanın geleceğini birlikte inşa edelim!

Yolculuğuna makine öğreniminin geleceğiyle başla