YOLO26 ile tanış: yeni nesil görsel AI.
Ultralytics
Ultralytics YOLO

Nesne tespiti ve Ultralytics'in YOLO modellerinin evrimi

Nesne tespitinin evrimine geri dönüp bakarken bize katıl. YOLO (You Only Look Once) modellerinin son yıllarda nasıl ilerlediğine odaklanacağız.

ABAbirami Vina
4 min read
Nesne tespiti ve YOLO modellerinin evrimi

Bilgisayarlı görü, makinelere tıpkı insanların gerçek dünyayı algıladığı gibi görüntüleri ve videoları görmeyi ve anlamayı öğretmeye odaklanan yapay zekanın (AI) bir alt dalıdır. Nesneleri tanımak veya eylemleri tanımlamak insanlar için doğal bir yetenek olsa da, makineler söz konusu olduğunda bu görevler özel bilgisayarlı görü teknikleri gerektirir. Örneğin, bilgisayarlı görüdeki temel görevlerden biri, görüntüler veya videolar içindeki nesneleri tanımlamayı ve konumlandırmayı içeren nesne algılamadır.

Since the 1960s, researchers have been working on improving how computers can detect objects. Early methods, like template matching, involved sliding a predefined template across an image to find matches. While innovative, these approaches struggled with changes in object size, orientation, and lighting. Today, we have advanced models like Ultralytics YOLO11 that can detect even small and partially hidden objects, known as occluded objects, with impressive accuracy.

Bilgisayarlı görü gelişmeye devam ederken, bu teknolojilerin nasıl geliştiğine dönüp bakmak önemlidir. Bu makalede, nesne algılamanın evrimini keşfedeceğiz ve YOLO (You Only Look Once) modellerinin dönüşümüne ışık tutacağız. Hadi başlayalım!

Link to this sectionBilgisayarlı görünün kökenleri#

Nesne algılamaya dalmadan önce, bilgisayarlı görünün nasıl başladığına bir göz atalım. Bilgisayarlı görünün kökenleri, bilim insanlarının beynin görsel bilgiyi nasıl işlediğini keşfetmeye başladığı 1950'lerin sonlarına ve 1960'ların başlarına kadar uzanır. Kediler üzerinde yapılan deneylerde, araştırmacılar David Hubel ve Torsten Wiesel, beynin kenarlar ve çizgiler gibi basit desenlere tepki verdiğini keşfettiler. Bu, öznitelik çıkarımının temelini oluşturdu; yani görsel sistemlerin daha karmaşık desenlere geçmeden önce görüntülerdeki kenarlar gibi temel özellikleri algılayıp tanıması kavramı.

Bilgisayarlı görüde özellik çıkarımına ilham veren kedi beyni deneyi

Şekil 1. Bir kedinin beyninin ışık çubuklarına nasıl tepki verdiğini öğrenmek, bilgisayarlı görude öznitelik çıkarımının geliştirilmesine yardımcı oldu.

Aynı dönemde, fiziksel görüntüleri dijital formatlara dönüştürebilen yeni bir teknoloji ortaya çıktı ve makinelerin görsel bilgiyi nasıl işleyebileceğine dair ilgi uyandırdı. 1966'da Massachusetts Teknoloji Enstitüsü'nün (MIT) Yaz Görü Projesi işleri daha ileriye taşıdı. Proje tamamen başarılı olmasa da, görüntülerdeki ön planı arka plandan ayırabilen bir sistem oluşturmayı amaçlıyordu. Görü AI topluluğundaki birçok kişi için bu proje, bilgisayarlı görünün bilimsel bir alan olarak resmi başlangıcını işaret eder.

Link to this sectionNesne algılamanın tarihini anlamak#

1990'ların sonlarında ve 2000'lerin başlarında bilgisayarlı görü ilerledikçe, nesne algılama yöntemleri şablon eşleştirme gibi temel tekniklerden daha gelişmiş yaklaşımlara kaydı. Popüler bir yöntem, yüz algılama gibi görevler için yaygın olarak kullanılan Haar Cascade idi. Bu yöntem, görüntüleri kayan bir pencere ile tarayarak, görüntünün her bölümündeki kenarlar veya dokular gibi belirli özellikleri kontrol ederek ve ardından bu özellikleri birleştirerek yüzler gibi nesneleri algılayarak çalışıyordu. Haar Cascade, önceki yöntemlerden çok daha hızlıydı.

Yüz tespiti için Haar Cascade kullanımı

Şekil 2. Yüz Algılama için Haar Cascade Kullanımı.

Bunların yanı sıra, Yönlü Gradyanlar Histogramı (HOG) ve Destek Vektör Makineleri (SVM) gibi yöntemler de tanıtıldı. HOG, ışık ve gölgelerin bir görüntünün küçük bölümlerinde nasıl değiştiğini analiz etmek için kayan pencere tekniğini kullanarak, nesneleri şekillerine göre tanımlamaya yardımcı oldu. SVM'ler ise nesnenin kimliğini belirlemek için bu özellikleri sınıflandırdı. Bu yöntemler doğruluğu artırdı ancak yine de gerçek dünya ortamlarında zorlandı ve günümüz tekniklerine kıyasla daha yavaştı.

Link to this sectionGerçek zamanlı nesne algılama ihtiyacı#

2010'larda, derin öğrenme ve Evrişimli Sinir Ağlarının (CNN'ler) yükselişi, nesne algılamada büyük bir değişimi beraberinde getirdi. CNN'ler, bilgisayarların büyük miktarda veriden önemli özellikleri otomatik olarak öğrenmesini mümkün kıldı ve bu da algılamayı çok daha doğru hale getirdi.

R-CNN (Bölge tabanlı Evrişimli Sinir Ağları) gibi erken dönem modeller, hassasiyet konusunda büyük bir gelişmeydi ve nesnelerin eski yöntemlerden daha doğru bir şekilde tanımlanmasına yardımcı oldu.

Ancak bu modeller yavaştı çünkü görüntüleri birden fazla aşamada işliyorlardı, bu da onları kendi kendine giden arabalar veya video gözetimi gibi alanlarda gerçek zamanlı uygulamalar için pratik olmaktan çıkarıyordu.

Hızlandırmaya odaklanılarak daha verimli modeller geliştirildi. Fast R-CNN ve Faster R-CNN gibi modeller, ilgi bölgelerinin nasıl seçileceğini iyileştirerek ve algılama için gereken adım sayısını azaltarak yardımcı oldu. Bu, nesne algılamayı hızlandırsa da, anlık sonuç gerektiren birçok gerçek dünya uygulaması için hala yeterince hızlı değildi. Gerçek zamanlı algılamaya yönelik artan talep, hem hız hem de doğruluk arasında denge kurabilen daha hızlı ve daha verimli çözümlerin geliştirilmesini tetikledi.

R-CNN, Fast R-CNN ve Faster R-CNN hızlarının karşılaştırılması

Şekil 3. R-CNN, Fast R-CNN ve Faster R-CNN hızlarının karşılaştırılması.

Link to this sectionYOLO (You Only Look Once) modelleri: Önemli bir dönüm noktası#

YOLO is an object detection model that redefined computer vision by enabling real-time detection of multiple objects in images and videos, rendering it quite unique from previous detection methods. Instead of analyzing each detected object individually, YOLO’s architecture treats object detection as a single task, predicting both the location and class of objects in one go using CNNs.

Model, bir görüntüyü bir ızgaraya bölerek çalışır ve her bölüm kendi alanındaki nesneleri algılamaktan sorumludur. Her bölüm için birden fazla tahmin yapar ve daha az güvenilir sonuçları filtreleyerek, sadece doğru olanları tutar.

YOLO'nun nasıl çalıştığına dair genel bakış

Şekil 4. YOLO'nun Nasıl Çalıştığına Dair Genel Bir Bakış.

YOLO'nun bilgisayarlı görü uygulamalarına tanıtılması, nesne algılamayı önceki modellerden çok daha hızlı ve verimli hale getirdi. Hızı ve doğruluğu nedeniyle YOLO, imalat, sağlık ve robotik gibi sektörlerde gerçek zamanlı çözümler için hızla popüler bir tercih haline geldi.

Belirtilmesi gereken bir diğer önemli nokta da, YOLO açık kaynaklı olduğu için geliştiricilerin ve araştırmacıların onu sürekli olarak geliştirebilmesi ve daha da gelişmiş sürümlere yol açmasıdır.

Link to this sectionYOLO'dan YOLO11'e giden yol#

YOLO modelleri, her sürümün ilerlemeleri üzerine inşa edilerek zaman içinde istikrarlı bir şekilde gelişti. Daha iyi performansın yanı sıra, bu iyileştirmeler modelleri farklı teknik deneyim seviyelerine sahip kişiler için kullanımı daha kolay hale getirdi.

Örneğin, Ultralytics YOLOv5 tanıtıldığında, modellerin dağıtımı PyTorch ile daha basit hale geldi ve daha geniş bir kullanıcı kitlesinin gelişmiş yapay zeka ile çalışmasına olanak tanıdı. Doğruluk ve kullanılabilirliği bir araya getirerek, daha fazla insanın kodlama uzmanı olmaya gerek kalmadan nesne tespitini uygulamasına olanak sağladı.

YOLO modellerinin evrimi

Şekil 5. YOLO modellerinin evrimi.

Ultralytics YOLOv8, örnek segmentasyonu gibi görevler için destek ekleyerek ve modelleri daha esnek hale getirerek bu ilerlemeyi sürdürdü. YOLO'nun hem temel hem de daha karmaşık uygulamalar için kullanımı kolaylaştı ve çeşitli senaryolarda kullanışlı hale geldi.

En son model olan Ultralytics YOLO11 ile daha fazla optimizasyon yapıldı. Parametre sayısını azaltırken doğruluğu artırarak, gerçek zamanlı görevler için artık daha verimli. İster deneyimli bir geliştirici ister yapay zekaya yeni başlamış biri ol, YOLO11 kolayca erişilebilir gelişmiş bir nesne algılama yaklaşımı sunar.

Link to this sectionYOLO11'i tanıma: Yeni özellikler ve iyileştirmeler#

YOLO11, launched at Ultralytics’ annual hybrid event, YOLO Vision 2024 (YV24), supports the same computer vision tasks as YOLOv8, like object detection, instance segmentation, image classification, and pose estimation. So, users can easily switch to this new model without needing to adjust their workflows. Additionally, YOLO11’s upgraded architecture makes predictions even more precise. In fact, YOLO11m achieves a higher mean average precision (mAP) on the COCO dataset with 22% fewer parameters than YOLOv8m.

YOLO11 ayrıca akıllı telefonlardan ve diğer uç cihazlardan daha güçlü bulut sistemlerine kadar çeşitli platformlarda verimli bir şekilde çalışacak şekilde oluşturulmuştur. Bu esneklik, gerçek zamanlı uygulamalar için farklı donanım kurulumlarında sorunsuz performans sağlar. Bunun da ötesinde, YOLO11 daha hızlı ve daha verimlidir; hesaplama maliyetlerini düşürür ve çıkarım sürelerini hızlandırır. İster Ultralytics Python paketini ister kod gerektirmeyen Ultralytics HUB kullanıyor ol, YOLO11'i mevcut iş akışlarına entegre etmek kolaydır.

Link to this sectionYOLO modellerinin ve nesne algılamanın geleceği#

Gelişmiş nesne algılamanın gerçek zamanlı uygulamalar ve uç yapay zeka üzerindeki etkisi, endüstriler genelinde şimdiden hissediliyor. Petrol ve gaz, sağlık hizmetleri ve perakende gibi sektörler yapay zekaya giderek daha fazla güvendikçe, hızlı ve kesin nesne algılama talebi artmaya devam ediyor. YOLO11, sınırlı hesaplama gücüne sahip cihazlarda bile yüksek performanslı algılamayı mümkün kılarak bu talebe cevap vermeyi amaçlıyor.

Uç yapay zeka büyüdükçe, YOLO11 gibi nesne algılama modellerinin, hız ve doğruluğun kritik olduğu ortamlarda gerçek zamanlı karar verme için daha da vazgeçilmez hale gelmesi muhtemeldir. Tasarım ve uyarlanabilirlikteki devam eden iyileştirmelerle, nesne algılamanın geleceği, çeşitli uygulamalarda daha fazla yeniliği beraberinde getirmeye hazır görünüyor.

Link to this sectionÖne çıkanlar#

Nesne algılama, basit yöntemlerden günümüzde gördüğümüz gelişmiş derin öğrenme tekniklerine kadar evrilerek uzun bir yol kat etti. YOLO modelleri, farklı endüstriler genelinde daha hızlı ve daha doğru gerçek zamanlı algılama sağlayarak bu ilerlemenin merkezinde yer aldı. YOLO11, verimliliği artırarak, hesaplama maliyetlerini düşürerek ve doğruluğu geliştirerek bu mirası üzerine inşa ediyor ve onu çeşitli gerçek zamanlı uygulamalar için güvenilir bir seçenek haline getiriyor. Yapay zeka ve bilgisayarlı görudeki sürekli ilerlemelerle, hız, hassasiyet ve uyarlanabilirlikte daha fazla iyileştirme imkanıyla nesne algılamanın geleceği parlak görünüyor.

Curious about AI? Stay connected with our community to keep learning! Check out our GitHub repository to discover how we are using AI to create innovative solutions in industries like manufacturing and healthcare. 🚀

Explore solutions

Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.

Daha fazla bilgi edin
Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.

Daha fazla bilgi edin
Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.

Daha fazla bilgi edin

Yapay zekanın geleceğini birlikte inşa edelim!

Yolculuğuna makine öğreniminin geleceğiyle başla