YOLO12 açıklandı: Gerçek dünya uygulamaları ve kullanım durumları
En son bilgisayarlı görü modeli olan YOLO12'yi keşfet! Dikkat odaklı mimarisinin ve FlashAttention teknolojisinin sektörler genelinde nesne tespiti görevlerini nasıl geliştirdiğini öğren.

Bilgisayarlı görü, makinelerin görüntüleri ve videoları anlamasına yardımcı olan yapay zeka (YZ) dalıdır. YZ araştırmacıları ve geliştiricileri sürekli sınırları zorladığı için inanılmaz bir hızla ilerleyen bir alandır. YZ topluluğu her zaman modelleri daha hızlı, daha akıllı ve daha verimli hale getirmeyi hedefler. En son gelişmelerden biri, 18 Şubat 2025'te piyasaya sürülen ve YOLO (You Only Look Once) model serisinin en yeni üyesi olan YOLO12'dir.
YOLO12, University at Buffalo, SUNY (State University of New York) ve Çin Bilimler Akademisi Üniversitesi'nden araştırmacılar tarafından geliştirilmiştir. Benzersiz ve yeni bir yaklaşımla YOLO12, modelin her şeyi eşit şekilde işlemek yerine bir görüntünün en önemli kısımlarına odaklanmasını sağlayan dikkat mekanizmalarını tanıtır.
Ayrıca, daha az bellek kullanarak işlemeyi hızlandıran bir teknik olan FlashAttention ve insanların doğal olarak merkezi nesnelere odaklanma biçimini taklit etmek için tasarlanmış bir alan dikkati mekanizması içerir.
Bu iyileştirmeler, YOLO12n'i YOLOv10n'den %2,1 daha doğru, YOLO12m'yi ise YOLO11m'den %1,0 daha doğru hale getirir. Ancak bu bir takasla gelir: YOLO12n, YOLOv10n'den %9, YOLO12m ise YOLO11m'den %3 daha yavaştır.

Şekil 1. Nesneleri tespit etmek için kullanılan YOLO12'den bir örnek.
Bu makalede YOLO12'yi neyin farklı kıldığını, önceki sürümlerle nasıl karşılaştırıldığını ve nerelerde uygulanabileceğini inceleyeceğiz.
Link to this sectionYOLO12'nin piyasaya sürülmesine giden yol#
YOLO model serisi, gerçek zamanlı nesne tespiti için tasarlanmış, yani görüntülerdeki ve videolardaki nesneleri hızlı bir şekilde tanımlayıp konumlandırabilen bir bilgisayarlı görü modelleri koleksiyonudur. Zamanla her sürüm hız, doğruluk ve verimlilik açısından gelişme kaydetti.
Örneğin, 2020'de piyasaya sürülen Ultralytics YOLOv5, hızlı olduğu ve özel eğitime ve dağıtıma kolay uyum sağladığı için yaygın olarak kullanılmaya başlandı. Daha sonra Ultralytics YOLOv8, örnek segmentasyonu ve nesne takibi gibi bilgisayarlı görü görevleri için ek destek sunarak bunu daha da geliştirdi.
Daha yakın zamanda, Ultralytics YOLO11, hız ve doğruluk arasında bir denge korurken gerçek zamanlı işlemeyi iyileştirmeye odaklandı. Örneğin YOLO11m, YOLOv8m'den %22 daha az parametreye sahip olmasına rağmen, nesne tespiti modellerini değerlendirmek için yaygın olarak kullanılan bir kıyaslama olan COCO veri setinde daha iyi tespit performansı sağladı.
Bu gelişmelerin üzerine inşa edilen YOLO12, görsel bilgiyi işleme biçiminde bir değişiklik sunar. Bir görüntünün tüm bölümlerine eşit davranmak yerine, en alakalı alanlara öncelik vererek tespit doğruluğunu artırır. Basitçe söylemek gerekirse YOLO12, önceki iyileştirmelerin üzerine inşa ederken daha hassas olmayı hedefler.
Link to this sectionYOLO12'nin temel özellikleri#
YOLO12, gerçek zamanlı işlem hızlarını korurken bilgisayarlı görü görevlerini geliştiren birkaç iyileştirme sunar. İşte YOLO12'nin temel özelliklerine genel bir bakış:
- Dikkat merkezli mimari: YOLO12, bir görüntünün her parçasına eşit davranmak yerine en önemli alanlara odaklanır. Bu, doğruluğu artırır ve gereksiz işlemleri azaltarak karmaşık görüntülerde bile tespiti daha keskin ve verimli hale getirir.
- FlashAttention: YOLO12, daha az bellek kullanırken görüntü analizini hızlandırır. FlashAttention (bellek açısından verimli bir algoritma) ile veri işlemeyi optimize eder, donanım üzerindeki yükü azaltır ve gerçek zamanlı görevleri daha sorunsuz ve güvenilir hale getirir.
- Residual Efficient Layer Aggregation Networks (R-ELAN): YOLO12, katmanlarını R-ELAN kullanarak daha verimli bir şekilde organize eder; bu da modelin verileri nasıl işlediğini ve öğrendiğini geliştirir. Bu, eğitimi daha kararlı, nesne tanımayı daha keskin ve bilgi işlem gereksinimlerini daha düşük hale getirir, böylece farklı ortamlarda verimli bir şekilde çalışır.
Bu özelliklerin gerçek hayatta nasıl çalıştığını anlamak için bir alışveriş merkezini düşünün. YOLO12, alışveriş yapanları takip etmeye, saksı bitkileri veya promosyon tabelaları gibi mağaza dekorasyonlarını tanımlamaya ve yanlış yerleştirilmiş veya terk edilmiş öğeleri tespit etmeye yardımcı olabilir.
Dikkat merkezli mimarisi, en önemli ayrıntılara odaklanmasına yardımcı olurken FlashAttention, sistemi zorlamadan her şeyi hızlı bir şekilde işlemesini sağlar. Bu, alışveriş merkezi operatörlerinin güvenliği artırmasını, mağaza düzenlerini organize etmesini ve genel alışveriş deneyimini geliştirmesini kolaylaştırır.

Şekil 2. YOLO12 kullanarak bir alışveriş merkezinde nesneleri tespit etme.
Ancak YOLO12'nin dikkate alınması gereken bazı sınırlamaları da vardır:
- Daha yavaş eğitim süreleri: Mimarisi nedeniyle YOLO12, YOLO11'e kıyasla daha fazla eğitim süresi gerektirir.
- Dışa aktarma zorlukları: Bazı kullanıcılar, özellikle YOLO12 modellerini belirli dağıtım ortamlarına entegre ederken dışa aktarma konusunda zorluklarla karşılaşabilir.
Link to this sectionYOLO12'nin performans kıyaslamalarını anlama#
YOLO12, her biri farklı ihtiyaçlar için optimize edilmiş birden fazla varyantla gelir. Daha küçük sürümler (nano ve small), hız ve verimliliğe öncelik vererek mobil cihazlar ve uç bilişim için idealdir. Medium ve large sürümler hız ile doğruluk arasında bir denge kurarken, YOLO12x (extra large) endüstriyel otomasyon, tıbbi görüntüleme ve gelişmiş gözetim sistemleri gibi yüksek hassasiyetli uygulamalar için tasarlanmıştır.
Bu varyasyonlarla YOLO12, model boyutuna bağlı olarak farklı performans seviyeleri sunar. Kıyaslama testleri, YOLO12'nin belirli varyantlarının doğruluk açısından YOLOv10 ve YOLO11'den daha iyi performans gösterdiğini ve daha yüksek ortalama hassasiyet (mAP) elde ettiğini göstermektedir.
Ancak YOLO12m, YOLO12l ve YOLO12x gibi bazı modeller, görüntüleri YOLO11'den daha yavaş işler ve bu da tespit doğruluğu ile hız arasında bir takas olduğunu gösterir. Buna rağmen YOLO12, YOLO11'den daha fazla parametre kullanmasına rağmen diğer birçok modelden daha az parametre gerektirerek verimli olmaya devam eder. Bu, onu doğruluğun ham hızdan daha önemli olduğu uygulamalar için harika bir seçim haline getirir.

Şekil 3. Ultralytics YOLO11 ve YOLO12'yi karşılaştırma.
Link to this sectionUltralytics Python paketi aracılığıyla YOLO12'yi kullanma#
YOLO12, Ultralytics Python paketi tarafından desteklenir ve kullanımı kolaydır, bu da onu hem yeni başlayanlar hem de profesyoneller için erişilebilir kılar. Sadece birkaç satır kodla kullanıcılar önceden eğitilmiş modelleri yükleyebilir, görüntüler ve videolar üzerinde çeşitli bilgisayarlı görü görevlerini çalıştırabilir ve ayrıca YOLO12'yi özel veri setlerinde eğitebilirler. Ultralytics Python paketi, karmaşık kurulum adımlarına olan ihtiyacı ortadan kaldırarak süreci kolaylaştırır.
Örneğin, nesne tespiti için YOLO12'yi kullanmak için izleyeceğin adımlar şunlardır:
- Ultralytics paketini yükle: İlk olarak, YOLO12'yi verimli bir şekilde çalıştırmak için gereken araçları sağlayan Ultralytics Python paketini yükle. Bu, tüm bağımlılıkların doğru şekilde ayarlandığından emin olmanı sağlar.
- Önceden eğitilmiş bir YOLO12 modelini yükle: Görevin için gereken doğruluk ve hız seviyesine göre uygun YOLO12 varyantını (nano, small, medium, large veya extra large) seç.
- Bir görüntü veya video sağla: Analiz etmek istediğin bir görüntü veya video dosyası gir. YOLO12, gerçek zamanlı tespit için canlı video akışlarını da işleyebilir.
- Tespit sürecini çalıştır: Model görsel verileri tarar, nesneleri tanımlar ve etraflarına sınırlayıcı kutular yerleştirir. Tespit edilen her nesneyi tahmin edilen sınıfı ve güven puanı ile etiketler.
- Tespit ayarlarını düzenle: Tespit doğruluğunu ve performansını hassas bir şekilde ayarlamak için güven eşikleri gibi parametreleri de değiştirebilirsin.
- Çıktıyı kaydet veya kullan: Artık tespit edilen nesneleri içeren işlenmiş görüntü veya video kaydedilebilir ya da daha fazla analiz, otomasyon veya karar verme süreçleri için bir uygulamaya entegre edilebilir.
Bu adımlar, YOLO12'yi gözetim ve perakende takibinden tıbbi görüntülemeye ve otonom araçlara kadar çeşitli uygulamalar için kullanımı kolay hale getirir.
Link to this sectionPratik YOLO12 uygulamaları#
YOLO12; nesne tespiti, örnek segmentasyonu, görüntü sınıflandırma, poz tahmini ve yönelimli nesne tespiti (OBB) desteği sayesinde çeşitli gerçek dünya uygulamalarında kullanılabilir.

Şekil 4. YOLO12, nesne tespiti ve örnek segmentasyonu gibi görevleri destekler.
Ancak daha önce tartıştığımız gibi, YOLO12 modelleri doğruluğa hızdan daha fazla öncelik verir, bu da görüntüleri önceki sürümlere kıyasla işlemek için biraz daha uzun süre harcadıkları anlamına gelir. Bu takas, YOLO12'yi hassasiyetin gerçek zamanlı hızdan daha önemli olduğu uygulamalar için ideal hale getirir, örneğin:
- Tıbbi görüntüleme: YOLO12, X-ışınları ve MRI'lardaki tümörleri veya anormallikleri yüksek doğrulukla tespit etmek için özel olarak eğitilebilir; bu da onu teşhis için hassas görüntü analizine ihtiyaç duyan doktorlar ve radyologlar için yararlı bir araç haline getirir.
- Üretimde kalite kontrol: Üretim sürecinde ürün kusurlarını tanımlamaya yardımcı olabilir, sadece yüksek kaliteli ürünlerin pazara ulaşmasını sağlarken israfı azaltır ve verimliliği artırır.
- Adli analiz: Kolluk kuvvetleri, gözetim görüntülerini analiz etmek ve kanıt toplamak için YOLO12'yi ince ayarlardan geçirebilir. Ceza davalarında, kilit ayrıntıları tanımlamak için hassasiyet hayati önem taşır.
- Hassas tarım: Çiftçiler, ürün sağlığını analiz etmek, hastalık veya haşere istilasını tespit etmek ve toprak koşullarını izlemek için YOLO12'yi kullanabilir. Doğru değerlendirmeler, daha iyi verim ve kaynak yönetimi sağlayan tarım stratejilerini optimize etmeye yardımcı olur.
Link to this sectionYOLO12 ile çalışmaya başlama#
YOLO12'yi çalıştırmadan önce sisteminin gerekli gereksinimleri karşıladığından emin olman önemlidir.
Teknik olarak YOLO12, herhangi bir özel GPU (Grafik İşleme Birimi) üzerinde çalışabilir. Varsayılan olarak FlashAttention gerektirmez, bu nedenle çoğu GPU sisteminde onsuz çalışabilir. Ancak, FlashAttention'ı etkinleştirmek, yavaşlamaları önlemeye, bellek kullanımını azaltmaya ve işlem verimliliğini artırmaya yardımcı olduğundan, büyük veri setleri veya yüksek çözünürlüklü görüntülerle çalışırken özellikle yararlı olabilir.
FlashAttention'ı kullanmak için şu serilerden birinden bir NVIDIA GPU'ya ihtiyacın olacak: Turing (T4, Quadro RTX), Ampere (RTX 30 serisi, A30, A40, A100), Ada Lovelace (RTX 40 serisi) veya Hopper (H100, H200).
Kullanılabilirlik ve erişilebilirliği göz önünde bulundurarak, Ultralytics Python paketi henüz FlashAttention çıkarımını desteklememektedir, çünkü kurulumu teknik olarak oldukça karmaşık olabilir. YOLO12 ile çalışmaya başlama ve performansını optimize etme hakkında daha fazla bilgi edinmek için resmi Ultralytics dokümantasyonuna göz at.
Link to this sectionÖne çıkanlar#
Bilgisayarlı görü ilerledikçe, modeller daha hassas ve verimli hale geliyor. YOLO12, dikkat merkezli işleme ve FlashAttention ile nesne tespiti, örnek segmentasyonu ve görüntü sınıflandırma gibi bilgisayarlı görü görevlerini geliştirerek bellek kullanımını optimize ederken doğruluğu artırıyor.
Aynı zamanda, bilgisayarlı görü her zamankinden daha erişilebilir. YOLO12, Ultralytics Python paketi aracılığıyla kullanımı kolaydır ve hızdan ziyade doğruluğa odaklanmasıyla, hassasiyetin kilit olduğu tıbbi görüntüleme, endüstriyel denetimler ve robotik gibi uygulamalar için çok uygundur.
YZ hakkında meraklı mısın? GitHub depomuzu ziyaret et ve topluluğumuzla etkileşime geç. Çözüm sayfalarımızda kendi kendine giden araçlarda YZ ve tarımda bilgisayarlı görü gibi sektörlerdeki yenilikleri keşfet. Lisans seçeneklerimize göz at ve görme tabanlı YZ projelerini hayata geçir. 🚀






