Ultralytics uçta nasıl daha hızlı olduğunu ve bunun düşük gecikme süresi ve verimlilik gerektiren yeni nesil bilgisayar görme uygulamaları için neden önemli olduğunu görün.
Ultralytics uçta nasıl daha hızlı olduğunu ve bunun düşük gecikme süresi ve verimlilik gerektiren yeni nesil bilgisayar görme uygulamaları için neden önemli olduğunu görün.
Bu hafta başında Ultralytics , bilgisayar görme sistemlerinin uçta nasıl çalıştığını yeniden tanımlamayı amaçlayan, daha hızlı, daha hafif ve daha küçük bir YOLO olan Ultralytics Ultralytics piyasaya sürdü. YOLO26, nesne algılama ve örnek segmentasyonu dahil olmak üzere önceki YOLO aynı temel görme görevlerini destekliyor.

YOLO26 ile önceki modeller arasındaki belirleyici fark, çalışmak üzere tasarlandığı ortamdır. YOLO26, öncelikle bulut grafik işlem birimleri (GPU'lar) veya benchmark odaklı performans için optimize edilmek yerine, uç cihazlarda ve gömülü donanımlarda gerçek dünya uygulamaları için sıfırdan tasarlanmıştır.
Bilgisayar görüşü araştırma aşamasından üretim aşamasına geçerken, performans kısıtlamalarının gerçekliği daha net hale geliyor. Kenar ortamları, sıkı gecikme süreleri, sınırlı bellek, güç ve termal kısıtlamalar ile çeşitli platformlarda öngörülebilir davranış ihtiyacı tarafından şekilleniyor.
Bu ayarlarda, genel sistem performansı sadece ham çıkarım hızına değil, aynı zamanda tüm boru hattının ne kadar verimli çalıştığına da bağlıdır. Son işlem yükü, bellek baskısı ve platforma özgü yürütme yolları genellikle darboğazlar oluşturur.
YOLO26, tek tek model metrikleri yerine tüm çıkarım boru hattını inceleyen, daha hızlı ve kenar öncelikli bir yaklaşım benimseyerek bu zorlukların üstesinden geliyor. Kenar optimizasyonuna odaklanarak, çıkarım boru hattını basitleştirerek ve gereksiz son işlem adımlarını ortadan kaldırarak, YOLO26 hız iyileştirmeleri sunarak üretimde daha düşük gecikme süresi ve daha güvenilir davranış sağlıyor.
Bu makalede, YOLO26'nın mimari seçimlerinin gerçek dünyadaki performans iyileştirmelerine nasıl yansıdığını ve uçta daha hızlı olmanın neden yeni nesil bilgisayar görme uygulamaları için olanakları temelden değiştirdiğini inceleyeceğiz.
Bilgisayar görme modellerini uçta çalıştırmak, bunları bulutta çalıştırmaktan çok farklıdır. Bulut ortamlarında, sistemler genellikle güçlü GPU'lara, büyük miktarda belleğe ve istikrarlı donanıma erişebilir. Uçta ise aynı varsayımlar geçerli değildir.
Çoğu uç dağıtım, GPU'lar değil, çeşitli donanım mimarileri üzerinde çalışır. Cihazlar genellikle farklı görevler için birden fazla özel işlemci kullanır. Bu işlemciler, bulut GPU'ların ham hesaplama kapasitesinden ziyade verimlilik ve düşük güç tüketimi için optimize edilmiştir.
Gecikme süresi de bir başka önemli kısıtlamadır. Kenar sistemleri genellikle sıkı gerçek zamanlı sınırlar altında çalışır ve bu sınırlarda küçük gecikmeler bile yanıt verme hızını veya güvenliği etkileyebilir. Bu durumlarda, uçtan uca gecikme süresi, ham çıkarım hızından daha önemlidir. Bir model kağıt üzerinde hızlı olabilir, ancak sonradan işleme ve veri taşıma eklendiğinde yetersiz kalabilir.
Bellek de büyük bir rol oynar. Birçok uç cihazın belleği sınırlıdır ve önbellekleri paylaşımlıdır. Büyük ara tensörler ve verimsiz bellek kullanımı, modelin kendisi verimli olsa bile sistemleri yavaşlatabilir.
Güç ve termal sınırlar da ek kısıtlamalar getirir. Kenar cihazları genellikle aktif soğutma olmadan ve sabit güç bütçeleri dahilinde çalışır. Performansın sadece kısa süreli hızlı olması değil, verimli ve sürdürülebilir olması gerekir.
Tüm bunların yanı sıra, uç dağıtımlar tutarlılık gerektirir. Modeller, tüm cihazlarda ve çalışma zamanlarında aynı şekilde davranmalıdır. Platforma özgü kodlar veya karmaşık son işlem adımları, sistemlerin dağıtımını ve bakımını zorlaştıran ince farklılıklar yaratabilir.

Bu kısıtlamalar, uç noktada performansın gerçek anlamını tanımlar. Başka bir deyişle, performans tek bir metrikle değil, tüm süreçle tanımlanır.
Peki, kenar dağıtımının kısıtlamaları, kenar için oluşturulan bir bilgisayar görme modelinin gereksinimleriyle nasıl ilişkilidir? Modeller araştırma ortamlarından gerçek dünya sistemlerine taşındığında bu bağlantı netleşir.
Bulut ortamlarında performans genellikle çıkarım hızı ve doğruluğu gibi kriterler kullanılarak ölçülür. Uçta ise bu ölçütler sadece hikayenin bir kısmını anlatır. Görme sistemleri genellikle heterojen donanımlarda çalışır; burada sinir ağı çıkarımları özel hızlandırıcılara aktarılırken, iş akışının diğer kısımları genel amaçlı işlemcilerde çalışır.
Bu bağlamda, model hızı yeterli değildir. Model uygulandıktan sonra tüm sistemin nasıl çalıştığı çok önemlidir. Bir model kendi başına hızlı görünebilir, ancak son işlem, veri taşıma veya platforma özgü adımlar ek yük getirirse yine de yetersiz kalabilir.
Bu nedenle, uç görme, izole edilmiş karşılaştırma ölçütlerinden ziyade sistem düzeyinde verimliliğe odaklanan bir performans modeli gerektirir. YOLO26, gerçek dünya uygulamaları için geliştirilmiş uç öncelikli optimizasyon, kolaylaştırılmış çıkarım ve uçtan uca yürütme özelliklerine odaklanarak bu değişimi yansıtmaktadır.
Kenarda, performans, bir modelin cihazın gerçek donanım mimarisine ne kadar iyi uyum sağladığıyla belirlenir. Öncelikle kenar için tasarım yapmak, mevcut işlem birimlerinin spesifik karışımından bağımsız olarak, görüntü sistemlerinin gerçek dünya platformlarında güvenilir bir şekilde çalışmasını sağlar.
Kenar öncelikli yaklaşım, bulut GPU'lar için optimize edilmiş modelleri sonradan uyarlamak yerine, heterojen donanımlarda öngörülebilir ve verimli yürütmeyi önceliklendirir. Basitçe ifade etmek gerekirse, bu, sinir ağı hızlandırıcılarına iyi uyum sağlayan işlemleri tercih etmek, model dışındaki sinir ağı dışı işleri en aza indirmek ve uçtan uca yürütmeyi yavaşlatabilecek gereksiz karmaşıklığı azaltmak anlamına gelir.
YOLO26, bu kısıtlamalar göz önünde bulundurularak tasarlanmıştır. Mimarisi, ideal koşullar altında en yüksek verimlilik yerine tutarlı performansa odaklanmaktadır. YOLO26, yürütme yollarını basitleştirerek ve gereksiz hesaplamaları ortadan kaldırarak, çıkarım boru hattındaki ek yükü azaltır ve cihazın mevcut hızlandırma ve bellek hiyerarşisini daha iyi kullanır.
Bu yaklaşım aynı zamanda güvenilirliği de artırır. Kenar öncelikli optimizasyon, daha öngörülebilir zamanlama ve daha az performans dalgalanmasına yol açar, bu da gerçek zamanlı sistemler için çok önemlidir. YOLO26, hız elde etmek için özel donanıma veya ağır son işlemelere güvenmek yerine, tüm çıkarım sürecinde verimliliği ön plana çıkarır.
Gereksiz son işlem adımlarını ortadan kaldırmanın ne anlama geldiğini merak ediyor olabilirsiniz. Bunu anlamak için bir adım geri gidip geleneksel nesne algılama sistemlerinin nasıl çalıştığına bakalım.
Birçok nesne algılama sürecinde, model tahminlerini ürettiğinde çıkarım süreci sona ermez. Bunun yerine, model çok sayıda üst üste binen sınırlayıcı kutu çıkarır ve bunların kullanılabilmesi için filtrelenip iyileştirilmesi gerekir. Bu temizleme işlemi, modelin dışında çalışan son işlem adımları aracılığıyla gerçekleştirilir.
En yaygın son işlem adımlarından biri, Maksimum Olmayan Bastırma veya NMSdir. NMS , üst üste binen sınırlayıcı kutuları NMS ve yalnızca en güvenilir algılamaları saklayarak aynı nesneye atıfta bulunan yinelemeleri kaldırır. Bu yaklaşım etkili olmakla birlikte, çıkarım tamamlandıktan sonra ek hesaplama gerektirir.

Sonuç olarak, bu ekstra işin bir bedeli vardır. NMS gibi son işlem adımları, kontrol ağırlıklı veya bellek yoğun işlemlerden ziyade yoğun sinirsel hesaplamalar için optimize edilmiş, sinir ağı çıkarımında kullanılan özel hızlandırıcılar için uygun NMS .
Sonuç olarak, NMS ek gecikme ve bellek yükü NMS ve algılama sayısı arttıkça maliyeti de artar. Modelin kendisi hızlı olsa bile, NMS toplam çalışma süresinin önemli bir bölümünü NMS .
Son işlem, sistem karmaşıklığını da artırır. Modelin dışında yer aldığı için, farklı çalışma zamanları ve donanım hedefleri için ayrı ayrı uygulanması gerekir. Bu durum genellikle platforma özgü kod yollarına, cihazlar arasında tutarsız davranışlara ve daha kırılgan dağıtım süreçlerine yol açar.
En önemlisi, son işlem, gerçek uçtan uca performans fikrini bozar. Model çıkarım hızını ölçmek, sistemin üretimde nasıl davrandığını yansıtmaz. Sonuçta önemli olan, girdi ile nihai çıktı arasındaki toplam süredir ve bu süre, iş akışındaki her adımı içerir.
Bu durumlarda, son işlemler kenarda gizli bir darboğaz haline gelir. Modelin dışında kalırken gecikme süresini uzatır, CPU tüketir ve dağıtımı karmaşıklaştırır.
YOLO26, çıkarımdan sonra yinelenen algılamaları temizlemek yerine, bunların temel nedenini ortadan kaldırarak NMS ortadan kaldırır. Filtrelenmesi gereken birçok çakışan tahmin üretmek yerine, model doğrudan daha küçük, güvenilir ve nihai algılama kümeleri üretmek üzere eğitilir.
Bu, eğitim sırasında algılamaların öğrenilme şeklini değiştirerek mümkün hale getirilmiştir. YOLO26, nesneler ve tahminler arasında daha net bir bire bir ilişki kurulmasını teşvik ederek, kaynağında yinelemeleri azaltır. Sonuç olarak, yinelenen algılamalar harici son işlemlerle değil, ağın kendi içinde çözülür.
NMS kaldırılması, uç performansına anında etki NMS . NMS , sinir ağı hızlandırıcılarına iyi bir şekilde NMS , onu ortadan kaldırmak bellek hareketini azaltır ve pahalı sinir ağı dışı işleme adımlarını önler. Bu, uçtan uca gecikmeyi azaltır ve performansı daha öngörülebilir hale getirir, özellikle de sonradan işleme toplam çalışma süresinin önemli bir bölümünü tüketebilen uç cihazlarda.
Ayrıca, çıkarım sürecini de basitleştirir. Model dışında daha az adım olması, daha az veri hareketi ve bileşenler arasında daha az aktarım anlamına gelir. Modelin çıktısı zaten nihai sonuçtur, bu da yürütmeyi daha öngörülebilir hale getirir.
YOLO26'daki bir diğer yenilik, önceki YOLO sınırlayıcı kutu regresyonu için kullanılan Dağıtım Odak Kaybı (DFL) özelliğinin kaldırılmasıdır. Tek bir koordinatı doğrudan tahmin etmek yerine, DFL kullanan modeller olası değerlerin dağılımını öğrendi ve ardından bu dağılımdan nihai sınırlayıcı kutuyu türetti. Bu yaklaşım, yerelleştirme doğruluğunu artırmaya yardımcı oldu ve önceki nesillerde önemli bir adımdı.
Ancak zamanla, DFL de bazı ödünler getirdi. Dağılımları tahmin etmek, hesaplamayı artırır ve model mimarisine karmaşıklık katar, bu da CPU'larda çıkarımları yavaşlatabilir ve modellerin dağıtım formatları arasında aktarılmasını zorlaştırabilir. DFL ayrıca sabit regresyon aralıkları dayattı, bu da çok büyük nesneleri algılarken esnekliği sınırlayabilirdi.
YOLO26, daha basit, uçtan uca bir tasarıma geçişin bir parçası olarak DFL'yi kaldırır. Sınırlayıcı kutu regresyonu daha doğrudan olacak şekilde yeniden tasarlanarak, doğruluğu korurken gereksiz hesaplamaları azaltır. Bu değişiklik, YOLO26'nın NMS yaklaşımıyla uyumludur.
CPU benchmark testlerinde, YOLO26 önceki YOLO göre belirgin bir performans artışı göstermektedir. Karşılaştırıldığında Ultralytics YOLO11ile karşılaştırıldığında, YOLO26 nano modeli %43'e kadar daha hızlı CPU sahiptir ve bu fark, gerçek dünya kenar uygulamalarında anlamlı bir etkiye sahiptir.

Bu kazanç, tek bir bileşeni optimize etmekten ziyade, tüm çıkarım sürecini basitleştirmekten kaynaklanmaktadır. Uçtan uca yürütme, son işlem yükünü ortadan kaldırır, daha doğrudan bir sınırlayıcı kutu regresyon yöntemi hesaplamayı azaltır ve CPU tasarım seçimleri genel amaçlı işlemcilerde yürütme verimliliğini artırır.
Bu değişiklikler bir araya gelerek gecikmeyi azaltır, CPU düşürür ve gerçek dünya kenar donanımında daha hızlı ve daha tutarlı bir performans sağlar.
YOLO26'nın performans artışı, daha hızlı çıkarımın ötesine uzanır. Modeli basitleştirerek ve bellek yükünü azaltarak, kenar ortamlarında dağıtımı daha kolay ve çalıştırması daha güvenilir hale gelir.
YOLO26'nın uçtan uca tasarımı, dışa aktarımı da basitleştirir. Daha az yardımcı bileşen ve harici son işlem adımı olmadan, dışa aktarılan modeller tamamen bağımsızdır. Bu, platforma özgü bağımlılıkları azaltır ve çalışma zamanları ve donanım hedefleri arasında tutarlı davranış sağlar.
Uygulamada bu, YOLO26'nın çeşitli dışa aktarım formatları kullanılarak kameralar, robotlar ve gömülü sistemler gibi uç cihazlara daha kolay bir şekilde dağıtılabileceği anlamına gelir. Dışa aktardığınız şey, çalıştırdığınız şeydir; entegrasyon adımları daha azdır ve dağıtım sapması riski daha düşüktür.
Şimdiye kadar, YOLO26'nın kenar öncelikli tasarımının sistem düzeyinde performansı nasıl iyileştirdiğini inceledik. Ancak asıl etki, Vision AI'nın gerçek dünya uygulamalarına entegrasyonunu nasıl kolaylaştırdığıdır.
Örneğin, robotik ve endüstriyel ortamlarda, görüntü sistemleri genellikle sıkı gerçek zamanlı kısıtlamalar altında çalışır. Kararlar, sınırlı hesaplama gücü kullanılarak ve bulut bağlantısına bağlı kalınmadan hızlı ve tutarlı bir şekilde alınmalıdır. Ultralytics ile bu gereksinimleri karşılamak pratik hale gelir.
Robot navigasyonu ve nesne manipülasyonu gibi uygulamalar, daha düşük gecikme süresi ve daha öngörülebilir çıkarımlardan yararlanarak robotların çevrelerindeki değişikliklere sorunsuz bir şekilde yanıt vermesini sağlar. Benzer şekilde, endüstriyel ortamlarda görme modelleri, gecikme veya ek karmaşıklık yaratmadan üretim hatlarında doğrudan çalıştırılarak detect , track ve süreçleri izleyebilir.
YOLO26, uç donanımda hızlı ve güvenilir çıkarımları mümkün kılarak, Vision AI'nın robotik ve endüstriyel sistemlerin bir parçası haline gelmesini sağlar ve bu teknolojinin kurulumu ve bakımı için bir zorluk olmaktan çıkarır.
YOLO26, gecikme, bellek ve güvenilirlik gibi gerçek dünyadaki kısıtlamaların neyin mümkün olduğunu belirlediği uç noktalar için geliştirilmiştir. YOLO26, CPU yürütme, uçtan uca çıkarım ve daha basit dağıtım etrafında tasarlanan modeli sayesinde, Vision AI'nın gerçek sistemlere entegre edilmesini pratik hale getirir. Bu uç öncelikli yaklaşım, performans ve öngörülebilirliğin en önemli olduğu robotik ve endüstriyel görmeden gömülü ve cihaz üzerinde AI'ya kadar geniş bir uygulama yelpazesini mümkün kılar.
Büyüyen topluluğumuza katılın ve uygulamalı yapay zeka kaynakları için GitHub depomuzu keşfedin. Vision AI ile bugün inşa etmek için lisanslama seçeneklerimizi keşfedin. Çözüm sayfalarımızı ziyaret ederek tarımda yapay zekanın çiftçiliği nasıl dönüştürdüğünü ve sağlık hizmetlerinde Vision AI 'ın geleceği nasıl şekillendirdiğini öğrenin.