Yolo Vision Shenzhen
Shenzhen
Şimdi katılın

Ultralytics : Kenar öncelikli Görsel Yapay Zeka için yeni standart

Ultralytics uçtan uçta, NMS çıkarım, daha hızlı CPU ve basitleştirilmiş üretim dağıtımı ile uç öncelikli Görsel Yapay Zeka için nasıl yeni bir standart belirlediğini öğrenin.

Ultralytics bugün, bugüne kadarki en gelişmiş ve uygulanabilir YOLO YOLO26'yı Ultralytics piyasaya sürdü. İlk olarak YOLO 2025 (YV25) etkinliğinde duyurulan YOLO26, bilgisayar görme modellerinin gerçek dünya sistemlerinde eğitilmesi, uygulanması ve ölçeklendirilmesinde temel bir değişimi temsil ediyor. 

Görsel yapay zeka hızla uç noktalara doğru ilerliyor. Görüntüler ve videolar giderek daha fazla cihazlar, kameralar, robotlar ve gömülü sistemlerde işleniyor. Bu sistemlerde gecikme süresi, güvenilirlik ve maliyet, ham bulut hesaplamasından daha önemli hale geliyor. YOLO26, bu gerçekliğe uygun olarak tasarlanmış olup, CPU'lar, uç hızlandırıcılar ve düşük güç tüketen donanımlarda verimli bir şekilde çalışırken dünya lideri bir performans sunuyor.

YOLO26 önemli bir ilerleme olsa da, yine de tanıdık, modern görünümünü koruyor. Ultralytics YOLO deneyimini sürdürmektedir. Mevcut iş akışlarına sorunsuz bir şekilde uyum sağlar, çok çeşitli görme görevlerini destekler ve kullanımı kolaydır, bu da hem araştırma hem de üretim ekipleri için benimsenmesini kolaylaştırır.

Nesne algılama için Ultralytics
Şekil 1. Nesne algılama için Ultralytics kullanımına bir örnek

Bu makalede, Ultralytics hakkında bilmeniz gereken her şeyi ve daha hafif, daha küçük ve daha hızlı YOLO görme yapay zekasının geleceği için ne anlama geldiğini ayrıntılı olarak ele alacağız. Hadi başlayalım!

Ultralytics , görsel yapay zeka için yeni bir standart belirliyor

Ultralytics , etkili görsel yapay zeka yeteneklerinin herkes için kolay erişilebilir olması gerektiği fikri üzerine kurulmuştur. Güçlü bilgisayar görme araçlarının kilitli tutulmaması veya küçük bir grup kuruluşla sınırlı kalmaması gerektiğine inanıyoruz.

Londra'daki YV25'te, Kurucumuz ve CEO'muz Glenn Jocher bu vizyonla ilgili düşüncelerini paylaşarak şöyle dedi: "En şaşırtıcı AI teknolojisi kapalı kapılar ardında. Açık değil. Büyük şirketler yeni gelişmeleri kontrol ediyor ve diğer herkes erişim için sıra beklemek zorunda. Ultralytics farklı bir vizyonumuz var. AI'nın herkesin elinde olmasını istiyoruz."

Ayrıca bunun, yapay zekayı buluttan çıkarıp gerçek dünya ortamlarına taşımak anlamına geldiğini açıklayarak, “Teknolojinin sadece bulutta kalmasını değil, uç cihazlara, telefonlarınıza, araçlarınıza ve düşük güç tüketen sistemlere de taşınmasını istiyoruz. Ve çözümler üreten bu harika insanların buna erişebilmesini istiyoruz” diye ekledi.

YOLO26, bu vizyonu pratikte yansıtıyor: prototip oluşturmanın en kolay olduğu yerde değil, görsel yapay zekanın gerçekten kullanıldığı yerde çalışmak üzere tasarlanmış bir model.

Ultralytics inceleyelim: Son teknoloji ürünü bir görme modeli

Önceki Ultralytics YOLO gibi, YOLO26 da tek bir birleşik model ailesi içinde birden fazla bilgisayar görme görevini destekler. Nano (n), Küçük (s), Orta (m), Büyük (l) ve Ekstra Büyük (x) olmak üzere beş boyutta mevcuttur ve ekipler, dağıtım kısıtlamalarına bağlı olarak hız, doğruluk ve model boyutu arasında denge kurabilirler.

Esnekliğin ötesinde, YOLO26 performans çıtasını yükseltiyor. YOLO11 ile karşılaştırıldığında, YOLO26 nano modeli %43'e kadar daha hızlı CPU sahip, bu da onu kenar ve CPU dağıtım için mevcut en hızlı yüksek doğruluklu nesne algılama modellerinden biri yapıyor.

Ultralytics YOLO26
Şekil 2. Ultralytics , son teknoloji ürünü bir görme modelidir.

YOLO26 tarafından desteklenen bilgisayar görme görevlerine daha yakından bakalım:

  • Görüntü sınıflandırma: YOLO26 , bir görüntünün tamamını analiz ederek onu belirli bir kategoriye atayabilir ve sistemlerin bir sahnenin genel bağlamını anlamasına yardımcı olur.
  • Nesne algılama: Model, görüntülerde veya videolarda birden fazla nesneyi bulabilir ve konumlarını belirleyebilir.
  • Örnek segmentasyonu: YOLO26 , piksel düzeyinde ayrıntılarla tek tek nesneleri özetleyebilir.
  • Poz tahmini: İnsanlar ve diğer nesneler için kilit noktaları belirlemek ve pozları tahmin etmek için kullanılabilir .
  • Yönlendirilmiş sınırlayıcı kutu (OBB) algılama: YOLO26 , farklı açılarda detect , bu da özellikle hava ve uydu görüntülerinde kullanışlıdır.
  • Nesne izleme: Ultralytics Python ile birlikte YOLO26, video kareleri ve canlı akışlar boyunca nesneleri takip etmek için kullanılabilir.

Tüm görevler, tutarlı bir çerçeve içinde eğitim, doğrulama, çıkarım ve dışa aktarmayı destekler.

Ultralytics arkasındaki temel yenilikler

Ultralytics , çıkarım hızını, eğitim kararlılığını ve dağıtım kolaylığını iyileştiren birkaç temel yenilik sunar. İşte bu yeniliklerin genel bir özeti:

  • Dağıtım Odak Kaybı (DFL) kaldırma: DFL modülü , sınırlayıcı kutu tahminini basitleştirmek, donanım uyumluluğunu iyileştirmek ve modellerin kenar ve düşük güçlü cihazlarda daha kolay dışa aktarılmasını ve çalıştırılmasını sağlamak için kaldırılmıştır.
  • Uçtan uca NMS çıkarım: YOLO26 , nihai tahminleri doğrudan çıktı olarak veren, Non-Maximum Suppression ihtiyacını ortadan kaldıran ve çıkarım gecikmesini ve dağıtım karmaşıklığını azaltan, yerel bir uçtan uca model olarak tasarlanmıştır.
  • Aşamalı Kayıp Dengeleme + STAL: Bu geliştirilmiş kayıp stratejileri, özellikle küçük,detect için eğitimi dengeler ve algılama doğruluğunu artırır.
  • MuSGD optimizer: YOLO26 , daha istikrarlı bir eğitim için SGD Muon'dan esinlenen optimizasyon tekniklerini birleştiren yeni bir hibrit optimizer kullanır.
  • %43'e kadar daha hızlı CPU : Kenar bilişim için özel olarak optimize edilmiş YOLO26, %43'e kadar daha hızlı CPU sunarak kenar cihazlarda gerçek zamanlı performans sağlar.

Şimdi, YOLO26'yı daha hızlı, daha verimli ve daha kolay uygulanabilir hale getiren bu yeni nesil özellikleri ayrıntılı olarak inceleyelim.

Dağıtım Odak Kaybı kaldırma yoluyla tahminleri basitleştirme

Önceki YOLO , sınırlayıcı kutu hassasiyetini artırmak için eğitim sırasında Dağıtım Odak Kaybı (DFL) kullanıyordu. Etkili olmasına rağmen, DFL ek karmaşıklık getiriyor ve özellikle uç ve düşük güçlü donanımlarda dışa aktarma ve dağıtımı daha zor hale getiren sabit regresyon sınırları uyguluyordu.

YOLO26, DFL'yi tamamen ortadan kaldırır. DFL'nin kaldırılması, önceki modellerde bulunan sabit sınırlayıcı kutu regresyon sınırlarını ortadan kaldırarak, çok büyük nesneleri algılama konusunda güvenilirliği ve doğruluğu artırır.

Sınırlayıcı kutu tahmin sürecini basitleştirerek, YOLO26'nın dışa aktarılması daha kolay hale gelir ve çok çeşitli kenar ve düşük güç tüketen cihazlarda daha güvenilir bir şekilde çalışır.

Ultralytics ile uçtan uca NMS çıkarım

Geleneksel nesne algılama süreçleri, çakışan tahminleri filtrelemek için son işlem adımı olarak Non-Maximum Suppression (NMS) yöntemini kullanır. Etkili olmasına rağmen, NMS özellikle birden fazla çalışma zamanı ve donanım hedefinde modellerin dağıtılması durumunda gecikme, karmaşıklık ve kırılganlık NMS .

YOLO26, modelin ayrı bir son işlem adımı NMS gerektirmeden doğrudan nihai tahminleri çıktıladığı yerel uçtan uca çıkarım modunu sunar. Yinelenen tahminler ağın kendi içinde işlenir.

NMS ortadan kaldırmak gecikmeyi NMS , dağıtım süreçlerini basitleştirir ve entegrasyon hataları riskini azaltır, bu da YOLO26'yı gerçek zamanlı ve uç dağıtımlar için özellikle uygun hale getirir.

Progressive Loss Balancing + STAL ile tanıma yeteneğini geliştirme

Eğitimle ilgili önemli bir özellik, Progressive Loss Balancing (ProgLoss) ve Small-Target-Aware Label Assignment (STAL) özelliklerinin eklenmesidir. Bu geliştirilmiş kayıp fonksiyonları, eğitimi stabilize etmeye ve algılama doğruluğunu artırmaya yardımcı olur.

ProgLoss, modelin eğitim sırasında daha tutarlı bir şekilde öğrenmesine yardımcı olur, kararsızlığı azaltır ve daha sorunsuz bir şekilde yakınsama sağlar. STAL ise, sınırlı görsel detaylar detect genellikle detect daha zor olan küçük nesnelerden modelin nasıl öğrendiğini iyileştirmeye odaklanır.

ProgLoss ve STAL birlikte, küçük nesnelerin tanınmasında belirgin iyileştirmeler sağlayarak daha güvenilir algılamalar sağlar. Bu, nesnelerin genellikle küçük, uzak veya kısmen görünür olduğu Nesnelerin İnterneti (IoT), robotik ve hava görüntüleme gibi uç uygulamalar için özellikle önemlidir.

MuSGD optimizer ile daha istikrarlı eğitim 

YOLO26 ile, eğitimi daha istikrarlı ve verimli hale getirmek için tasarlanmış MuSGD adlı yeni bir optimizasyon aracı kullandık. MuSGD, geleneksel Stokastik Gradyan İndirgeme (SGD) yönteminin güçlü yönlerini, büyük dil modeli (LLM) eğitiminde kullanılan Muon adlı optimizasyon aracından esinlenen tekniklerle birleştiren hibrit bir yaklaşımdır.

SGD , basitliği ve güçlü genelleme özelliği sayesinde uzun süredir bilgisayar görüşünde güvenilir bir seçim SGD . Aynı zamanda, LLM eğitimindeki son gelişmeler, yeni optimizasyon yöntemlerinin dikkatli bir şekilde uygulandığında kararlılığı ve hızı artırabileceğini göstermiştir. MuSGD, bu fikirlerin bir kısmını bilgisayar görüş alanına taşımaktadır.

Moonshot AI'nın Kimi K2'sinden esinlenen MuSGD, modelin eğitim sırasında daha sorunsuz bir şekilde yakınsama sağlamasına yardımcı olan optimizasyon stratejileri içerir. Bu, YOLO26'nın özellikle daha büyük veya daha karmaşık eğitim kurulumlarında eğitim istikrarsızlığını azaltırken daha hızlı bir şekilde güçlü performansa ulaşmasını mümkün kılar.

MuSGD, YOLO26'nın model boyutları arasında daha öngörülebilir bir şekilde eğitim almasına yardımcı olarak hem performans artışına hem de eğitim istikrarına katkıda bulunur.

Ultralytics , CPU %43'e varan hız artışı sağlar.

Görsel yapay zeka, verilerin üretildiği yere giderek yaklaşırken, güçlü kenar performansı giderek daha önemli hale geliyor. Kenar bilişim için özel olarak optimize edilmiş YOLO26, CPU %43'e kadar hızlandırarak GPU'su olmayan cihazlarda gerçek zamanlı performans sağlar. Bu iyileştirme, gecikme, verimlilik ve maliyet kısıtlamalarının mümkün olanı belirlediği kameralar, robotlar ve gömülü donanımlarda duyarlı, güvenilir görsel sistemlerin doğrudan çalışmasını sağlar.

Ultralytics tarafından desteklenen gelişmiş bilgisayar görme görevleri

Nesne algılamayı daha doğru hale getiren mimari iyileştirmelerin ötesinde, YOLO26 ayrıca bilgisayar görme görevlerinde performansı artırmak için tasarlanmış göreve özel optimizasyonlar da içerir. Örneğin, doğruluk ve güvenilirliği artıran hedefli güncellemelerle örnek segmentasyonu, poz tahmini ve yönlendirilmiş sınırlayıcı kutu algılamayı geliştirir.

İşte bu optimizasyonların genel bir özeti:

  • Örnek segmentasyonu: YOLO26 , modelin eğitim sırasında öğrenme sürecini iyileştirmek için semantik segmentasyon kaybını kullanır, bu da daha doğru ve tutarlı örnek maskeleri sağlar. Yükseltilmiş proto modülü, birden fazla ölçekten gelen bilgilerin kullanımını da mümkün kılar, böylece model karmaşık sahnelerde bile farklı boyutlardaki nesneleri daha etkili bir şekilde işleyebilir.
  • Poz tahmini: Anahtar nokta tahminlerindeki belirsizliği modelleyen bir teknik olan Artık Log-Olasılık Tahmini (RLE) entegre edilerek ve kod çözme süreci iyileştirilerek, YOLO26 daha doğru anahtar noktalar ve daha iyi gerçek zamanlı performans sunar.
  • Yönelimli sınırlayıcı kutu algılama: YOLO26 , modelin nesne dönüşünü daha doğru bir şekilde öğrenmesine yardımcı olan özel bir açı kaybı özelliği sunar. Bu özellik, özellikle yönelim belirsiz olabilen kare şekilli nesneler için kullanışlıdır. Optimize edilmiş OBB kod çözme özelliği, dönüş sınırları yakınındaki açı tahminlerindeki ani sıçramaları da azaltarak daha istikrarlı ve tutarlı yönelim tahminleri sağlar.
Örnek segmentasyonu için Ultralytics kullanımı.
Şekil 3. Örnek segmentasyonu için Ultralytics kullanımı.

Ultralytics : YOLO26 üzerine kurulu açık sözlük segmentasyonu

Ultralytics ayrıca, YOLO26'nın mimarisi ve eğitim yenilikleri üzerine inşa edilmiş yeni bir açık sözlük segmentasyon modelleri ailesi olan YOLOE-26'yı Ultralytics .

YOLOE-26 yeni bir görev veya özellik değil, mevcut segmentasyon görevini yeniden kullanırken metin komutları, görsel komutlar ve komutsuz çıkarımları mümkün kılan özel bir model ailesidir. Tüm standart YOLO kullanılabilen YOLOE-26, önceki açık sözlük segmentasyon modellerine göre daha yüksek doğruluk ve daha güvenilir gerçek dünya performansı sunar.

Ultralytics , Vision AI'nın gerçekte çalıştığı yerler için tasarlanmıştır.

Görsel tabanlı kameralardan bilgisayar görüşü ve uçtaki küçük işlemci yongalarıyla çalışan robotlara kadar, bilgisayar görüşü ve yapay zeka, gerçek zamanlı çıkarım için doğrudan cihaz üzerinde kullanılıyor. Ultralytics , düşük gecikme süresi, verimlilik ve güvenilir performansın hayati önem taşıdığı bu ortamlar için özel olarak geliştirilmiştir.

Uygulamada bu, YOLO26'nın çok çeşitli donanımlarda kolayca kullanılabileceği anlamına gelir. Özellikle, Ultralytics Python ve geniş entegrasyon yelpazesi sayesinde, modeller farklı platformlar ve donanım hızlandırıcıları için optimize edilmiş formatlara aktarılabilir.

Örneğin, TensorRT dışa aktarma, NVIDIA yüksek performanslı çıkarım TensorRT , CoreML Apple cihazlarda yerel dağıtımı CoreML ve OpenVINO Intel performansı OpenVINO . YOLO26, birden fazla özel kenar hızlandırıcısında çalışmak üzere dışa aktarılabilir ve böylece özel Edge AI donanımında yüksek verimli, enerji tasarruflu çıkarım sağlar. 

Bunlar sadece birkaç örnektir; kenar ve üretim ortamlarında çok daha fazla entegrasyon desteklenmektedir. Bu esneklik, tek bir YOLO26 modelinin çeşitli dağıtım hedeflerinde çalışmasını sağlar. Üretim iş akışlarını kolaylaştırır ve Vision AI'yı kenara daha da yaklaştırır.

Endüstriler genelinde bilgisayar görme kullanım örneklerini yeniden tanımlama

Gerçek dünya uygulamaları için tasarlanan YOLO26, farklı sektörlerdeki çok çeşitli bilgisayar görme kullanım alanlarında kullanılabilir. İşte uygulanabileceği bazı örnekler:

  • Robotik: YOLO26, navigasyon, engel algılama ve nesne etkileşimi gibi görevler için kullanılabilir. Bu yetenekler, dinamik ortamlarda güvenli ve etkili robotik operasyonları destekler.
  • Üretim: Üretim hatlarında YOLO26, görüntüleri ve videoları analiz ederek kusurları, eksik bileşenleri veya süreç sorunlarını tespit edebilir. Verilerin cihaz üzerinde işlenmesi, algılamanın hızlı olmasını sağlar ve bulut sistemlerine bağımlılığı azaltır.
  • Hava ve drone uygulamaları: Drone'lara yerleştirildiğinde, YOLO26 uçuş sırasında hava görüntülerini inceleme, haritalama ve ölçümleme amacıyla işleyebilir. Bu sayede, uzak konumlarda bile sahneleri gerçek zamanlı olarak analiz etmek mümkün hale gelir.
  • Gömülü ve IoT sistemleri: Hafif tasarımıyla YOLO26, düşük güç tüketen gömülü donanımlarda çalışarak görsel verileri yerel olarak işleyebilir. Yaygın kullanım alanları arasında akıllı kameralar, bağlı sensörler ve otomatik izleme cihazları bulunur.

Akıllı şehirler: YOLO26, kentsel ortamlarda trafik ve kamusal alan kameralarından gelen video akışlarını analiz edebilir. Bu, trafik izleme, kamu güvenliği ve altyapı yönetimi gibi uygulamaların uçta gerçekleştirilmesini sağlar.

YOLO26, çeşitli bilgisayar görme uygulamaları için kullanılabilir.
Şekil 4. YOLO26, çeşitli bilgisayar görme uygulamaları için kullanılabilir.

Ultralytics ile başlangıç

Ultralytics , görsel yapay zeka sistemini nasıl oluşturduğunuz ve uyguladığınıza bağlı olarak iki tamamlayıcı iş akışı aracılığıyla kullanılabilir.

Seçenek 1: Ultralytics üzerinden Ultralytics kullanın (önerilir)

Ultralytics , üretimde YOLO26 modellerini eğitmek, dağıtmak ve izlemek için merkezi bir yol sağlar. Veri kümelerini, deneyleri ve dağıtımları tek bir yerde bir araya getirerek, özellikle uç ve üretim ortamlarına dağıtım yapan ekipler için, büyük ölçekte görsel yapay zeka iş akışlarını yönetmeyi kolaylaştırır.

Platform aracılığıyla kullanıcılar şunları yapabilir:

  • YOLO26 modellerine erişin
  • Özel veri kümeleri üzerinde eğitim ve ince ayar yapın
  • Kenar ve üretim dağıtımı için modelleri dışa aktarın
  • Tek bir iş akışında deneyleri ve uygulanan modelleri izleyin

👉 Ultralytics YOLO26'yı keşfedin: platform.ultralytics.ultralytics

Seçenek 2: Açık kaynaklı iş akışları aracılığıyla Ultralytics kullanın

YOLO26, Ultralyticsaçık kaynak ekosistemi aracılığıyla tamamen erişilebilir olmaya devam eder ve eğitim, çıkarım ve dışa aktarım için mevcut Python iş akışlarıyla kullanılabilir.

Geliştiriciler Ultralytics yükleyebilir, önceden eğitilmiş YOLO26 modellerini yükleyebilir ve ONNX, TensorRT, CoreML veya OpenVINO gibi tanıdık araçlar ve formatlar kullanarak bunları dağıtabilir.

pip install ultralytics
from ultralytics import YOLO

# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Run inference with the YOLO26n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")

Elle kontrol veya özel boru hatlarını tercih eden kullanıcılar için, Ultralytics eksiksiz dokümantasyon ve kılavuzlar mevcuttur.

Ultralytics : Bilgisayar görüşünde gelecek için tasarlandı

Ultralytics , modellerin hızlı, verimli ve gerçek donanım üzerinde kolayca uygulanabilmesi gereken yarının görsel yapay zeka çözümlerinin ihtiyaçlarını karşılamak üzere tasarlanmıştır. Performansı artırarak, uygulamayı basitleştirerek ve modelin yapabileceklerini genişleterek, YOLO26 çok çeşitli gerçek dünya uygulamalarına doğal bir şekilde uyum sağlar. YOLO26, görsel yapay zekanın nasıl oluşturulacağı, uygulanacağı ve ölçeklendirileceği konusunda yeni bir temel oluşturur. Topluluğun bunu gerçek dünya bilgisayar görme sistemlerini sunmak için nasıl kullandığını görmekten heyecan duyuyoruz.

Büyüyen topluluğumuza katılın ve uygulamalı yapay zeka kaynakları için GitHub depomuzu keşfedin. Vision AI ile bugün inşa etmek için lisanslama seçeneklerimizi keşfedin. Çözüm sayfalarımızı ziyaret ederek tarımda yapay zekanın çiftçiliği nasıl dönüştürdüğünü ve robotikte Vision AI 'ın geleceği nasıl şekillendirdiğini öğrenin.

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın