"Tüm Çerezleri Kabul Et" seçeneğine tıklayarak, sitede gezinmeyi geliştirmek, site kullanımını analiz etmek ve pazarlama çabalarımıza yardımcı olmak için cihazınızda çerezlerin saklanmasını kabul edersiniz. Daha fazla bilgi
Çerez Ayarları
"Tüm Çerezleri Kabul Et" seçeneğine tıklayarak, sitede gezinmeyi geliştirmek, site kullanımını analiz etmek ve pazarlama çabalarımıza yardımcı olmak için cihazınızda çerezlerin saklanmasını kabul edersiniz. Daha fazla bilgi
Ultralytics 'nda, paylaşımlı çıkarım yerine ölçeklenebilir ve düşük gecikmeli görsel yapay zeka dağıtımı için ne zaman özel çıkarım uç noktalarını tercih etmeniz gerektiğini keşfedin.
Ultralytics ile bilgisayar görme projelerinizi ölçeklendirin
Kısa bir süre önce, veri kümesi hazırlama ve model eğitiminin yanı sıra çıkarım, devreye alma ve izleme süreçlerine kadar bilgisayar görme iş akışının tamamını tek bir çatı altında toplayan uçtan uca bir çözüm olan Ultralytics tanıttık.
Bilgisayar görme topluluğundan gelen geri bildirimler temel alınarak geliştirilen bu platform, görsel yapay zeka uygulamalarının tüm yaşam döngüsünü destekleyen entegre özellikler sunarak geliştirme sürecinin her aşamasını kolaylaştırmak üzere tasarlanmıştır.
Örneğin, bir model eğitildikten sonra, bir sonraki adım onu devreye almak ve böylece gerçek dünya uygulamalarında çıkarımlar yürütmek ve tahminlerde bulunmak için kullanılabilmesini sağlamaktır. Platform, çeşitli devreye alma seçenekleri sunarak bu süreci oldukça kolay hale getirir.
Modelleri kendi ortamınızda çalıştırmak üzere dışa aktarabilir, hızlı testler için paylaşımlı çıkarım özelliğini kullanabilir veya ölçeklenebilir, üretime hazır uygulamalar için özel uç noktalar dağıtabilirsiniz. Bu dağıtım seçeneklerinin her biri yapay zeka çıkarımını çalıştırmanıza olanak tanır, ancak farklı aşamalar ve kullanım senaryoları için tasarlanmıştır.
Şekil 1. Ultralytics , ölçeklenebilir küresel görsel yapay zeka modeli dağıtımını mümkün kılar (Kaynak)
Model dışa aktarma özelliği, modelleri kendi altyapınızda çalıştırma konusunda size tam kontrol sağlar; paylaşımlı çıkarım özelliği, kurulum gerektirmeden test ve denemeler yapmanızı kolaylaştırır; özel uç noktalar ise güvenilir, büyük ölçekli üretim iş yükleri için tasarlanmıştır.
İlk bakışta, paylaşımlı çıkarım ve özel uç noktalar birbirine oldukça benziyor gibi görünebilir. Her ikisi de modelinize API istekleri göndermenize ve yapılandırılmış tahminler almanıza olanak tanıyarak, görsel yapay zekayı uygulamalara entegre etmeyi kolaylaştırır.
Ancak, iş yükleriniz arttıkça ve bilgisayar görme uygulamalarınız gerçek zamanlı çıkarım isteklerini işlemeye başladıkça, bu seçenekler arasındaki farklar daha da önem kazanır. Bu makalede, paylaşımlı çıkarım ve özel uç noktaları, bunların karşılaştırmasını, her birinin ne zaman kullanılması gerektiğini ve uygulamalarınız büyüdükçe özel uç noktalarının neden daha iyi bir seçim haline geldiğini daha yakından inceleyeceğiz.
Paylaşılan çıkarımları kullanarak dağıtımın genel bir bakışı
Paylaşımlı çıkarım, herhangi bir altyapı kurmaya gerek kalmadan veya GPU , çerçeve entegrasyonu ya da çalışma zamanı yapılandırması konusunda endişelenmeden modelleriniz üzerinde yapay zeka çıkarımını çalıştırmanın basit bir yoludur. Modeliniz eğitildikten veya ince ayarlandıktan sonra, onu platform üzerinden doğrudan tahminlerde bulunmak için kullanabilirsiniz.
Bu yapılandırmada, modeliniz ABD, Avrupa ve Asya-Pasifik gibi birkaç temel bölgedeki paylaşımlı, çoklu kiracılı bilgi işlem kaynakları üzerinde çalışır. İstekler otomatik olarak kullanılabilir hizmetlere yönlendirilir; bu sayede GPU veya çalışma zamanı ortamlarını yapılandırmanıza gerek kalmaz. Her şey sizin adınıza halledilir, böylece işe başlamak çok kolaylaşır.
Paylaşımlı çıkarım özelliğini kullandığınızda, Python CLI gibi araçlar REST API bir REST API üzerinden modelinize istekler gönderir ve algılanan nesneler, güvenlilik puanları ve diğer tahmin ayrıntıları gibi yapılandırılmış JSON çıktıları alırsınız. Bu sayede modelleri test etmek ve uygulamalara entegre etmek son derece kolay hale gelir.
Sistem paylaşımlı olduğu için geliştirme, test ve hafif kullanım amaçlı tasarlanmıştır. Tahminlerin doğrulanması ve erken aşamadaki entegrasyonların oluşturulması için oldukça uygundur. Bununla birlikte, performans sistem yüküne bağlı olarak değişebilir ve kullanım, API anahtarı başına dakikada 20 istekle sınırlandırılmıştır; bu nedenle yüksek verimli üretim iş yükleri için daha az uygundur.
Genel olarak, paylaşımlı çıkarım, daha büyük ölçekli uygulamalara geçmeden önce modeli anlamaya ve geliştirmeye odaklanılan erken aşama geliştirme süreçleri için en uygun seçenektir.
Özel uç noktalar kullanarak modelleri küresel olarak dağıtın
Özel uç noktalar, görsel AI modellerinizin izole edilmiş bilgi işlem kaynakları üzerinde çalıştığı tek kiracılı çıkarım hizmetleridir. Altyapıyı paylaşmak yerine, her uç nokta CPU bellek gibi yapılandırılabilir kaynaklara sahip kendi çalışma ortamına sahiptir; bu da size performans üzerinde daha fazla kontrol sağlar.
Bir modeli özel bir uç nokta olarak dağıttığınızda, modele benzersiz bir API URL'si atanır ve kimlik doğrulama için API anahtarınız kullanılır; bu da uygulamalara entegrasyonu kolaylaştırır. Bu uç noktalar 43 küresel bölgede dağıtılabilir; böylece çıkarım işlemlerini kullanıcılarınıza daha yakın bir yerde çalıştırabilir ve gecikmeyi azaltabilirsiniz.
Şekil 2. 43 küresel bölgede özel uç noktalar kurabilirsiniz (Kaynak)
En önemli avantajlardan biri otomatik ölçeklendirmedir. Uç noktalar, gelen istekler doğrultusunda otomatik olarak ayarlanır; trafik yoğunlaştığında kapasiteyi artırır, talep azaldığında ise azaltır. Varsayılan olarak etkinleştirilmiş olan "sıfıra ölçeklendirme" özelliği sayesinde, uç noktalar atıl durumdayken kapatılabilir ve gerektiğinde yeniden başlatılabilir; bu da kaynak kullanımının optimize edilmesine yardımcı olur.
Başka bir deyişle, özel uç noktalar üretim iş yükleri için tasarlanmıştır. Paylaşımlı çıkarım yöntemine kıyasla tutarlı bir şekilde düşük gecikme süresi, daha yüksek verim ve daha fazla güvenilirlik sunarlar.
Ayrıca, özel uç noktalar için trafik sınırlaması yoktur. İstekler doğrudan uç noktanıza gönderilir; bu nedenle, ne kadar trafik işleyebileceğiniz sabit sınırlardan ziyade kurulumunuza ve ölçeklendirmenize bağlıdır.
Bunun yanı sıra, yerleşik izleme, günlükler, durum kontrolleri ve öngörülebilir çalışma zamanı ile başlatma davranışları sayesinde, tüm planlarda track ve istikrarlı dağıtımlar sağlamak oldukça kolaydır. Ücretsiz planda, soğuk başlatmalar genellikle 5 ila 45 saniye sürerken, Pro planındaki uç noktalar sıcak kalır ve bu da daha hızlı ve öngörülebilir bir çıkarım performansı sağlar.
Basitçe söylemek gerekirse, özel uç cihazlar, güvenilir, ölçeklenebilir ve yüksek performanslı çıkarım gerektiren gerçek zamanlı görüntü işleme yapay zeka uygulamaları için idealdir.
Paylaşımlı çıkarım ve özel uç noktalar: Temel farklar
İşte paylaşımlı çıkarım ile özel uç noktaların karşılaştırmasına daha yakından bir bakış:
Gecikme: Kaynak paylaşımı nedeniyle paylaşımlı ortamlarda gecikme süresi değişiklik gösterebilir; buna karşın, özel uç noktalar daha tutarlı ve düşük gecikmeli yanıtlar sunar.
Bölgeler: Paylaşımlı çıkarım özelliği yalnızca birkaç bölgede (ABD, AB, AP) kullanılabilirken, özel uç noktalar 43 küresel bölgede dağıtımı desteklemektedir.
Ölçeklenebilirlik: Paylaşımlı çıkarımda ölçeklendirme yapılandırılamazken, özel uç noktalar gelen trafiğe göre otomatik olarak ölçeklenir.
Hız Sınırları: Paylaşımlı çıkarımda hız sınırlaması uygulanır (API anahtarı başına dakikada 20 istek veya API çağrısı), buna karşın özel uç noktalarda platform hız sınırlaması yoktur.
Fiyatlandırma: Test ve geliştirme amaçlı kullanımda paylaşımlı çıkarım özelliği ek ücret ödemeden dahildir; buna karşılık, özel uç noktalar daha fazla kontrol ve ölçeklenebilirlik sunar; kullanım ise kaynak yapılandırmasına ve dağıtım ihtiyaçlarına bağlıdır.
Neden özel uç noktalar üretim ortamındaki iş yükleri için daha iyidir?
Yapay zeka ve makine öğrenimi uygulamaları test aşamasından gerçek dünyadaki kullanıma geçerken, performans, ölçeklenebilirlik ve güvenilirlik hayati önem kazanıyor. Bu nedenle, özel uç cihazlar, paylaşımlı çıkarım yöntemine kıyasla belirgin avantajlar sunuyor.
Özel uç noktalar sayesinde, önceden eğitilmiş veya özel modeliniz kendi bilgi işlem kaynaklarında çalışır; böylece performans diğer kullanıcılar tarafından etkilenmez. Bu, gecikme süresinin düşük ve tutarlı kalmasına yardımcı olur; bu da video analizi ve izleme sistemleri gibi gerçek zamanlı uygulamalar için önemlidir.
Şekil 3. Özel bir çıkarım uç noktası kullanarak dağıtım sürecine genel bir bakış (Kaynak)
Örneğin, birden fazla mağazadan gelen canlı kamera görüntülerini işleyen bir perakende analiz sistemini düşünün. 43 farklı bölgede uç cihazlar kurularak, çıkarım işlemleri her mağazaya daha yakın bir yerde yürütülebilir; böylece gecikme süresi azalır ve yanıt süreleri iyileşir.
Kaynakların paylaşıldığı ve bölgelerin sınırlı olduğu ortak çıkarım ortamında, yoğun dönemlerde performans değişiklik gösterebilir.
Özel uç noktalar ayrıca daha yüksek trafik hacmini kaldırabilir ve talebe göre otomatik olarak ölçeklenebilir. Yerleşik izleme, günlük kaydı ve durum denetimleri sayesinde daha öngörülebilir bir performans sunarlar; bu da onları büyük ölçekli ve kesintisiz yapay zeka iş yükleri için ideal bir seçenek haline getirir.
Ortak çıkarımın görsel yapay zeka iş akışındaki yeri
Paylaşımlı çıkarım ile özel uç noktalar arasındaki farkları incelerken, paylaşımlı çıkarımın genel bilgisayar görme iş akışında hangi aşamada yer aldığını merak ediyor olabilirsiniz.
Perakende analitiği örneğine bir kez daha göz atalım. Bir görüntü işleme çözümünü birden fazla mağazada kullanıma sunmadan önce, ekipler genellikle bu çözümün gerçek veriler üzerinde nasıl çalıştığını test etmek ve elde edilen sonuçlara göre iyileştirmeler yapmak zorundadır.
Paylaşımlı çıkarım, mağaza kameralarından örnek görüntüler veya video kareleri göndermenize ve altyapı kurmaya gerek kalmadan tahminleri hızla incelemenize olanak tanıyarak bu süreci basitleştirir. Bu özellik, model davranışını test etmek, hatalı tahminleri gidermek ve aydınlatma veya mağaza düzenindeki değişiklikler gibi farklı koşullar altında sonuçları doğrulamak için özellikle yararlıdır.
Bu şekilde yineleme yaparak, ekipler modeli üretime geçmeden önce modelin doğruluğunu ve güvenilirliğini artırabilirler. Model bu test senaryolarında iyi performans gösterdiğinde, birden fazla konumda gerçek zamanlı kullanım için özel uç noktalara dağıtılabilir.
Paylaşımlı çıkarım, kullanım sıklığı düşük veya seyrek olan uygulamalar için de etkili bir çözüm olabilir. Örneğin, küçük bir perakende mağaza, tam ölçekli bir kurulum gerektirmeden, zaman zaman mağaza trafiğini analiz etmek veya belirli saatlerdeki müşteri hareketlerini incelemek için bu yöntemi kullanabilir. Bu tür durumlarda, talep üzerine çıkarım işlemi gerçekleştirmek için basit ve uygun maliyetli bir yol sunar.
Özel uç noktaların gerçek hayattaki kullanım örnekleri
Yapay zeka uygulamaları test aşamasını geride bıraktıkça, dağıtım seçimi performans, ölçeklenebilirlik ve kullanıcı deneyimini doğrudan etkilemeye başlıyor. Özel uç noktalar, istikrarlı performans, düşük gecikme süresi ve büyük ölçekli iş yüklerini yönetme yeteneği sundukları için çeşitli sektörlerde yaygın olarak kullanılabilir.
İşte özel uç noktaların gerçek hayattaki uygulamalarda nasıl kullanılabileceğini gösteren bazı yaygın kullanım örnekleri:
Perakende ve video analitiği: Bir perakende zinciri, bilgisayar görüşünü kullanarak track hareketlerini track edebilir, popüler ürünleri belirleyebilir ve mağaza faaliyetlerini gerçek zamanlı olarak izleyebilir. Özel uç noktalar, yoğun saatlerde bile birçok mağaza konumunda çıkarımların hızlı ve tutarlı olmasını sağlar.
Üretim ve kalite denetimi: Üretim hattında, modeller ürünler sistemden geçerken detect veya anormallikleri detect edebilir. Özel uç cihazlar, kesintisiz ve gerçek zamanlı çıkarımları destekleyerek ekiplerin sorunları erken tespit etmesine ve operasyonları yavaşlatmadan ürün kalitesini korumasına yardımcı olur.
Sağlık Hizmetleri ve tıbbi görüntüleme: Sağlık hizmeti sağlayıcıları ve tanı laboratuvarları, röntgen veya tarama gibi tıbbi görüntüleri analiz etmek için görüntü işleme modellerine güvenebilir. Özel uç cihazlar, hassas verilerin işlenmesi ve zamanın kritik öneme sahip olduğu teşhislerde hayati önem taşıyan güvenilir ve tutarlı bir performans sunar.
Depo ve lojistik otomasyonu: Büyük depolar genellikle konveyör bantları ve ayırma hatları gibi birbirinin aynısı olan çok sayıda sistemi çalıştırır; bu sistemler, aynı kurulumun kopyaları gibi işlev görür. Bilgisayarlı görme modelleri, her bir kopyayı izleyerek sıkışmalar veya yanlış yönlendirilmiş paketler gibi detect edebilir. Özel uç cihazlar, tüm kopyalarda gerçek zamanlı olarak tutarlı bir şekilde çıkarım yapılmasını sağlar.
Paylaşımlı çıkarımdan özel uç noktalara geçiş
Ultralytics nun en önemli avantajlarından biri, uygulamanız büyüdükçe paylaşımlı çıkarımdan özel uç noktalara geçişin ne kadar kolay olmasıdır. Araçları değiştirmek veya kurulumunuzu yeniden oluşturmak yerine, aynı ortam içinde üretime hazır bir dağıtıma geçebilirsiniz.
Modelinizi paylaşımlı çıkarım ile test ettikten sonra, özel bir uç noktaya geçmek oldukça basit bir adımdır. Aynı modeli bir uç noktaya dağıtabilir, tercih ettiğiniz bölgeyi ve hesaplama kaynaklarını seçebilir ve uygulamanızdaki uç nokta URL’sini güncelleyebilirsiniz. Genel entegrasyon süreci benzer kalır; bu nedenle istek gönderme veya yanıtları işleme şeklinizde neredeyse hiçbir değişiklik olmaz.
Şekil 4. Ultralytics özel bir uç nokta URL'sini görüntüleme (Kaynak)
Bu sayede, birkaç tıklamayla test ortamından üretim ortamına geçiş yapabilirsiniz. İş yükünüz arttıkça veya uygulamanızın daha istikrarlı bir performans gerektirdiği durumlarda, mevcut iş akışınızı kesintiye uğratmadan özel uç noktalara geçebilirsiniz.
Ultralytics 'nda özel uç noktalar kullanarak modelleri devreye alma hakkında daha fazla bilgi edinmek için Ultralytics resmi belgelerine göz atın.
Önemli çıkarımlar
Paylaşımlı çıkarım, test ve denemeler için harika bir başlangıç noktasıdır; ancak üretim ortamındaki iş yükleri daha fazla tutarlılık ve ölçeklenebilirlik gerektirir. Uygulamalar büyüdükçe, özel uç noktalar gerçek dünya kullanımını desteklemek için gereken performansı ve güvenilirliği sağlar. Bu da onları çoğu üretim dağıtımı için en iyi seçenek haline getirir.