Anlık sıkıştırmanın yapay zeka verimliliğini nasıl optimize ettiğini keşfedin. Ultralytics ile bugün büyük dil modellerinin (LLM) token kullanımını azaltmayı, maliyetleri düşürmeyi ve çıkarım hızını artırmayı öğrenin.
Komut satırı sıkıştırması, Büyük Dil Modelleri (LLM’ler) ve çok modlu modellere sunulan girdi metninin uzunluğunu ve karmaşıklığını azaltmak üzere tasarlanmış gelişmiş bir optimizasyon tekniğidir. Temel anlamsal anlamı korurken gereksiz kelimeleri, alakasız bağlamı ve durdurma kelimelerini algoritmik olarak ortadan kaldıran komut satırı sıkıştırması, AI sistemlerinin bilgileri daha verimli bir şekilde işlemesine olanak tanır. Bu yöntem, hesaplama maliyetlerini en aza indirmek, çıkarım gecikmesini azaltmak ve modellerin maksimum bağlam penceresini aşmasını önlemek için giderek daha kritik hale gelmektedir.
Mimari düzeyde, komut satırı sıkıştırması genellikle daha küçük, özel amaçlı modeller veya bilgi teorisi algoritmaları kullanarak belirli bir komut satırındaki her bir belirtecin önemini değerlendirir. Belirteç birleştirme ve entropi tabanlı budama gibi teknikler, genel anlama çok az katkı sağlayan belirteçleri tespit edip kaldırır. Bu sayede, nihai girdinin yalnızca en yoğun şekilde sıkıştırılmış bilgileri içermesi sağlanır.
Saygın kuruluşların son araştırmaları, yüksek oranda sıkıştırılmış komut satırlarının, karmaşık akıl yürütme görevlerinde performansı korurken token tüketimini önemli ölçüde azalttığını ortaya koymaktadır. Yapay zekayı ölçeklenebilir uygulamalara entegre eden geliştiriciler için, OpenAI’nin komut satırı optimizasyon kılavuzlarına uymak ve sıkıştırma çerçevelerinden yararlanmak, verimli bir şekilde devreye alma için standart bir en iyi uygulamadır.
Hızlı sıkıştırma, büyük miktarda metin veya görsel verinin hızlı bir şekilde işlenmesi gereken durumlarda anında fayda sağlar:
Sağlam makine öğrenimi operasyonları (MLOps) iş akışları oluşturmak için, komut satırı sıkıştırmasını ilgili kavramlardan ayırmak önemlidir:
Bilgisayar Görme (CV) alanında, nesneleri tanımlamak için metin sorguları kabul eden açık sözlük modelleri kullanılırken hızlı sıkıştırma ilkeleri geçerlidir. Sınıf tanımlarını kısa ve öz tutmak, metin kodlamasının daha hızlı yapılmasını sağlar ve bellek yükünü azaltır.
Hızın öncelikli olduğu sabit sınıflı üretim ortamlarında, geliştiriciler genellikle metin tabanlı modellerden Ultralytics gibi son derece optimize edilmiş, sabit mimarili modellere geçiş yaparlar. Ultralytics kullanarak veri kümelerini verimli bir şekilde yönetebilir ve bu son teknoloji modelleri eğitebilirsiniz.
from ultralytics import YOLO
# Load an open-vocabulary YOLO-World model
model = YOLO("yolov8s-world.pt")
# Principle of prompt compression: Use concise, distilled class names
# instead of lengthy, complex descriptions for faster text encoding
compressed_prompts = ["helmet", "vest", "forklift"]
model.set_classes(compressed_prompts)
# Run inference with the optimized class list
results = model.predict("https://ultralytics.com/images/bus.jpg")
results[0].show()
Makine öğreniminin geleceği ile yolculuğunuza başlayın