YOLO26 ile tanış: yeni nesil görsel AI.
Ultralytics
Ultralytics Sözlüğüne dön

SigLIP

Vizyon-dil modelleri için bellek açısından verimli sigmoid kayıp yaklaşımı olan SigLIP'i keşfet. Bunun Ultralytics YOLO projeleri için ölçeklendirmeyi ve eğitimi nasıl iyileştirdiğini öğren.

Sigmoid Loss for Language Image Pre-Training anlamına gelen SigLIP, görüntü-dil modellerini eğitmek için oldukça verimli bir yaklaşımdır. İlk olarak Google Research araştırmacıları tarafından tanıtılan bu yöntem, yapay zeka modellerinin görüntüler ile bunlara karşılık gelen metin açıklamaları arasındaki ilişkiyi öğrenme biçimini temelden değiştirmektedir. Geleneksel olasılık fonksiyonlarını daha basit bir ikili sınıflandırma yaklaşımıyla değiştiren SigLIP, geliştiricilerin devasa çok modlu mimarileri önemli ölçüde daha az bellek yükü ve daha yüksek hesaplama verimliliğiyle eğitmesine olanak tanır.

Link to this sectionMimarinin Anlaşılması#

Görsel ve metinsel verileri eşleştiren standart makine öğrenimi süreçlerinde modeller, doğru öğrenme için genellikle belirli bir yığındaki (batch) tüm verilerin genel bir görünümüne güvenirler. SigLIP, her görüntü-metin çiftini bağımsız bir ikili sınıflandırma problemi olarak ele alarak bu darboğazı ortadan kaldırır. Standart bir sigmoid fonksiyonu kullanarak model, sadece belirli bir görüntü ve metin açıklamasının eşleşip eşleşmediğini tahmin eder.

Kayıp fonksiyonuna yönelik bu yerelleştirilmiş yaklaşım, model eğitimi sırasında gereken belleğin karesel değil, doğrusal bir şekilde ölçeklenmesi anlamına gelir. Sonuç olarak mühendisler, PyTorch gibi çerçeveler tarafından desteklenen standart donanım yapılandırmalarında çok daha büyük yığın boyutlarından yararlanabilir ve bu da GPU kaynaklarında üstel artışlara gerek kalmadan çeşitli veri setlerinde daha iyi performans elde edilmesini sağlar.

Link to this sectionSigLIP'i CLIP'ten ayıran özellikler#

Modern yapay zeka mimarilerini keşfederken, SigLIP'i selefi olan CLIP (Contrastive Language-Image Pre-training) modelinden ayırt etmek çok önemlidir.

  • CLIP: Modelin bir görüntüyü yığın içindeki tüm metin açıklamalarıyla aynı anda karşılaştırmasını gerektiren bir softmax kayıp fonksiyonuna dayanır. Bu durum, yığın boyutları arttıkça derin öğrenme eğitimi sırasında ciddi bir bellek darboğazı yaratır.
  • SigLIP: İkili sigmoid kayıp fonksiyonunu kullanır. Yalnızca tek bir görüntü-metin çiftinin doğru bir eşleşme olup olmadığını değerlendirmesi gerekir; bu da onu oldukça ölçeklenebilir kılar ve yapay zeka iş akışlarını optimize ederken birden fazla cihaza dağıtılmasını kolaylaştırır.

Link to this sectionGerçek Dünya Uygulamaları#

SigLIP'in bellek dostu tasarımı, onu teknoloji endüstrisindeki çeşitli pratik uygulamalar için güçlü bir temel haline getirir:

  • Sıfır Örnekli Görüntü Sınıflandırma: SigLIP, görüntüleri eğitim sırasında hiç açıkça görmediği yeni sınıflara ayırma konusunda mükemmeldir. Bu, kategorilerin sık sık değiştiği dinamik görüntü sınıflandırma sistemleri için son derece kullanışlıdır ve sürekli manuel veri etiketleme ihtiyacını ortadan kaldırır.
  • Anlamsal Arama Motorları: Oldukça doğru çok modlu gömmeler (embeddings) üreterek, SigLIP gelişmiş geri alma sistemlerine güç verir. Kullanıcılar, devasa ve yapılandırılmamış görüntü veritabanlarında yüksek hassasiyetle arama yapmak için karmaşık metin sorguları girebilirler.

When managing custom data for these types of complex vision tasks, teams often turn to the Ultralytics Platform to streamline cloud dataset annotation and seamlessly integrate text and image insights before deploying advanced models like Ultralytics YOLO26 for high-speed edge inference.

Link to this sectionUygulama Örneği#

SigLIP'in temel düzeyde kaybı nasıl hesapladığını anlamak için süreci temel PyTorch işlemleriyle simüle edebilirsin. Bu kod parçacığı, ikili sigmoid yaklaşımının geleneksel çok sınıflı olasılık mantığının yerini nasıl aldığını gösterir.

import torch
import torch.nn.functional as F

# Simulate image and text embeddings from a vision-language model
image_embeddings = torch.randn(4, 256)
text_embeddings = torch.randn(4, 256)

# Calculate pairwise similarities (logits)
logits = torch.matmul(image_embeddings, text_embeddings.T)

# SigLIP uses a binary formulation: 1 for positive pairs, -1 for negative pairs
labels = torch.eye(4) * 2 - 1
loss = -F.logsigmoid(labels * logits).mean()

print(f"Calculated SigLIP Loss: {loss.item():.4f}")

Bu kolaylaştırılmış yaklaşımdan yararlanarak, IEEE ve ACM gibi kurumlarda yayın yapan araştırmacılar da dahil olmak üzere geniş yapay zeka topluluğu, çok modlu öğrenmenin sınırlarını zorlamaya devam ediyor ve yeni nesil görüntü yapay zekası için yeni model eğitimi ipuçları ile en iyi uygulamaları oluşturuyor.

Explore solutions

Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.

Daha fazla bilgi edin
Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.

Daha fazla bilgi edin
Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.

Daha fazla bilgi edin

Yapay zekanın geleceğini birlikte inşa edelim!

Yolculuğuna makine öğreniminin geleceğiyle başla