Devlet Uzay Modelleri (SSM'ler) ile verimli sekans modellemenin nasıl gerçekleştirildiğini keşfedin. Ultralytics ve Ultralytics gelişmiş AI iş akışlarını nasıl desteklediğini öğrenin.
Durum Uzayı Modelleri (SSM'ler), makine öğreniminde zaman içinde sürekli veri akışlarını işlemek için tasarlanmış güçlü bir dizi modelleme mimarisi sınıfıdır. Geleneksel kontrol teorisine dayanan SSM'lerin modern derin öğrenme uyarlamaları, karmaşık sıralı görevleri işlemek için oldukça verimli alternatifler olarak ortaya çıkmıştır. Kökeni geleneksel kontrol teorisine dayanan SSM'lerin modern derin öğrenme uyarlamaları, karmaşık sıralı görevleri işlemek için oldukça verimli alternatifler olarak ortaya çıkmıştır. Yeni bilgiler geldikçe güncellenen bir iç "durum" sürdürerek, bu modeller girdi dizilerini çıktı dizilerine olağanüstü bir verimlilikle eşleyebilir, bu da onları verilerdeki uzun vadeli bağımlılıkları yakalamada özellikle yetkin kılar.
Temelde, SSM'ler geçmiş bilgileri gizli bir durum vektörüne sıkıştırarak çalışır ve bu vektör yeni girdiler işlendikçe sürekli olarak güncellenir . Bellek darboğazlarıyla mücadele eden geleneksel modellerin aksine, Yapısal Durum Uzayı Modelleri (S4) ve oldukça popüler olan Mamba mimarisi gibi son gelişmeler, seçici mekanizmalar getirmiştir. Bunlar, modelin alakasız verileri dinamik olarak filtrelemesine ve önemli bağlamları hatırlamasına olanak tanıyarak, eski mimarilerde tipik olan büyük bellek yükü olmadan yüksek performans elde edilmesini sağlar. SSM'ler, geçmiş verileri gizli bir durum vektörüne sıkıştırarak çalışır ve bu vektör, yeni girdiler işlendikçe sürekli olarak güncellenir.
PyTorch PyTorchgibi standart çerçeveler kullanarak temel sekans işlemleri oluşturabilirsiniz. Aşağıda, PyTorch sıralı verilerin doğrusal bir katman aracılığıyla nasıl işlenebileceğini gösteren basit ve çalıştırılabilir bir örnek verilmiştir. Bu örnek, kavramsal olarak durum uzayı izlemede kullanılan sürekli-ayrık projeksiyonlara benzerdir:
import torch
import torch.nn as nn
# Simulate a sequence of 10 steps, batch size 2, feature size 16
sequence_data = torch.randn(2, 10, 16)
# A linear projection layer conceptually similar to an SSM state update
state_projection = nn.Linear(16, 32)
hidden_state = state_projection(sequence_data)
print(f"Output shape: {hidden_state.shape}") # Expected: [2, 10, 32]
SSM'leri tam olarak anlamak için, bunları diğer yaygın dizi modellerinden ayırmak yardımcı olur:
SSM'lerin verimliliği, özellikle dizi uzunluğunun hesaplama darboğazları yarattığı çeşitli yapay zeka alanlarında hızlı bir şekilde benimsenmesine yol açmıştır.
SSM'ler sıralı ve dil verilerinde devrim yaratırken, bilgisayar görme görevleri genellikle özel uzamsal mimarilere dayanır. Örneğin, Ultralytics , uçtan uca, NMS çıkarım özelliği nedeniyle gerçek zamanlı nesne algılama ve örnek segmentasyonu için yaygın olarak kullanılmaktadır. Metin için bir SSM oluşturuyor veya YOLO26 gibi görsel modeller kullanıyor olsanız da, Ultralytics kullanarak veri kümelerini yönetebilir, çözümlerinizi sorunsuz bir şekilde eğitebilir ve dağıtabilirsiniz. Bu sayede, herhangi bir AI uygulaması için verimli uçtan buluta iş akışları elde edebilirsiniz.