Tokenlerin yapay zekada temel bilgi birimleri olarak nasıl işlev gördüğünü öğrenin. YOLO26 ile NLP, bilgisayar görme ve açık sözlük algılamada tokenlerin rolünü keşfedin.
Modern yapay zekanın sofistike mimarisinde bir token , modelin işlediği temel, atomik bilgi birimini temsil eder. Bir algoritma bir cümleyi yorumlayabilmek, bir yazılım komut dosyasını analiz edebilmek veya bir görüntüdeki nesneleri tanıyabilmek için, ham girdi verilerinin bu ayrı, standartlaştırılmış öğelere ayrılması gerekir. Bu segmentasyon, veri ön işlemede önemli bir adımdır ve yapılandırılmamış girdileri, sinir ağlarının verimli bir şekilde hesaplayabileceği sayısal bir biçime dönüştürür. İnsanlar dili sürekli bir düşünce akışı veya görüntüleri kesintisiz görsel sahneler olarak algılarken, hesaplama modelleri desen tanıma ve anlamsal analiz gibi işlemleri gerçekleştirmek için bu ayrıntılı yapı taşlarına ihtiyaç duyar. Bu ayrıntılı yapı taşları, bir modelin
Makine öğreniminin işleyişini kavramak için, veri birimi ile onu oluşturmak için kullanılan süreç arasında ayrım yapmak önemlidir. Bu ayrım, Ultralytics veri boru hatları tasarlarken ve eğitim materyalleri hazırlarken karışıklığı önler.
Bir belirtecin niteliği, işlenen verinin türüne göre, özellikle de metinsel ve görsel alanlar arasında önemli ölçüde farklılık gösterir.
Doğal Dil İşleme (NLP) alanında tokenlar, Büyük Dil Modellerinin (LLM) girdileridir. Erken Erken yaklaşımlar kelimelerin tamamını harfiyen eşlerken, modern mimariler Byte Pair Encoding (BPE) gibi alt kelime algoritmaları kullanır. Bu yöntem, modellerin nadir kelimeleri anlamlı hecelere ayırarak işleyebilmesini sağlar ve kelime dağarcığı büyüklüğü ile anlamsal kapsama arasında denge kurar. Örneğin , "unhappiness" kelimesi "un", "happi" ve "ness" olarak tokenize edilebilir.
Tokenleştirme kavramı, Vision Transformer (ViT) ile birlikte bilgisayar görüşüne de yayılmıştır. Kayar pencerelerde pikselleri işleyen geleneksel evrişimli ağların aksine, Transformer'lar bir görüntüyü sabit boyutlu yama (örneğin, 16x16 piksel) ızgarasına böler. Her yama düzleştirilir ve ayrı bir görsel token olarak ele alınır. Bu yaklaşım, modelin, Google transformatörleri metne uyguladığı gibi, görüntünün uzak kısımları arasındaki ilişkiyi anlamak için kendi kendine dikkat mekanizmalarını kullanmasını sağlar.
Tokenlar, sayısız uygulamada insan verileri ile makine zekası arasında köprü görevi görür.
Aşağıdaki kod parçacığı, ultralytics paket, rehberlik etmek için metin belirteçleri kullanır
nesne algılama. En son teknoloji
YOLO26 Yüksek hızlı, sabit sınıf çıkarım için önerilir.
YOLO mimarisi, kullanıcılara çalışma zamanında sınıfları metin belirteçleri olarak tanımlama olanağı sunar.
from ultralytics import YOLO
# Load a pre-trained YOLO-World model capable of understanding text tokens
model = YOLO("yolov8s-world.pt")
# Define specific classes; these text strings are tokenized internally
# The model will look specifically for these "tokens" in the visual data
model.set_classes(["bus", "backpack"])
# Run prediction on an image using the defined tokens
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Display the results showing only the tokenized classes
results[0].show()
Jetonları anlamak, üretken yapay zeka ve gelişmiş analitik alanlarında yolunuzu bulmak için temel önemdedir. Bir sohbet robotunun akıcı bir şekilde konuşmasını sağlamak veya bir görüntü sisteminin ince nesne sınıflarını ayırt etmesine yardımcı olmak gibi durumlarda, jetonlar PyTorch gibi çerçeveler tarafından kullanılan makine zekasının temel para birimi olmaya devam etmektedir. Jetonlar, yapay zeka sistemlerinin temel bileşenleridir. PyTorch ve TensorFlowgibi çerçeveler tarafından kullanılan makine zekasının temel para birimi olmaya devam etmektedir.