Explore the role of a context window in AI and computer vision. Learn how [YOLO26](https://docs.ultralytics.com/models/yolo26/) uses temporal context for tracking.
Bağlam penceresi, bir makine öğrenimi modelinin çalışma sırasında aynı anda işleyebileceği ve dikkate alabileceği metin karakterleri, ses segmentleri veya video kareleri gibi girdi verilerinin maksimum aralığını ifade eder. Yapay zeka (AI) alanında bu kavram, sistemin herhangi bir anda ne kadar bilgiyi "görebileceğini" veya hatırlayabileceğini belirleyen kısa süreli belleğe benzer. Transformers gibi Transformers gibi doğal dil işleme (NLP) modelleri için pencere, AI'nın sürdürebileceği konuşma geçmişinin uzunluğunu tanımlayan tokenlarla ölçülür. Bilgisayar görme (CV) alanında bağlam genellikle zamansal veya uzamsaldır ve modelin bir dizi görüntüdeki hareketi ve sürekliliği anlamasını sağlar.
Bağlam penceresinin pratik kullanımı, basit veri tamponlamanın çok ötesine geçer ve çeşitli gelişmiş alanlarda önemli bir rol oynar:
AI çözümlerini doğru bir şekilde uygulamak için, bağlam penceresini sözlükte bulunan benzer terimlerden ayırmak yararlıdır :
Metinlerde sıklıkla tartışılsa da, tarihsel bağlamın önemli olduğu görme görevlerinde bağlam hayati öneme sahiptir. Aşağıdaki
Python snippet, ultralytics nesne izlemeyi gerçekleştirmek için paket. Burada model, video kareleri arasında nesne kimliklerinin "bağlamını" koruyarak,
1. karede algılanan bir arabanın 10. karede de aynı araba olarak tanınmasını sağlar.
from ultralytics import YOLO
# Load the YOLO26n model (latest generation)
model = YOLO("yolo26n.pt")
# Perform object tracking on a video file
# The tracker uses temporal context to preserve object IDs across frames
results = model.track(source="path/to/video.mp4", show=True)
Bağlam pencerelerini yönetmek, performans ve kaynaklar arasında sürekli bir denge kurmayı gerektirir. Çok kısa bir pencere , AI'nın anlatıyı veya nesnenin yörüng track "model amnezi"ne yol açabilir. Ancak, aşırı büyük pencereler, çıkarım gecikmesini ve bellek tüketimini artırarak, kenar AI cihazlarında gerçek zamanlı çıkarımları zorlaştırır.
Bunu hafifletmek için geliştiriciler, Retrieval-Augmented Generation (RAG) gibi stratejiler kullanır. Bu strateji, modelin her şeyi kendi bağlam penceresinde tutmak yerine, harici bir vektör veritabanından ilgili bilgileri almasına olanak tanır. Ayrıca, Ultralytics gibi araçlar, ekiplerin büyük veri kümelerini yönetmesine ve dağıtım performansını izlemesine yardımcı olarak modellerin üretim ortamlarında bağlamı işleme şeklini optimize eder. PyTorch gelişmeye devam ederek, doğrusal hesaplama maliyetleri ile büyük bağlam pencerelerine olanak tanıyan seyrek dikkat mekanizmaları için daha iyi destek sunar. YOLO26'nın uçtan uca yeteneklerine geçişte görülenler gibi model mimarisindeki yenilikler, görsel bağlamın maksimum verimlilik için işlenme şeklini geliştirmeye devam etmektedir.
