Sözlük

Temel Modeli

Temel modellerin ölçeklenebilir mimariler, geniş ön eğitim ve farklı uygulamalar için uyarlanabilirlik ile yapay zekada nasıl devrim yarattığını keşfedin.

Bir temel model, çok çeşitli alt görevlere uyarlanabilen çok miktarda geniş, etiketsiz veri üzerinde eğitilmiş büyük ölçekli bir Makine Öğrenimi (ML) modelidir. Stanford İnsan Merkezli Yapay Zeka Enstitüsü tarafından ortaya atılan temel kavram, modelin üzerinde eğitildiği verilerden şaşırtıcı derecede çok yönlü bir kalıp, sözdizimi ve anlambilim anlayışı geliştirdiği "ortaya çıkan özellikler "dir. Bu genel amaçlı yapı, ince ayar adı verilen bir süreç aracılığıyla daha özel modeller oluşturmak için güçlü bir başlangıç noktası veya "temel" olarak hizmet etmesine olanak tanır.

Temel Özellikler ve Uygulamalar

Temel modellerin belirleyici özelliği, transfer öğrenme paradigmasından kaynaklanan uyarlanabilirlikleridir. Geliştiriciler, her sorun için sıfırdan yeni bir model eğitmek yerine, önceden eğitilmiş bir temel modeli alabilir ve çok daha küçük, göreve özgü bir veri kümesiyle uyarlayabilirler. Bu, yüksek performanslı yapay zeka sistemleri oluşturmak için gereken veri, hesaplama ve zamanı önemli ölçüde azaltır.

Gerçek dünya uygulamaları çok yönlülüklerini ortaya koymaktadır:

  1. Gelişmiş Sohbet Robotları ve Sanal Asistanlar: OpenAI'nin GPT-4'ü gibi bir Büyük Dil Modeli (LLM), dil için bir temel model görevi görür. Dilbilgisi, gerçekler ve akıl yürütme becerilerini anlamak için büyük bir internet metni külliyatı üzerinde önceden eğitilmiştir. Daha sonra bir şirket, ürünleri veya hizmetleri hakkındaki belirli soruları yüksek doğrulukla yanıtlayabilen özel bir sohbet robotu oluşturmak için dahili belgeleri ve müşteri etkileşim günlükleri ile ince ayar yapabilir.
  2. Tıbbi Görüntü Analizi: Bilgisayarla görmede, Meta AI'nın Segment Anything Model (SAM) gibi bir model, görüntü segmentasyonu için temel bir modeldir. Önceden bağlam olmadan herhangi bir görüntüdeki nesneleri tanımlayabilir ve ana hatlarını belirleyebilir. Tıbbi araştırmacılar daha sonra belirli organları doğru bir şekilde segmentlere ayırmak veya tümörler gibi anormallikleri tespit etmek için daha küçük bir MRI veya CT taraması seti üzerinde bu modele ince ayar yapabilir ve tıbbi görüntü analizi için teşhisleri hızlandırabilir.

Temel Modelleri ve Diğer Modeller

Temel modelleri ilgili kavramlardan ayırmak önemlidir:

  • Göreve Özel Modeller: Geleneksel olarak makine öğrenimi, yalnızca lojistikteki paketleri tespit etmek için bir Ultralytics YOLO modelinin eğitilmesi gibi tek bir amaç için sıfırdan modellerin eğitilmesini içerir. Etkili olsa da, bu yaklaşım her yeni görev için önemli miktarda etiketli veri gerektirir. Temel modeller daha verimli bir alternatif sunar.
  • Büyük Dil Modelleri (LLM'ler): LLM'ler, dil görevlerine odaklanan önde gelen bir temel model türüdür. Ancak "temel model" terimi, "Temel Modellerin Fırsatları ve Riskleri Üzerine" adlı dönüm noktası niteliğindeki makalede ayrıntılı olarak açıklandığı üzere, görme, ses ve diğer veri modalitelerine yönelik modelleri de kapsayacak şekilde daha geniştir.
  • Özel Görme Modelleri: Vision Transformer (ViT) gibi büyük görüş modelleri temel modeller olarak kabul edilirken, birçok özel CV modeli temel model değildir. Örneğin, otomotivde yapay zeka gibi belirli bir uygulama için ince ayarlanmış bir YOLO11 modeli özel bir modeldir. Bununla birlikte, COCO gibi büyük veri kümelerinden elde edilen temel bilgileri içeren önceden eğitilmiş bir omurgadan yararlanır.

Eğitim ve Gelecekteki Önemi

Temel modellerin ön eğitimi, genellikle Google AI ve DeepMind gibi büyük kuruluşlar tarafından üstlenilen, genellikle binlerce GPU ve büyük mühendislik çabaları gerektiren, yoğun kaynak gerektiren bir çabadır. Ancak bu modeller bir kez eğitildikten sonra daha geniş çaplı kullanım için erişilebilir hale gelir.

Ultralytics HUB gibi platformlar, özel modelleri eğitmek, veri kümelerini yönetmek ve çözümleri dağıtmak için iş akışlarını kolaylaştırarak kullanıcıların bu temel yetenekleri uyarlamasına yardımcı olacak araçlar sağlar.

Vakıf modelleri, güçlü yeteneklere erişimi demokratikleştirerek YZ ortamını dönüştürüyor. Bu modellerin yükselişi aynı zamanda YZ etiği, veri seti önyargısı ve bilişimsel bölünme konularında kritik tartışmaları da beraberinde getiriyor. Gelecek, metin, görüntü ve sesten gelen bilgileri aynı anda anlayabilen ve işleyebilen daha güçlü, verimli ve çok modlu modellere işaret ediyor ve bir sonraki YZ kullanım durumları dalgasını yönlendiriyor.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve büyüyün

Şimdi katılın
Panoya kopyalanan bağlantı