HuggingFace'in transformatörleri ile açık kaynaklı bilgisayarla görmeyi güçlendirmek

Nuvola Ladi

5 dakika okuma

14 Şubat 2024

HuggingFace ile açık kaynaklı bilgisayarla görmeye dalın! Transfer öğrenimi, dönüştürücüler hakkında bilgi edinin ve 8.000'den fazla modeli keşfedin. Geliştiricilerin yapay zeka keşiflerinde yenilik yapmalarını sağlayan içgörüler ve pratik demolar için Merve Noyan'a katılın.

YOLO VISION 2023 (YV23) etkinliğinden önemli noktaları keşfetmeye devam ederken, dil uygulamalarının verimli bir şekilde geliştirilmesi için önceden eğitilmiş modellere sahip Lider NLP platformu HuggingFace'in Geliştirici Savunuculuk Mühendisi Merve Noyan ile tanışalım. Merve konuşmasında, açık kaynaklı bilgisayarla görme dünyasına ilişkin bazı inanılmaz bilgiler paylaştı. 

Sizi transfer öğrenme, dönüştürücüler ve açık kaynaklı bilgisayarla görme ekosisteminin büyüleyici evreninde bir yolculuğa çıkarırken bize katılın.

Transfer öğrenimi açıklandı: Hızlı bir özet

Merve, bilgiyi bir sinir ağından diğerine aktarmamızı sağlayan sihirli değnek olan transfer öğrenme hakkında hızlı bir başlangıç yaptı. Bir modeli ilk katmanlardaki kenarlar ve köşeler gibi evrensel özellikler üzerinde eğittiğinizi ve ardından belirli görevler için ince ayar yaptığınızı düşünün. Bu, veri bağımlılıklarını azaltan ve doğruluğu artıran transfer öğrenmenin özüdür.

Merve, ResNet ve Inception gibi klasik evrişimsel omurgaların altını çizerek önümüzdeki dönüşümsel yolculuk için zemin hazırladı.

Transformers'a girin: Bir bilmece açığa çıktı

Transformers'ı özel kılan nedir? Merve bunu bir bilmeceye benzeterek geleneksel konvolüsyon tabanlı modellerden nasıl farklı olduklarını gösterdi. Gizli sos, etiketli veriye ihtiyaç duymadan özellikleri yakalayarak kendi kendine denetimli öğrenme gerçekleştirme yeteneklerinde yatıyor. Vision Transformer, Data Efficient Transformer, CLIP ve SWIM CLIP, tanıttığı transformatör tabanlı modellerin yıldızlarla dolu kadrosu arasındaydı. 

Nesne algılama için tasarlanmış bir dönüştürücü modeli için destek sağlayan Ultralytics ile ortak bir zemin oluşturuyor. Bu model etkili bir hibrit kodlayıcı, IOU farkındalı sorgu seçimi ve ayarlanabilir çıkarım hızına sahiptir. Özellikle, diğer Ultralytics YOLOv8 modellerinin tanıdık modeline bağlı kalarak tahmin, eğitim, doğrulama ve dışa aktarma seçenekleri sunar.

Tek durak noktanız

Merve daha sonra klasik bilgisayarla görme görevleri için 8.000'den fazla model ve çok modlu uygulamalar için 10.000 model içeren HuggingFace'in sunduğu hazineyi inceledi. HuggingFace Hub, 3.000'den fazla veri kümesiyle hem geliştiriciler hem de meraklılar için bir oyun alanı oluşturuyor. Merve, HuggingFace'in çeşitli kullanım durumları için kullanıma hazır modeller sunan tutarlı API'si sayesinde sorunsuz bir deneyim sunduğunu vurguladı.

HuggingFace ile uygulamalı sihir

Konuşma, modellerle ne kadar zahmetsizce çalışılabileceğini gösteren pratik gösterilere geçti. Merve, model ve işlemcileri anlık hale getirmekten Trainer API ile ince ayar yapmaya kadar, HuggingFace Transformers kütüphanesinin bir geliştiricinin en iyi arkadaşı olduğunu açıkça ortaya koydu. Hatta kişisel favorisi olan ve kullanıcılar için iş akışını basitleştiren Pipeline API'yi de tanıttı.

Şekil 1. Merve Noyan Madrid'deki Google for Startups Kampüsündeki YV23'te sunum yapıyor.

Uygulamalara bir bakış

Merve konuşmasını, görsel soru yanıtlama için Plot modeli, resim altyazısı için Blip ve resim segmentasyonu için güçlü Segment Anything modeli de dahil olmak üzere bazı harika uygulamalara bir bakış atarak tamamladı. HuggingFace Ekosistemi'nin Pipeline API'si dikkatleri üzerine çekti ve teknik detaylara dalmadan modelleri kullanmayı çok kolay hale getirdi.

Merve'nin yapay zeka dünyasına eğlenceli bir dokunuş katan büyüleyici bir deneyim olan Elysian Diffusion ile optik illüzyonlar yaratma gösterisi de işin tuzu biberi oldu.

Özetle!

Sonuç olarak, Merve'nin konuşması bize ilham verdi ve açık kaynaklı bilgisayarla görmenin sonsuz olanaklarını keşfetmek için sabırsızlanmamıza neden oldu. HuggingFace, yapay zekayı gerçekten erişilebilir, eğlenceli ve heyecan verici hale getirerek geliştiricilerin yaratıcılıklarını ortaya çıkarmalarını sağladı. Açık kaynak topluluğunun geleceğine ve barındırdığı inanılmaz yeniliklere! 

Konuşmanın tamamını buradan izleyin! 

Yapay zekanın gelecekteki
adresini birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın
Panoya kopyalanan bağlantı