Yolo Vision Shenzhen
Shenzhen
Şimdi katılın

HuggingFace'in transformatörleri ile açık kaynaklı bilgisayarla görmeyi güçlendirmek

Nuvola Ladi

5 dakikalık okuma

14 Şubat 2024

HuggingFace ile açık kaynaklı bilgisayarla görmeye dalın! Transfer öğrenimi, dönüştürücüler hakkında bilgi edinin ve 8.000'den fazla modeli keşfedin. Geliştiricilerin yapay zeka keşiflerinde yenilik yapmalarını sağlayan içgörüler ve pratik demolar için Merve Noyan'a katılın.

YOLO VİZYON 2023 (YV23) etkinliğinden öne çıkan noktaları keşfetmeye devam ederken, YV23'te Geliştirici Savunuculuk Mühendisi olarak görev yapan Merve Noyan ile tanışalım. HuggingFaceDil uygulamalarının verimli bir şekilde geliştirilmesi için önceden eğitilmiş modellere sahip Lider NLP platformu. Merve konuşmasında açık kaynaklı bilgisayarla görme dünyasına dair inanılmaz bilgiler paylaştı. 

Sizi transfer öğrenimi, transformer'lar ve açık kaynaklı bilgisayarlı görü ekosisteminin büyüleyici evreninde bir yolculuğa çıkarırken bize katılın.

Transfer öğrenimine genel bakış: Kısa bir özet

Merve, işe, bir sinir ağından diğerine bilgi aktarmamızı sağlayan sihirli değnek olan transfer öğrenimi hakkında hızlı bir başlangıç yaparak başladı. Erken katmanlardaki kenarlar ve köşeler gibi evrensel özellikler üzerinde bir model eğittiğinizi ve ardından belirli görevler için ince ayar yaptığınızı hayal edin. Bu, veri bağımlılıklarını azaltan ve doğruluğu artıran transfer öğreniminin özüdür.

Merve, transformasyonel yolculuğun zeminini hazırlayarak ResNet ve Inception gibi klasik evrişimsel omurgaları vurguladı.

Transformatörlere girin: Ortaya çıkarılan bir bilmece

Transformer'ları özel kılan nedir? Merve, geleneksel evrişim tabanlı modellerden nasıl farklı olduklarını göstererek bunu bir bilmeceye benzetti. İşin sırrı, etiketli verilere ihtiyaç duymadan özellikleri yakalayarak, kendi kendine denetimli öğrenme gerçekleştirebilmelerinde yatıyor. Vision Transformer, Data Efficient Transformer, CLIP ve SWIM CLIP, tanıttığı transformer tabanlı modellerin yıldızlarla dolu kadrosu arasındaydı. 

Nesne algılama için tasarlanmış bir dönüştürücü modeli için destek sağlayan Ultralytics ile ortak bir zemin oluşturuyor. Bu model etkili bir hibrit kodlayıcı, IOU farkındalı sorgu seçimi ve ayarlanabilir çıkarım hızına sahiptir. Özellikle, diğerlerinin tanıdık modeline bağlı kalmaktadır. Ultralytics YOLOv8 modelleri, tahmin, eğitim, doğrulama ve dışa aktarma için seçenekler sunar.

Tek adresiniz

Merve daha sonra klasik bilgisayarla görme görevleri için 8.000'den fazla model ve çok modlu uygulamalar için 10.000 model içeren HuggingFace'in sunduğu hazineyi inceledi. HuggingFace Hub, 3.000'den fazla veri kümesiyle hem geliştiriciler hem de meraklılar için bir oyun alanı oluşturuyor. Merve, HuggingFace'in çeşitli kullanım durumları için kullanıma hazır modeller sunan tutarlı API'si sayesinde sorunsuz bir deneyim sunduğunu vurguladı.

HuggingFace ile uygulamalı sihir

Konuşma, modellerle ne kadar zahmetsizce çalışılabileceğini gösteren pratik gösterilere geçti. Merve, model ve işlemcileri anlık hale getirmekten Trainer API ile ince ayar yapmaya kadar, HuggingFace Transformers kütüphanesinin bir geliştiricinin en iyi arkadaşı olduğunu açıkça ortaya koydu. Hatta kişisel favorisi olan ve kullanıcılar için iş akışını basitleştiren Pipeline API'yi de tanıttı.

Şekil 1. Merve Noyan Madrid'deki Google for Startups Kampüsündeki YV23'te sunum yapıyor.

Uygulamalara bir bakış

Merve konuşmasını, görsel soru cevaplama için Plot modeli, resim altyazısı için Blip ve resim segmentasyonu için güçlü Segment Anything modeli de dahil olmak üzere bazı harika uygulamalara bir bakış atarak tamamladı. HuggingFace Ekosistemi'nin Pipeline API'si dikkatleri üzerine çekti ve teknik detaylara dalmadan modelleri kullanmayı çok kolay hale getirdi.

Pastanın üzerindeki krema ise Merve'nin, AI dünyasına eğlenceli bir dokunuş katan büyüleyici bir deneyim olan Elysian Diffusion ile optik illüzyonlar yaratma gösterisiydi.

Kısacası!

Sonuç olarak, Merve'nin konuşması bize ilham verdi ve açık kaynaklı bilgisayarla görmenin sonsuz olanaklarını keşfetmek için sabırsızlanmamıza neden oldu. HuggingFace , yapay zekayı gerçekten erişilebilir, eğlenceli ve heyecan verici hale getirerek geliştiricilerin yaratıcılıklarını ortaya çıkarmalarını sağladı. Açık kaynak topluluğunun geleceğine ve barındırdığı inanılmaz yeniliklere! 

Konuşmanın tamamını buradan izleyin! 

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın