YOLO26 ile tanış: yeni nesil görsel AI.
Ultralytics
Etkinlikler

Hugging Face'in açık kaynak araçlarıyla CV projelerini güçlendirme

Hugging Face'in açık kaynak araçlarının yapay zeka geliştirmeyi nasıl ilerlettiğini keşfetmeye odaklanan YOLO Vision 2024 konuşmasına tekrar göz atarken bize katıl.

ABAbirami Vina
5 min read
Hugging Face açık kaynak araçlarıyla CV projelerini güçlendirme

Doğru algoritmaları seçmek, etkileyici bilgisayarlı görü çözümleri oluşturmanın sadece bir parçasıdır. Yapay zeka mühendisleri genellikle büyük veri kümeleriyle çalışır, modelleri belirli görevler için ince ayardan geçirir ve yapay zeka sistemlerini gerçek dünya performansına göre optimize ederler. Yapay zeka uygulamaları daha hızlı benimsendikçe, bu süreçleri basitleştiren araçlara duyulan ihtiyaç da artıyor.

Ultralytics tarafından desteklenen yıllık hibrit etkinlik YOLO Vision 2024 (YV24) kapsamında, yapay zeka uzmanları ve teknoloji meraklıları bilgisayarlı görüdeki en son yenilikleri keşfetmek için bir araya geldi. Etkinlik, yapay zeka uygulama geliştirmeyi hızlandırmanın yolları gibi çeşitli konular üzerinde tartışmaları tetikledi.

Etkinliğin önemli bir vurgusu, model eğitimi, optimizasyonu ve dağıtımını kolaylaştıran açık kaynaklı bir yapay zeka platformu olan Hugging Face hakkındaki açılış konuşmasıydı. Hugging Face'te Makine Öğrenimi Mühendisi olan Pavel Iakubovskii, şirketin araçlarının görüntülerdeki nesneleri tespit etme, görüntüleri farklı gruplara ayırma ve belirli örnekler üzerinde önceden eğitim almadan tahminler yapma (sıfır vuruşlu öğrenme) gibi bilgisayarlı görü görevlerine yönelik iş akışlarını nasıl iyileştirdiğini paylaştı.

Hugging Face Hub, Ultralytics YOLO11 gibi çeşitli yapay zeka ve bilgisayarlı görü modellerine ev sahipliği yapar ve bunlara erişim sağlar. Bu makalede, Pavel'in konuşmasındaki temel çıkarımları özetleyecek ve geliştiricilerin yapay zeka modellerini hızlı bir şekilde oluşturmak ve dağıtmak için Hugging Face'in açık kaynak araçlarını nasıl kullanabileceğini göreceğiz.

YV24'te sahnede Pavel

Şekil 1. YV24'te sahnede Pavel.

Link to this sectionHugging Face Hub daha hızlı yapay zeka geliştirmeyi destekliyor#

Pavel konuşmasına, Hugging Face'i çeşitli uygulamalar için önceden eğitilmiş modeller sunan açık kaynaklı bir yapay zeka platformu olarak tanıtarak başladı. Bu modeller, doğal dil işleme (NLP), bilgisayarlı görü ve çok modlu yapay zeka dahil olmak üzere yapay zekanın çeşitli dalları için tasarlanmış olup sistemlerin metin, görüntü ve ses gibi farklı veri türlerini işlemesini sağlar.

Pavel, Hugging Face Hub'ın şu anda 1 milyondan fazla modele ev sahipliği yaptığını ve geliştiricilerin kendi projelerine uygun modelleri kolayca bulabildiklerini belirtti. Hugging Face, model eğitimi, ince ayar ve dağıtım için araçlar sunarak yapay zeka geliştirmeyi basitleştirmeyi amaçlıyor. Geliştiriciler farklı modellerle denemeler yapabildiklerinde, bu durum yapay zekayı gerçek dünya uygulamalarına entegre etme sürecini kolaylaştırıyor.

Hugging Face başlangıçta NLP ile tanınsa da, o zamandan beri bilgisayarlı görü ve çok modlu yapay zekaya genişleyerek geliştiricilerin daha geniş bir yapay zeka görevleri yelpazesini ele almasını sağladı. Ayrıca, geliştiricilerin iş birliği yapabileceği, içgörülerini paylaşabileceği ve forumlar, Discord ve GitHub aracılığıyla destek alabileceği güçlü bir topluluğa da sahiptir.

Link to this sectionBilgisayarlı görü uygulamaları için Hugging Face modellerini keşfetme#

Daha fazla detaya giren Pavel, Hugging Face'in araçlarının bilgisayarlı görü uygulamaları oluşturmayı nasıl kolaylaştırdığını açıkladı. Geliştiriciler bunları görüntü sınıflandırma, nesne tespiti ve görü-dil uygulamaları gibi görevler için kullanabilirler.

Ayrıca, bu bilgisayarlı görü görevlerinin birçoğunun Hugging Face Hub'da bulunan önceden eğitilmiş modellerle halledilebileceğini ve sıfırdan eğitim ihtiyacını azaltarak zaman kazandırdığını belirtti. Hatta Hugging Face, gıda sınıflandırma, evcil hayvan sınıflandırma ve duygu tespiti dahil olmak üzere görüntü sınıflandırma görevleri için 13.000'den fazla önceden eğitilmiş model sunuyor.

Bu modellerin erişilebilirliğini vurgulayarak, "Muhtemelen projeniz için bir modeli eğitmenize bile gerek yok; Hub'da topluluktan biri tarafından zaten eğitilmiş bir model bulabilirsiniz," dedi.

Link to this sectionNesne tespiti için Hugging Face modelleri#

Başka bir örnek veren Pavel, bilgisayarlı görüde görüntü içindeki nesneleri tanımlamak ve konumlandırmak için kullanılan temel bir işlev olan nesne tespitine Hugging Face'in nasıl yardımcı olabileceğini detaylandırdı. Sınırlı etiketli verilerle bile, Hugging Face Hub'da bulunan önceden eğitilmiş modeller nesne tespitini daha verimli hale getirebilir.

Ayrıca, bu görev için oluşturulmuş ve Hugging Face'te bulabileceğiniz birkaç modele hızlı bir genel bakış sundu:

  • Gerçek zamanlı nesne tespit modelleri: Hızın çok önemli olduğu dinamik ortamlar için Detection Transformer (DETR) gibi modeller gerçek zamanlı nesne tespiti yetenekleri sunar. DETR, COCO veri seti üzerinde eğitilmiştir ve çok ölçekli özellikleri verimli bir şekilde işlemek üzere tasarlanmıştır, bu da onu zamana duyarlı uygulamalar için uygun hale getirir.
  • Görü-dil modelleri: Bu modeller görüntü ve metin işlemeyi birleştirerek yapay zeka sistemlerinin görüntüleri açıklamalarla eşleştirmesini veya nesneleri eğitim verilerinin ötesinde tanımasını mümkün kılar. Metni görsellerle bağlantılandırarak görüntü aramasını iyileştiren ve yapay zeka çözümlerinin bağlamlarını anlayarak yeni nesneleri tanımlamasını sağlayan CLIP ve SigLIP buna örnektir.
  • Sıfır vuruşlu nesne tespit modelleri: Görüntüler ve metin arasındaki ilişkiyi anlayarak daha önce görmedikleri nesneleri tanımlayabilirler. Sıfır vuruşlu öğrenmeyi kullanarak etiketli eğitim verilerine ihtiyaç duymadan yeni nesneleri tespit edebilen OwlVit, GroundingDINO ve OmDet buna örnektir.

Link to this sectionHugging Face modelleri nasıl kullanılır#

Pavel daha sonra odak noktasını Hugging Face modelleriyle uygulamaya geçmeye çevirdi ve geliştiricilerin bunlardan yararlanabileceği üç yolu açıkladı: modelleri keşfetme, hızlıca test etme ve daha fazla özelleştirme.

Geliştiricilerin herhangi bir kod yazmadan modelleri doğrudan Hugging Face Hub üzerinden nasıl gözden geçirebileceklerini gösterdi, bu da etkileşimli bir arayüz aracılığıyla modelleri anında test etmeyi kolaylaştırıyor. Pavel, "Tek bir satır kod yazmadan veya modeli bilgisayarınıza indirmeden bile deneyebilirsiniz," diye ekledi. Bazı modeller büyük olduğundan, bunları Hub üzerinde çalıştırmak depolama ve işleme sınırlamalarından kaçınmaya yardımcı olur.

Hugging Face modelleri nasıl kullanılır

Şekil 2. Hugging Face modelleri nasıl kullanılır.

Ayrıca, Hugging Face Inference API, geliştiricilerin basit API çağrılarıyla yapay zeka modellerini çalıştırmasına olanak tanır. Hızlı testler, kavram kanıtlama projeleri ve karmaşık bir kuruluma gerek kalmadan hızlı prototipleme için harikadır.

Daha gelişmiş kullanım durumları için geliştiriciler, metin, görü ve ses görevleri için önceden eğitilmiş modeller sunarken hem PyTorch hem de TensorFlow'u destekleyen açık kaynaklı bir araç olan Hugging Face Transformers çerçevesini kullanabilirler. Pavel, sadece iki satır kodla geliştiricilerin Hugging Face Hub'dan bir model alıp, bunu Vision AI uygulamaları için görüntü verilerini analiz etmek üzere bir görüntü işlemci gibi bir ön işleme aracına bağlayabileceklerini açıkladı.

Link to this sectionYapay zeka iş akışlarını Hugging Face ile optimize etme#

Ardından Pavel, Hugging Face'in yapay zeka iş akışlarını nasıl kolaylaştırabileceğini açıkladı. Ele aldığı önemli konulardan biri, derin öğrenme modellerinin temel bir özelliği olan ve girdi verilerinin en alakalı kısımlarına odaklanmasına yardımcı olan Transformers'taki dikkat mekanizmasını optimize etmekti. Bu, dil işleme ve bilgisayarlı görü içeren görevlerin doğruluğunu artırır. Ancak, kaynak yoğun olabilir.

Dikkat mekanizmasını optimize etmek, hızı artırırken bellek kullanımını önemli ölçüde azaltabilir. Pavel, "Örneğin, daha verimli bir dikkat uygulamasına geçerek 1,8 kata kadar daha hızlı performans görebilirsiniz," diye belirtti.

Hugging Face, Transformers çerçevesi içinde daha verimli dikkat uygulamaları için yerleşik destek sağlar. Geliştiriciler, bir modeli yüklerken alternatif bir dikkat uygulaması belirterek bu optimizasyonları etkinleştirebilirler.

Link to this sectionOptimum ve Torch Compile#

Ayrıca, yapay zeka modellerini performansı çok fazla etkilemeden kullandıkları sayıların hassasiyetini azaltarak küçülten bir teknik olan kuantizasyondan bahsetti. Bu, modellerin daha az bellek kullanmasına ve daha hızlı çalışmasına yardımcı olarak onları akıllı telefonlar ve gömülü sistemler gibi sınırlı işlem gücüne sahip cihazlar için daha uygun hale getirir.

Verimliliği daha da artırmak için Pavel, modelleri optimize etmek ve dağıtmak için tasarlanmış bir araç seti olan Hugging Face Optimum kütüphanesini tanıttı. Geliştiriciler, sadece birkaç satır kodla kuantizasyon tekniklerini uygulayabilir ve modelleri ONNX (Open Neural Network Exchange) gibi verimli formatlara dönüştürerek bulut sunucuları ve uç cihazlar dahil olmak üzere farklı donanım türlerinde sorunsuz çalışmalarını sağlayabilirler.

Pavel, Optimum kütüphanesi ve özellikleri hakkında konuşuyor

Şekil 3. Pavel, Optimum kütüphanesi ve özellikleri hakkında konuştu.

Son olarak Pavel, PyTorch'ta yapay zeka modellerinin verileri işleme biçimini optimize eden, daha hızlı ve daha verimli çalışmalarını sağlayan bir özellik olan Torch Compile'ın avantajlarından bahsetti. Hugging Face, Torch Compile'ı Transformers ve Optimum kütüphanelerine entegre ederek geliştiricilerin bu performans iyileştirmelerinden minimum kod değişikliğiyle yararlanmalarını sağlıyor.

Modelin hesaplama yapısını optimize ederek, Torch Compile çıkarım sürelerini hızlandırabilir ve doğruluktan veya kaliteden ödün vermeden kare hızlarını saniyede 29'dan 150 kareye çıkarabilir.

Link to this sectionHugging Face araçlarıyla modelleri dağıtma#

Devamında Pavel, geliştiricilerin doğru modeli seçtikten ve geliştirme için en iyi yaklaşımı belirledikten sonra Hugging Face araçlarını kullanarak Vision AI modellerini nasıl genişletebileceklerine ve dağıtabileceklerine kısaca değindi.

Örneğin, geliştiriciler Gradio ve Streamlit kullanarak etkileşimli yapay zeka uygulamaları dağıtabilirler. Gradio, geliştiricilerin makine öğrenimi modelleri için web tabanlı arayüzler oluşturmasına olanak tanırken, Streamlit basit Python betikleriyle etkileşimli veri uygulamaları oluşturmaya yardımcı olur.

Pavel ayrıca, Hugging Face'in sağladığı kılavuzlara, eğitim not defterlerine ve örnek betiklere atıfta bulunarak, "Her şeye sıfırdan başlamanıza gerek yok," diye belirtti. Bu kaynaklar, geliştiricilerin her şeyi en baştan oluşturmak zorunda kalmadan hızlı bir şekilde başlamalarına yardımcı olur.

Pavel, YV24'te Hugging Face'in yeteneklerini tartışıyor

Şekil 4. Pavel, YV24'te Hugging Face'in yeteneklerini tartışıyor.

Link to this sectionHugging Face Hub'ın avantajları#

Konuşmasını tamamlayan Pavel, Hugging Face Hub kullanmanın avantajlarını özetledi. Model yönetimi ve iş birliğini nasıl basitleştirdiğini vurguladı. Ayrıca, hem yeni başlayanların hem de uzmanların yapay zeka modellerini anlamalarına ve uygulamalarına yardımcı olabilecek kılavuzların, not defterlerinin ve eğitimlerin mevcudiyetine dikkat çekti.

"Hub'da zaten birçok harika alan var. Benzerlerini bulabilir, paylaşılan kodu klonlayabilir, birkaç satırı değiştirebilir, modeli kendinizinkiyle değiştirebilir ve geri yükleyebilirsiniz," diyerek geliştiricileri platformun esnekliğinden yararlanmaya teşvik etti.

Link to this sectionÖne çıkanlar#

Pavel, YV24'teki konuşması sırasında Hugging Face'in yapay zeka modeli eğitimi, optimizasyonu ve dağıtımını destekleyen araçları nasıl sağladığını paylaştı. Örneğin, Transformers, Optimum ve Torch Compile gibi yenilikler, geliştiricilerin model performansını artırmasına yardımcı olabilir.

Yapay zeka modelleri daha verimli hale geldikçe, kuantizasyon ve uç cihazda dağıtım alanındaki gelişmeler, bunları kaynakları sınırlı cihazlarda çalıştırmayı kolaylaştırıyor. Bu iyileştirmeler, Hugging Face gibi araçlar ve Ultralytics YOLO11 gibi gelişmiş bilgisayarlı görü modelleriyle birleştiğinde, ölçeklenebilir ve yüksek performanslı Vision AI uygulamaları oluşturmanın anahtarıdır.

Büyüyen topluluğumuza katıl! Yapay zeka hakkında bilgi edinmek için GitHub depomuzu keşfet ve Vision AI projelerine başlamak için YOLO lisanslarımıza göz at. Sağlık hizmetlerinde bilgisayarlı görü veya tarımda bilgisayarlı görü gibi yeniliklerle ilgileniyor musun? Daha fazlasını keşfetmek için çözüm sayfalarımızı ziyaret et!

Explore solutions

Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.

Daha fazla bilgi edin
Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.

Daha fazla bilgi edin
Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.

Daha fazla bilgi edin

Yapay zekanın geleceğini birlikte inşa edelim!

Yolculuğuna makine öğreniminin geleceğiyle başla