Üretken Yapay Zekanın YOLO ile Görsel Yapay Zeka Üzerindeki Etkisi

Üretken yapay zeka, mevcut verilerden kalıplar öğrenerek görüntüler, metin veya ses gibi yeni içerikler oluşturan bir yapay zeka (AI) dalıdır. Son gelişmeler sayesinde, artık genellikle insan yaratıcılığını taklit eden son derece gerçekçi içerikler üretmek için kullanılabilir.

Bununla birlikte, üretken yapay zekanın etkisi sadece içerik oluşturmanın ötesine geçiyor. Ultralytics YOLO modelleri gibi gerçek zamanlı bilgisayarla görme modelleri gelişmeye devam ettikçe, üretken yapay zeka da görsel verilerin nasıl işlendiğini ve artırıldığını yeniden tanımlayarak gerçek dünya senaryolarında yenilikçi uygulamaların önünü açıyor.

Bu yeni teknolojik değişim, Ultralytics tarafından her yıl düzenlenen hibrit bir etkinlik olanYOLO Vision 2024'te (YV24) ilginç bir sohbet konusu oldu. YV24'te yapay zeka meraklıları ve endüstri liderleri bilgisayarla görme alanındaki en son gelişmeleri tartışmak üzere bir araya geldi. Etkinlik inovasyon, verimlilik ve gerçek zamanlı yapay zeka çözümlerinin geleceğine odaklandı.

Etkinliğin en önemli noktalarından biri, Üretken Yapay Zeka ÇağındaYOLO konulu bir panel konuşmasıydı. Panelde Ultralytics Kurucusu ve CEO'su Glenn Jocher, Ultralytics Kıdemli Makine Öğrenimi Mühendisi Jing Qiu ve Tsinghua Üniversitesi'nden Ao Wang yer aldı. Panelde, üretken yapay zekanın bilgisayarla görmeyi nasıl etkilediği ve pratik yapay zeka modelleri oluşturmanın zorlukları tartışıldı.

Bu makalede, tartışmalarından elde edilen temel bilgileri tekrar ele alacak ve üretken yapay zekanın Görüntüleme Yapay Zekasını nasıl dönüştürdüğüne daha yakından bakacağız.

Ultralytics YOLO modellerinin geliştirilmesi

Glenn Jocher'ın yanı sıra birçok yetenekli mühendis Ultralytics YOLO modellerinin geliştirilmesinde hayati bir rol oynamıştır. Bunlardan biri olan Jing Qiu, YOLO ile beklenmedik başlangıcını anlattı. Yapay zekaya olan tutkusunun üniversite yıllarında başladığını açıkladı. Bu alanı keşfetmek ve öğrenmek için önemli miktarda zaman harcadı. Jing Qiu, GitHub'da Glenn Jocher ile nasıl bağlantı kurduğunu ve çeşitli yapay zeka projelerine nasıl dahil olduğunu hatırladı.

Jing Qiu'nun söylediklerine ek olarak, Glenn Jocher GitHub'ı "tanışmadığınız insanların bir araya gelerek birbirlerine yardım ettiği, birbirlerinin çalışmalarına katkıda bulunduğu inanılmaz bir paylaşım yolu" olarak tanımladı. Harika bir topluluk ve yapay zekaya başlamak için gerçekten harika bir yol.

__wf_reserved_inherit — Şekil 1. Glenn Jocher ve Jing Qiu, YV24'te sahnede konuşma yaparken.

‍

Jing Qiu'nun yapay zekaya olan ilgisi ve Ultralytics YOLOv5 modelin iyileştirilmesine yardımcı oldu. Daha sonra, Türkiye'de Ultralytics YOLOv8Bu da daha fazla iyileştirme getirdi. Kendisi bunu inanılmaz bir yolculuk olarak tanımlıyor. Bugün, Jing Qiu aşağıdaki gibi modeller üzerinde çalışmaya ve geliştirmeye devam ediyor Ultralytics YOLO11.

YOLOv10: Gerçek dünya performansı için optimize edildi

Çin'den panele uzaktan katılan Ao Wang, kendisini doktora öğrencisi olarak tanıttı. Başlangıçta yazılım mühendisliği okudu, ancak yapay zekaya olan tutkusu onu bilgisayar görüşü ve derin öğrenmeye yöneltti.

Ünlü YOLO modeliyle ilk karşılaşması, çeşitli yapay zeka teknikleri ve modellerini denerken oldu. Hızından ve doğruluğundan etkilenmiş ve bu da ona nesne algılama gibi bilgisayarla görme görevlerine daha derinlemesine dalma konusunda ilham vermiştir. Yakın zamanda Ao Wang, YOLO modelinin yeni bir sürümü olan YOLOv10'a katkıda bulundu. Araştırması, modeli daha hızlı ve daha doğru olacak şekilde optimize etmeye odaklandı.

Üretken yapay zekâ ve Vision AI arasındaki temel fark

Daha sonra, panel üretken yapay zekayı tartışmaya başladı ve Jing Qiu, üretken yapay zeka ve Vision AI'nın çok farklı amaçlara hizmet ettiğine dikkat çekti. Üretken yapay zeka, metin, resim ve video gibi şeyler oluşturur veya üretirken, Vision AI esas olarak görüntüleri analiz ederek zaten var olanı analiz eder.

Glenn Jocher boyutun da büyük bir fark olduğunu vurguladı. Üretken yapay zeka modelleri çok büyüktür ve genellikle milyarlarca parametre içerir - modelin verilerden öğrenmesine yardımcı olan dahili ayarlar. Bilgisayarla görme modelleri ise çok daha küçüktür. "Elimizdeki en küçük YOLO modeli, en küçük LLM'den [Büyük Dil Modeli] yaklaşık bin kat daha küçük. Yani, üç milyara kıyasla 3 milyon parametre."

‍

Jing Qiu, üretken yapay zeka ile bilgisayarla görme eğitimi ve dağıtım süreçlerinin de çok farklı olduğunu sözlerine ekledi. Üretken yapay zekanın çalışması için büyük ve güçlü sunuculara ihtiyaç vardır. Öte yandan, YOLO gibi modeller verimlilik için üretilmiştir ve standart donanım üzerinde eğitilebilir ve dağıtılabilir. Bu, Ultralytics YOLO modellerini gerçek dünyada kullanım için daha pratik hale getirir.

Farklı olmalarına rağmen, bu iki alan iç içe geçmeye başlıyor. Glenn Jocher, Üretken Yapay Zeka'nın Görü Yapay Zekasına yeni gelişmeler getirdiğini, modelleri daha akıllı ve daha verimli hale getirdiğini açıkladı.

Üretken yapay zekanın bilgisayarlı görü üzerindeki etkisi

Üretken yapay zeka hızla ilerledi ve bu atılımlar, bilgisayarlı görü de dahil olmak üzere yapay zekanın diğer birçok alanını etkiliyor. Şimdi, panelden bu konudaki bazı büyüleyici içgörüleri inceleyelim.

Donanım alanındaki gelişmeler, yapay zeka inovasyonlarını mümkün kılıyor

Panelin başlarında Glenn Jocher, makine öğrenimi fikirlerinin uzun zamandır var olduğunu, ancak bilgisayarların bunları çalışır hale getirecek kadar güçlü olmadığını açıkladı. Yapay zeka fikirlerinin gerçeğe dönüşmesi için daha güçlü donanıma ihtiyacı vardı.

Paralel işleme yeteneklerine sahip GPU'ların (Grafik İşleme Birimleri) son 20 yıldaki yükselişi her şeyi değiştirdi. AI modellerinin eğitimini çok daha hızlı ve verimli hale getirdiler, bu da derin öğrenmenin hızla gelişmesini sağladı.

Günümüzde TPU'lar (Tensor İşleme Birimleri) ve optimize edilmiş GPU'lar gibi yapay zeka çipleri, daha büyük ve daha karmaşık modelleri işlerken daha az güç kullanmaktadır. Bu da yapay zekayı gerçek dünya uygulamalarında daha erişilebilir ve kullanışlı hale getirmiştir.

Yeni donanım iyileştirmeleriyle birlikte, üretken yapay zeka ve bilgisayarlı görü uygulamaları daha da güçleniyor. Bu gelişmeler, gerçek zamanlı yapay zekayı daha hızlı, daha verimli ve daha fazla sektörde kullanıma hazır hale getiriyor.

Üretken yapay zeka, nesne algılama modellerini nasıl şekillendiriyor?

Jing Qiu'ya üretken yapay zekanın bilgisayar görüşünü nasıl etkilediği sorulduğunda, transformer'ların - yapay zekanın bir görüntünün en önemli kısımlarına odaklanmasına yardımcı olan modeller - yapay zekanın görüntüleri anlama ve işleme biçimini değiştirdiğini söyledi. İlk büyük adım, nesne tespiti için bu yeni yaklaşımı kullanan DETR (Detection Transformer) oldu. Doğruluğu artırdı, ancak bazı durumlarda daha yavaş hale getiren performans sorunları vardı.

Bunu çözmek için araştırmacılar RT-DETR gibi hibrit modeller oluşturdu. Bu modeller, Evrişimsel Sinir Ağları (görüntülerden özellikleri otomatik olarak öğrenen ve çıkaran derin öğrenme modelleri olan CNN'ler) ile dönüştürücüleri birleştirerek hız ve doğruluğu dengeliyor. Bu yaklaşım, nesne algılamayı daha hızlı hale getirirken dönüştürücülerin avantajlarından yararlanır.

İlginç bir şekilde, YOLOv10 performansını artırmak için dönüştürücü tabanlı dikkat katmanları (bir görüntüdeki en önemli alanları vurgulamak için bir spot ışığı gibi hareket eden ve daha az ilgili ayrıntıları göz ardı eden model parçaları) kullanır.

Ao Wang ayrıca üretken yapay zekanın modellerin eğitilme şeklini nasıl değiştirdiğinden de bahsetti. Maskelenmiş görüntü modelleme gibi teknikler, yapay zekanın görüntülerden daha verimli öğrenmesine yardımcı olarak büyük, manuel olarak etiketlenmiş veri kümelerine olan ihtiyacı azaltır. Bu, bilgisayarlı görü eğitimini daha hızlı ve daha az kaynak yoğun hale getirir.

Üretken yapay zeka ve Görüntü İşleme Yapay Zekasının geleceği

Panelin tartıştığı bir diğer önemli fikir ise üretken yapay zeka ve Görüntü İşleme Yapay Zekasının bir araya gelerek daha yetenekli modeller oluşturmasının nasıl mümkün olacağıydı. Glenn Jocher, bu iki yaklaşımın farklı güçlü yönleri olmasına rağmen, birleştirilmelerinin yeni olasılıklar yaratabileceğini açıkladı.

Örneğin, YOLO gibi Vision AI modelleri nesneleri tanımlamak için genellikle bir görüntüyü ızgaraya böler. Bu ızgara tabanlı yöntem, dil modellerinin hem ayrıntıları saptama hem de tanımlama becerilerini geliştirmelerine yardımcı olabilir - günümüzde birçok dil modelinin karşılaştığı bir zorluk. Özünde, bu tekniklerin birleştirilmesi, gördüklerini doğru bir şekilde detect ve net bir şekilde açıklayabilen sistemlere yol açabilir.

‍

Önemli çıkarımlar

Üretken yapay zeka ve bilgisayarlı görü birlikte ilerliyor. Üretken yapay zeka görüntüler ve videolar oluştururken, aynı zamanda Vizyon Yapay Zeka modellerini daha doğru ve verimli hale getirebilecek yeni yenilikçi fikirleri masaya getirerek görüntü ve video analizini de geliştiriyor.

Bu bilgilendirici YV24 panel konuşmasında, Glenn Jocher, Jing Qiu ve Ao Wang, bu teknolojilerin geleceği nasıl şekillendirdiği konusundaki düşüncelerini paylaştılar. Daha iyi yapay zeka donanımıyla, üretken yapay zeka ve Vision AI gelişmeye devam edecek ve daha da büyük yeniliklere yol açacaktır. Bu iki alan, günlük yaşam için daha akıllı, daha hızlı ve daha kullanışlı yapay zeka oluşturmak için birlikte çalışıyor.

Topluluğumuza katılın ve Vision AI hakkında daha fazla bilgi edinmek için GitHub depomuzu keşfedin. Bilgisayarlı görü projelerinize başlamak için lisanslama seçeneklerimize göz atın. Üretimde yapay zeka veya otonom sürüşte bilgisayarlı görü gibi yeniliklerle mi ilgileniyorsunuz? Daha fazlasını keşfetmek için çözüm sayfalarımızı ziyaret edin.

Üretken yapay zeka, bilgisayarlı görü için önümüzdeki yolu değiştiriyor

Ultralytics YOLO modellerinin geliştirilmesi

YOLOv10: Gerçek dünya performansı için optimize edildi

Üretken yapay zekâ ve Vision AI arasındaki temel fark

Üretken yapay zekanın bilgisayarlı görü üzerindeki etkisi

Donanım alanındaki gelişmeler, yapay zeka inovasyonlarını mümkün kılıyor

Üretken yapay zeka, nesne algılama modellerini nasıl şekillendiriyor?

Üretken yapay zeka ve Görüntü İşleme Yapay Zekasının geleceği

Önemli çıkarımlar

Bu kategoride daha fazla okuyun

Las Vegas'ta düzenlenen CES Ultralytics öne çıkan özellikleri

Maker Faire Rome 2025'te Ultralytics 'ten öne çıkan başlıklar

Maker Faire Shenzhen 2025'te Ultralytics 'ten öne çıkan başlıklar

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Üretken yapay zeka, bilgisayarlı görü için önümüzdeki yolu değiştiriyor

Ultralytics YOLO modellerinin geliştirilmesi

YOLOv10: Gerçek dünya performansı için optimize edildi

Üretken yapay zekâ ve Vision AI arasındaki temel fark

Üretken yapay zekanın bilgisayarlı görü üzerindeki etkisi

Donanım alanındaki gelişmeler, yapay zeka inovasyonlarını mümkün kılıyor

Üretken yapay zeka, nesne algılama modellerini nasıl şekillendiriyor?

Üretken yapay zeka ve Görüntü İşleme Yapay Zekasının geleceği

Önemli çıkarımlar

Bu kategoride daha fazla okuyun

Las Vegas'ta düzenlenen CES Ultralytics öne çıkan özellikleri

Maker Faire Rome 2025'te Ultralytics 'ten öne çıkan başlıklar

Maker Faire Shenzhen 2025'te Ultralytics 'ten öne çıkan başlıklar

Gelin, yapay zekanın geleceğini birlikte inşa edelim!

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!