Yapay Zeka Görüşü

2024 üretken yapay zeka dalgasıyla başlıyor

2024'ün ilk çeyreğinden heyecan verici yapay zeka inovasyonlarına bir bakış. OpenAI'ın Sora AI'ı, Neuralink'in beyin çipi ve en yeni LLM'ler gibi atılımları ele alacağız.

ABAbirami Vina

6 min readApril 12, 2024

2024 başından üretken yapay zeka atılımları

Yapay zeka topluluğu neredeyse her gün manşetlere çıkıyor gibi. 2024'ün ilk birkaç ayı heyecan vericiydi ve yeni yapay zeka inovasyonlarıyla doluydu. Güçlü yeni büyük dil modellerinden insan beyni implantlarına kadar 2024, harika bir yıl olmaya aday.

Yapay zekanın endüstrileri dönüştürdüğünü, bilgiyi daha erişilebilir kıldığını ve hatta zihinlerimizi makinelerle birleştirme yolunda ilk adımları attığını görüyoruz. 2024'ün ilk çeyreğini geriye saralım ve sadece birkaç ay içinde yapay zeka alanında kaydedilen ilerlemeye daha yakından bakalım.

Link to this sectionLLM'ler trend oluyor#

Büyük miktarda metin verisine dayalı olarak insan dilini anlamak, üretmek ve işlemek için tasarlanan büyük dil modelleri (LLM'ler), 2024'ün ilk çeyreğinde sahneye çıktı. Birçok büyük teknoloji şirketi, her biri kendine has yeteneklere sahip kendi LLM modellerini yayınladı. GPT-3 gibi önceki LLM'lerin inanılmaz başarısı bu trende ilham verdi. İşte 2024'ün başlarından en dikkat çekici LLM sürümlerinden bazıları.

Link to this sectionAnthropic'ten Claude 3#

Anthropic, Claude 3 modelini 14 Mart 2024'te yayınladı. Claude 3 modeli; Opus, Sonnet ve Haiku olmak üzere farklı pazarlara ve amaçlara hizmet eden üç sürümle geliyor. En hızlı model olan Haiku, hızlı ve temel yanıtlar için optimize edilmiştir. Sonnet, hız ile zeka arasında denge kurar ve kurumsal uygulamaları hedefler. En gelişmiş sürüm olan Opus, eşsiz bir zeka ve akıl yürütme sunar; karmaşık görevler ve en iyi benchmark sonuçlarına ulaşmak için idealdir.

Claude 3 birçok gelişmiş özellik ve iyileştirme ile övünüyor:

Gelişmiş Çok Dilli Sohbetler: İspanyolca, Japonca ve Fransızca dahil olmak üzere dillerde geliştirilmiş yetenekler.
Gelişmiş Görüntü Özellikleri: Çeşitli görsel formatları işleme yeteneğine sahip.
En Aza İndirilmiş Reddetmeler: Daha iyi bağlamsal kavrayış göstererek, gereksiz reddetmelerin azaldığı daha fazla anlayış sergiliyor.
Genişletilmiş Bağlam Penceresi: 200K bağlam penceresi sunuyor, ancak müşteri ihtiyaçlarına göre 1 milyon tokenın üzerinde girişi işleyebiliyor.

Claude 3'ün önceki sürümlere kıyasla bağlamsal farkındalığını gösteren grafik

Şekil 1. Claude 3, önceki sürümlerden daha fazla bağlamsal farkındalığa sahip.

Link to this sectionDatabricks'ten DBRX#

Databricks DBRX, Databricks tarafından 27 Mart 2024'te yayınlanan açık, genel amaçlı bir LLM'dir. DBRX; dil anlama, programlama ve matematik dahil olmak üzere çeşitli benchmarklarda gerçekten iyi sonuç veriyor. Benzer modellerden yaklaşık %40 daha küçük olmasına rağmen diğer köklü modelleri geride bırakıyor.

DBRX'i diğer modellerle karşılaştırma

Şekil 2. DBRX'in diğer modellerle karşılaştırılması.

DBRX, ince taneli bir uzman karışımı (MoE) mimarisi ile bir sonraki token tahmini kullanılarak eğitildi, bu nedenle eğitim ve çıkarım performansında önemli gelişmeler görüyoruz. Mimarisi, modelin çeşitli uzmanlaşmış alt modeller (

Link to this sectionGoogle'dan Gemini 1.5#

Google, 15 Şubat 2024'te kapsamlı metin, video ve ses verilerini analiz edebilen, hesaplama açısından verimli, çok modlu bir yapay zeka modeli olan Gemini 1.5'i tanıttı. En son model; performans, verimlilik ve yetenekler açısından daha gelişmiş durumda. Gemini 1.5'in temel bir özelliği, uzun bağlam anlamadaki çığır açan başarısıdır. Model, 1 milyon tokena kadar tutarlı bir şekilde işleme yeteneğine sahip. Gemini 1.5'in yetenekleri, yeni bir MoE tabanlı mimariye de borçludur.

Popüler LLM'lerin bağlam uzunluklarını karşılaştırma

Şekil 3. Popüler LLM'lerin Bağlam Uzunluklarının Karşılaştırılması

İşte Gemini 1.5'in en ilginç özelliklerinden bazıları:

Gelişmiş Veri İşleme: Büyük PDF'lerin, kod depolarının veya uzun videoların doğrudan komut olarak yüklenmesine izin verir. Model, modlar arasında akıl yürütebilir ve metin çıktısı verebilir.
Çoklu Dosya Yükleme ve Sorgulama: Geliştiriciler artık birden fazla dosya yükleyebilir ve sorular sorabilir.
Farklı Görevler İçin Kullanılabilir: Çeşitli görevler arasında ölçeklenecek şekilde optimize edilmiştir ve matematik, bilim, akıl yürütme, çok dillilik, video anlama ve kod gibi alanlarda gelişmeler gösterir.

Link to this sectionYapay zekadan çarpıcı görseller#

2024'ün ilk çeyreği, sosyal medyanın geleceği ve yapay zekanın ilerleyişi üzerine tartışmaları başlatan, gerçek görseller oluşturabilen üretken yapay zeka modellerini gün yüzüne çıkardı. Konuşmaları alevlendiren modellere dalalım.

Link to this sectionOpenAI'dan Sora#

ChatGPT'nin yaratıcısı OpenAI, 15 Şubat 2024'te Sora adında son teknoloji bir metinden videoya derin öğrenme modelini duyurdu. Sora, kullanıcıların metinsel komutlarına dayalı olarak yüksek görsel kalitede bir dakikalık videolar oluşturabilen bir metinden videoya dönüştürücüdür.

Örneğin, aşağıdaki komuta bir göz atın.

"Renkli balıklar ve deniz canlılarıyla dolu, harika bir şekilde işlenmiş bir kağıt sanatı mercan kayalığı dünyası."

Ve işte çıktı videosundan bir kare.

OpenAI Sora tarafından oluşturulan videodan bir kare

Şekil 4. Sora tarafından oluşturulan bir videodan bir kare.

Sora'nın mimarisi, doku üretimi için difüzyon modellerini ve yapısal uyum için Transformer modellerini harmanlayarak bunu mümkün kılıyor. Şimdiye kadar Sora'ya erişim, riskleri anlamak ve geri bildirim almak için kırmızı takım uzmanlarına ve seçkin bir görsel sanatçı, tasarımcı ve film yapımcısı grubuna verildi.

Link to this sectionStability AI'dan Stable Diffusion 3#

Stability AI, 22 Şubat 2024'te metinden görüntüye oluşturma modeli olan Stable Diffusion 3'ün gelişini duyurdu. Model, diffusion Transformer mimarisini ve flow matching yöntemini birleştiriyor. Henüz teknik bir makale yayınlamadılar ancak dikkat etmen gereken birkaç temel özellik bulunuyor.

Stable Diffusion 3 tarafından oluşturulan, kozmik bir büyü yapan büyücü görseli

Şekil 5. Şu komuta dayalı çıktı görseli: "Karanlık gökyüzüne renkli enerjiden yapılmış "Stable Diffusion 3" yazan kozmik bir büyü yapan, geceleri bir dağın tepesindeki büyücünün epik anime çizimi" (Kaynak)

Stable Diffusion'ın en son modeli; geliştirilmiş performans, görüntü kalitesi ve birden fazla özneli görüntüler oluşturmada doğruluk sunuyor. Stable Diffusion 3 ayrıca 800 milyondan 8 milyara kadar değişen parametrelere sahip çeşitli modeller sunacak. Kullanıcıların ölçeklenebilirlik ve detay konusundaki özel ihtiyaçlarına göre seçim yapmalarına olanak tanıyacak.

Link to this sectionGoogle'dan Lumiere#

23 Ocak 2024'te Google, bir metinden videoya difüzyon modeli olan Lumiere'i kullanıma sundu. Lumiere, kısaca STUNet olarak adlandırılan Space-Time-U-Net adlı bir mimari kullanıyor. Bu, Lumiere'in nesnelerin nerede olduğunu ve bir videoda nasıl hareket ettiklerini anlamasına yardımcı oluyor. Bunu yaparak, pürüzsüz ve gerçekçi videolar oluşturabiliyor.

Google Lumiere tarafından oluşturulan, ukulele çalan bir panda videosundan bir kare

Şekil 6. Şu komuta dayalı oluşturulan bir videodan kare: "Panda evde ukulele çalıyor."

Video başına 80 kare oluşturma yeteneğiyle Lumiere, sınırları zorluyor ve yapay zeka alanında video kalitesi için yeni standartlar belirliyor. İşte Lumiere'in bazı özellikleri:

Görüntüden Videoya: Bir görüntüden ve bir komuttan başlayarak, Lumiere görüntüleri videolara animasyon haline getirebilir.
Stilize Oluşturma: Lumiere, tek bir referans görsel kullanarak belirli stillerde videolar oluşturabilir.
Cinemagraphs: Lumiere, sahnelerin geri kalanı sabit kalırken belirli bir nesnenin hareket etmesi gibi dinamik sahneler oluşturmak için bir görüntü içindeki belirli bölgeleri canlandırabilir.
Video Onarımı (Inpainting): Videodaki kişilerin kıyafetlerini değiştirmek veya arka plan detaylarını değiştirmek gibi videonun bölümlerini değiştirebilir.

Link to this sectionGelecek gelmiş gibi görünüyor#

2024'ün başlangıcı, bilim kurgu filminden fırlamış gibi hissettiren birçok yapay zeka inovasyonunu da beraberinde getirdi. Daha önce imkansız olduğunu söyleyeceğimiz şeyler üzerinde artık çalışılıyor. Gelecek, aşağıdaki keşiflerle pek de uzak görünmüyor.

Link to this sectionElon Musk'tan Neuralink#

Elon Musk'ın Neuralink şirketi, 29 Ocak 2024'te kablosuz beyin çipini bir insana başarıyla yerleştirdi. Bu, insan beyinlerini bilgisayarlara bağlama yolunda dev bir adım. Elon Musk, Neuralink'in 'Telepati' adındaki ilk ürününün geliştirme aşamasında olduğunu paylaştı.

Neuralink implantı

Şekil 7. Neuralink İmplantı

Amaç, özellikle uzuv işlevini kaybetmiş kullanıcıların cihazları düşünceleriyle zahmetsizce kontrol etmelerini sağlamaktır. Potansiyel uygulamalar kolaylığın ötesine uzanıyor. Elon Musk, felçli bireylerin kolayca iletişim kurabildiği bir gelecek hayal ediyor.

Link to this sectionDisney'in HoloTile Zemin'i#

18 Ocak 2024'te Walt Disney Imagineering, HoloTile Floor'u tanıttı. Dünyanın ilk çok kişili, çok yönlü koşu bandı zemini olarak adlandırıldı.

HoloTile zemini üzerindeki Disney Imagineer Lanny Smoot

Şekil 8. Disney Imagineer Lanny Smoot, en son inovasyonu HoloTile zemin üzerinde poz veriyor.

Sürükleyici bir sanal ve artırılmış gerçeklik deneyimi için telekinezi gibi herhangi bir kişi veya nesnenin altında hareket edebilir. Üzerindeyken her yöne yürüyebilir ve çarpışmalardan kaçınabilirsin. Disney'in HoloTile Floor'u, tiyatro sahnelerinde yaratıcı yollarla dans etmek ve hareket etmek için de kurulabilir.

Link to this sectionApple'ın Vision Pro'su#

2 Şubat 2024'te Apple'ın merakla beklenen Vision Pro kulaklığı piyasaya sürüldü. Sanal ve artırılmış gerçeklik deneyimini yeniden tanımlamak için tasarlanmış bir dizi özelliğe ve uygulamaya sahip. Vision Pro kulaklığı; eğlence, üretkenlik ve uzamsal bilişimi harmanlayarak çeşitli bir kitleye hitap ediyor. Apple, üretkenlik araçlarından oyun ve eğlence hizmetlerine kadar 600'den fazla uygulamanın piyasaya sürüldüğünde Vision Pro için optimize edildiğini gururla duyurdu.

Link to this sectionCognition'dan Devin#

12 Mart 2024'te Cognition, Devin adında bir yazılım mühendisliği asistanı yayınladı. Devin, dünyanın ilk otonom yapay zeka yazılım mühendisi girişimidir. Öneriler sunan veya belirli görevleri tamamlayan geleneksel kodlama asistanlarının aksine, Devin ilk konseptten tamamlanmaya kadar tüm yazılım geliştirme projelerini ele almak üzere tasarlanmıştır.

Yeni teknolojiler öğrenebilir, tam uygulamalar oluşturup dağıtabilir, hataları bulup düzeltebilir, kendi modellerini eğitebilir, açık kaynaklı ve üretim kod tabanlarına katkıda bulunabilir ve hatta Upwork gibi sitelerden gerçek geliştirme işleri alabilir.

Devin'i diğer modellerle karşılaştırma

Şekil 9. Devin'in diğer modellerle karşılaştırılması.

Devin, Django ve scikit-learn gibi açık kaynaklı projelerde bulunan gerçek dünya GitHub sorunlarını çözmeleri için ajanlardan talep eden zorlu bir benchmark olan SWE-bench üzerinde değerlendirildi. Önceki %1.96'lık son teknolojiye kıyasla sorunların %13.86'sını uçtan uca doğru bir şekilde çözdü.

Link to this sectionÖnemli diğer gelişmeler#

O kadar çok şey oluyor ki, her şeyi bu makalede ele almak mümkün değil. Ancak, işte bahsedilmesi gereken daha fazla konu.

NVIDIA'nın 21 Mart 2024'te duyurulan LATTE3D ürünü, metin komutlarından anında 3D temsiller oluşturan metinden 3D'ye bir yapay zeka modelidir.
CEO David Holz tarafından ipucu verilen Midjourney'nin yeni metinden videoya dönüştürücüsü Ocak ayında eğitime başladı ve yakında piyasaya sürülmesi bekleniyor.
Yapay zeka PC devrimini ilerleten Lenovo, 8 Ocak 2024'te E Ink Prism teknolojisine sahip ThinkBook 13x ve yüksek performanslı yapay zeka dizüstü bilgisayarlarını piyasaya sürdü.

Link to this sectionYapay zeka trendlerini bizimle takip et!#

2024'ün başlangıcı, yapay zekada çığır açan gelişmelere ve birçok önemli teknolojik kilometre taşına sahne oldu. Ancak bu, yapay zekanın yapabileceklerinin sadece başlangıcı. En son yapay zeka gelişmeleri hakkında daha fazla bilgi edinmek istiyorsan, Ultralytics yanında.

Bilgisayarlı görü ve yapay zeka alanındaki en son katkılarımızı görmek için GitHub depomuza göz at. Ayrıca yapay zekanın üretim ve sağlık gibi endüstrilerde nasıl kullanıldığını görmek için çözüm sayfalarımıza da bakabilirsin.

2024 üretken yapay zeka dalgasıyla başlıyor

Link to this sectionLLM'ler trend oluyor#

Link to this sectionAnthropic'ten Claude 3#

Link to this sectionDatabricks'ten DBRX#

Link to this sectionGoogle'dan Gemini 1.5#

Link to this sectionYapay zekadan çarpıcı görseller#

Link to this sectionOpenAI'dan Sora#

Link to this sectionStability AI'dan Stable Diffusion 3#

Link to this sectionGoogle'dan Lumiere#

Link to this sectionGelecek gelmiş gibi görünüyor#

Link to this sectionElon Musk'tan Neuralink#

Link to this sectionDisney'in HoloTile Zemin'i#

Link to this sectionApple'ın Vision Pro'su#

Link to this sectionCognition'dan Devin#

Link to this sectionÖnemli diğer gelişmeler#

Link to this sectionYapay zeka trendlerini bizimle takip et!#

Explore solutions

Robotikte AI

Lojistikte Yapay Zeka

Perakendede AI

Sağlıkta Yapay Zeka

Üretimde Yapay Zeka

Otomotivde yapay zeka

Tarımda yapay zeka

Robotikte AI

Lojistikte Yapay Zeka

Perakendede AI

Sağlıkta Yapay Zeka

Üretimde Yapay Zeka

Otomotivde yapay zeka

Tarımda yapay zeka

Robotikte AI

Lojistikte Yapay Zeka

Perakendede AI

Sağlıkta Yapay Zeka

Üretimde Yapay Zeka

Otomotivde yapay zeka

Tarımda yapay zeka

Yapay zekanın geleceğini birlikte inşa edelim!