Yolo Vision Shenzhen
Shenzhen
Şimdi katılın

En son OpenAI güncellemeleri: Canvas, Vision İnce Ayarı ve daha fazlası

Abirami Vina

4 dakika okuma

7 Kasım 2024

OpenAI tarafından yayınlanan son ChatGPT güncellemelerine daha yakından bakarken bize katılın. Canvas'ı, görüş yetenekleri için ince ayarları ve en son Arama özelliğini keşfedeceğiz.

En son Eylül ayında OpenAI'nin o1 modellerini inceledikten sonra (muhakemeyi geliştirmek için tasarlandı), ChatGPT'ye birçok yeni ve heyecan verici özellik eklendi. Bu sürümlerden bazıları geliştiricilere yönelikken, diğerleri kullanıcı deneyimini iyileştirmek için tasarlandı. Genel olarak, her yükseltme ChatGPT ile etkileşimleri daha sezgisel ve etkili hale getirmeye yardımcı oluyor.

İşbirliğine dayalı yazma ve kodlama için tasarlanan Canvas ve ChatGPT 'nin görüntülerle çalışma şeklini iyileştiren görme yetenekleri için ince ayar gibi güncellemeler, kullanıcıları daha yaratıcı olasılıkları keşfetmeye teşvik ederek büyük ilgi uyandırdı. Bu arada, yeni API'ler ve adil test raporları gibi teknik yükseltmeler, model entegrasyonu ve etik yapay zeka uygulamaları gibi konuları ele alıyor. Gelin, OpenAI'ın en yeni ChatGPT özelliklerini daha iyi anlayalım!

OpenAI'ın canvas özelliğine genel bakış

Canvas, piyasaya sürülmesinden bu yana ChatGPT'nin kullanıcı arayüzünde (UI) yapılan ilk büyük güncellemedir. İki ekranlı bir düzen, sol kenar çubuğunda istemler ve sağ yan pencerede yanıtlar içeren yeni bir arayüzdür. Yeni kullanıcı arayüzü, sohbet benzeri tek ekranlı bir yapının olağan iş akışını ortadan kaldırır ve üretkenliği artırmak için çoklu görev amaçlarına uygun iki ekranlı bir düzene geçer.

Şekil 1. Canvas, ChatGPT'ye Kullanıcı Arayüzü Güncellemeleri Getiriyor.

Canvas tanıtılmadan önce, ChatGPT 'de uzun formlu belgelerle çalışmak, biraz yukarı ve aşağı kaydırmak anlamına geliyordu. Yeni düzende, istemler sol kenar çubuğunda görüntülenir ve metin belgesi veya kod parçacığı ekranın büyük bölümünü kaplar. Gerekirse, sol kenar çubuğunun ve çıktı ekranının boyutunu bile özelleştirebilirsiniz. Ayrıca, metnin bir kısmını veya kodun bir bölümünü seçebilir ve belgenin tamamını değiştirmeden belirli bir bölümü düzenleyebilirsiniz.

Şekil 2. Canvas Kullanarak Metnin Belirli Bölümlerini Düzenleyin.

Canvas kullanıyorsanız, ChatGPT arayüzünde onu açmak için özel bir düğme veya geçiş olmadığını fark edeceksiniz. Bunun yerine, GPT-4o modeli ile çalışırken, Canvas düzenleme, yazma veya kodlama yaptığınızı algılarsa otomatik olarak açılır. Daha basit istemler için etkin değildir. Manuel olarak açmak isterseniz, "Tuvali aç" veya "Bana Tuval düzenini getir" gibi komutları kullanabilirsiniz.

Şu anda Canvas beta sürümündedir ve yalnızca GPT-4o ile kullanılabilir. Ancak OpenAI, beta sürümünden çıktığında Canvas'ın tüm ücretsiz kullanıcılar için kullanıma sunulacağını belirtti.

ChatGPT'nin API güncellemeleri

OpenAI, verimliliği, ölçeklenebilirliği ve çok yönlülüğü artırmayı amaçlayan üç yeni ChatGPT API güncellemesi yayınladı. Şimdi bu güncellemelerin her birine daha yakından bakalım.

Model damıtma (Model distillation)

Geliştiriciler, OpenAI API'leri aracılığıyla Model Damıtma özelliğini kullanarak, GPT-4o mini gibi daha küçük, maliyet açısından verimli modellerin performansını artırmak için GPT-4o veya o1-preview gibi gelişmiş modellerin çıktılarını kullanabilirler. Model damıtma, daha küçük modelleri daha gelişmiş olanların davranışlarını taklit edecek şekilde eğitmeyi içeren ve onları belirli görevler için daha verimli hale getiren bir işlemdir.

Bu özellik tanıtılmadan önce, geliştiricilerin farklı araçlar kullanarak çeşitli görevleri manuel olarak koordine etmeleri gerekiyordu. Bu görevler arasında veri kümeleri oluşturma, model performansını ölçme ve ince ayar modelleri yer alıyordu ve bu da süreci genellikle karmaşık ve hataya açık hale getiriyordu. Model Damıtma güncellemesi, geliştiricilerin API aracılığıyla gelişmiş modeller tarafından üretilen girdi-çıktı çiftlerini yakalayıp depolayarak veri kümelerini otomatik olarak oluşturmalarını sağlayan bir araç olan Stored Completions'ı kullanmalarına olanak tanır.

Model Damıtma'nın bir diğer özelliği olan Evals (şu anda beta sürümünde), özel değerlendirme komut dosyaları oluşturmaya veya ayrı araçlar kullanmaya gerek kalmadan bir modelin belirli görevlerde ne kadar iyi performans gösterdiğini ölçmeye yardımcı olur. Stored Completions ile oluşturulan veri kümelerini kullanarak ve Evals ile performansı değerlendirerek, geliştiriciler kendi özel GPT modellerine ince ayar yapabilirler.

Şekil 3. Model performansını ölçmek için Evals'ı kullanabilirsiniz.

İstem (Prompt) önbelleğe alma

Çoğu zaman yapay zeka uygulamaları, özellikle de sohbet robotları oluştururken, aynı bağlam (mevcut isteği anlamak için gereken arka plan bilgileri veya önceki konuşma geçmişi) birden çok API çağrısı için tekrar tekrar kullanılır. İstem Önbelleğe Alma, geliştiricilerin yakın zamanda kullanılan girdi belirteçlerini (token) (modelin istemi anlamak ve bir yanıt oluşturmak için işlediği metin parçaları) yeniden kullanmalarını mümkün kılarak maliyeti ve gecikmeyi azaltmaya yardımcı olur.

OpenAI, 1 Ekim'den itibaren GPT-4o, GPT-4o mini, o1-preview ve o1-mini gibi modellerine otomatik olarak İstem Önbelleğe Alma uyguladı. Bu, geliştiricilerin uzun bir istemle (1.024'ten fazla belirteç) bir modelle etkileşim kurmak için API'yi kullandıklarında, sistemin zaten işlediği kısımları kaydettiği anlamına gelir. 

Bu sayede, aynı veya benzer istemler tekrar kullanılırsa, bu kısımları yeniden hesaplamayı atlayabilir. Sistem, daha önce karşılaştığı istemin en uzun bölümünü otomatik olarak önbelleğe alır ve 1.024 belirteçle başlayıp istem uzadıkça 128 belirteçlik parçalar halinde ekler.

Gerçek Zamanlı API

Bir sesli asistan oluşturmak genellikle sesi metne dönüştürmeyi, metni işlemeyi ve ardından yanıtı çalmak için sese geri dönüştürmeyi gerektirir. OpenAI'ın Gerçek Zamanlı API'si, tüm bu süreci tek bir API isteğiyle ele almayı amaçlar. API, süreci basitleştirerek yapay zeka ile gerçek zamanlı konuşmaları mümkün kılar. 

Örneğin, Gerçek Zamanlı API ile entegre edilmiş bir sesli asistan, kullanıcı isteklerine göre sipariş verme veya bilgi bulma gibi belirli eylemleri gerçekleştirebilir. API, sesli asistanı daha duyarlı hale getirir ve kullanıcıların ihtiyaçlarına hızla uyum sağlayabilmesini sağlar. Gerçek Zamanlı API, 1 Ekim'de altı sesle halka açık beta sürümü olarak kullanıma sunuldu. 30 Ekim'de beş ses daha eklendi ve toplamda on bir ses kullanıma sunuldu.

Şekil 4. Yeni bir dilde konuşma pratiği yapmak için Gerçek Zamanlı API kullanma örneği.

Görme görevleri için ChatGPT 'ye ince ayar yapma

Başlangıçta, GPT-4o görsel dil modeli yalnızca metin tabanlı veri kümeleri kullanılarak ince ayar yapılabiliyor ve özelleştirilebiliyordu. Şimdi, görsel ince ayar API'sinin yayınlanmasıyla, geliştiriciler görüntü veri kümelerini kullanarak GPT-4o'yu eğitebilir ve özelleştirebilir. Yayınlandığından beri, görsel ince ayar, geliştiriciler ve bilgisayar görüşü mühendisleri arasında büyük bir ilgi konusu haline geldi.

Geliştiriciler, GPT-4o'nun görme yeteneklerini ince ayar yapmak için 100 ila 50.000 arasında değişen görüntü veri kümeleri kullanabilirler. Veri kümesinin OpenAI tarafından istenen formatla eşleştiğinden emin olduktan sonra, Openai platformuna yüklenebilir ve model belirli uygulamalar için ince ayar yapılabilir. 

Örneğin, bir otomasyon şirketi olan Automat, bir ekran görüntüsü veri kümesini kullanarak GPT-4o'yu eğitti ve bir ekrandaki kullanıcı arayüzü öğelerini bir açıklamaya göre tanımlayabilmesini sağladı. Bu, botların kullanıcı arayüzleriyle etkileşimini kolaylaştırarak Robotik Süreç Otomasyonu'nu (RPA) kolaylaştırmaya yardımcı olur. Model, sabit koordinatlara veya karmaşık seçici kurallarına güvenmek yerine, basit açıklamalara göre kullanıcı arayüzü öğelerini tanımlayabilir, bu da otomasyon kurulumlarını daha uyarlanabilir hale getirir ve arayüzler değiştiğinde bakımlarını kolaylaştırır.

Şekil 5. UI öğelerini detect etmek için GPT-4o modelinin ince ayarlanmış bir versiyonunun kullanılması.

ChatGPT adaleti ve önyargı tespiti

Yapay zeka uygulamaları ile ilgili etik kaygılar, yapay zeka giderek daha da geliştikçe önemli bir tartışma konusu haline gelmektedir. ChatGPT'nin yanıtları kullanıcı tarafından sağlanan istemlere ve internette bulunan verilere dayandığından, dilini her zaman sorumlu olacak şekilde ince ayar yapmak zor olabilir. Raporlar ChatGPT'nin yanıtlarının isim, cinsiyet ve ırk konusunda önyargılı olduğunu belirtiyor. Bu sorunu ele almak için OpenAI'nin kurum içi ekibi birinci şahıs adalet testi gerçekleştirdi.

İsimler genellikle kültürümüz ve coğrafi faktörler hakkında ince ipuçları taşır. Çoğu durumda, ChatGPT isimlerdeki ince ipuçlarını görmezden gelecektir. Bununla birlikte, bazı durumlarda, ırk veya kültürü yansıtan isimler ChatGPT'den farklı tepkilere yol açar ve bunların yaklaşık %1'i zararlı dili yansıtır. Önyargıları ve zararlı dili ortadan kaldırmak bir dil modeli için zorlu bir görevdir. Ancak OpenAI, bu bulguları kamuyla paylaşarak ve modelin sınırlamalarını kabul ederek, kullanıcıların daha tarafsız ve önyargısız yanıtlar elde etmek için istemlerini iyileştirmelerine yardımcı olmaktadır. 

Şekil 6. Kullanıcının adından dolayı farklı yanıtların bir örneği.

ChatGPT aramasını anlama

ChatGPT ilk piyasaya sürüldüğünde, AI topluluğunda geleneksel web taramasının yerini alıp alamayacağı konusunda tartışmalar vardı. Şimdi ise pek çok kullanıcı Google Arama yerine ChatGPT 'yi kullanıyor. 

OpenAI'nin yeni güncellemesi olan Arama özelliği bunu bir adım öteye taşıyor. Arama ile ChatGPT güncel yanıtlar üretiyor ve ilgili kaynaklara bağlantılar içeriyor. 31 Ekim itibariyle tüm ChatGPT Plus ve Team kullanıcıları tarafından kullanılabilen Arama özelliği, ChatGPT 'nin yapay zeka destekli bir arama motoru gibi çalışmasını sağlıyor.

Şekil 7. ChatGPT'nin yeni Arama özelliğinin kullanımına bir örnek.

Geleceğe doğru

ChatGPT'nin son güncellemeleri yapay zekayı daha kullanışlı, esnek ve adil hale getirmeye odaklanıyor. Yeni Canvas özelliği kullanıcıların daha verimli çalışmasına yardımcı olurken, görüş ince ayarı geliştiricilerin modelleri görsel görevleri daha iyi yerine getirecek şekilde özelleştirmesine olanak tanıyor. Adaleti ele almak ve önyargıları azaltmak da temel öncelikler arasında yer alıyor ve yapay zekanın kim olursa olsun herkes için iyi çalışmasını sağlıyor. İster modellere ince ayar yapan bir geliştirici olun, ister sadece en yeni özellikleri kullanıyor olun, ChatGPT çok çeşitli ihtiyaçları karşılamak için gelişiyor. Gerçek zamanlı yetenekler, görsel entegrasyon ve sorumlu kullanıma odaklanan bu güncellemeler, herkes için daha güvenilir ve güvenilir bir yapay zeka deneyimi oluşturuyor.

GitHub depomuzu ziyaret ederek ve topluluğumuza katılarak yapay zeka hakkında daha fazla bilgi edinin. Otonom sürüş ve sağlık hizmetlerinde yapay zeka uygulamaları hakkında daha fazla bilgi edinin.

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın