YOLO Vision 2025'i kaçırmayın!
25 Eylül 2025
10:00 — 18:00 BST
Hibrit etkinlik
Yolo Vision 2024

En son OpenAI güncellemeleri: Canvas, Vision İnce Ayarı ve daha fazlası

Abirami Vina

4 dakika okuma

7 Kasım 2024

OpenAI tarafından yayınlanan son ChatGPT güncellemelerine yakından bakarken bize katılın. Canvas'ı, vizyon yetenekleri için ince ayarı ve en son Arama özelliğini keşfedeceğiz.

Eylül ayında OpenAI'ın o1 modellerine son baktığımızdan beri (ki bu modeller akıl yürütmeyi geliştirmek için tasarlanmıştı), ChatGPT'ye birçok yeni ve heyecan verici özellik eklendi. Bu sürümlerin bazıları geliştiricilere yönelikken, diğerleri kullanıcı deneyimini iyileştirmek için tasarlandı. Genel olarak, her yükseltme ChatGPT ile etkileşimleri daha sezgisel ve etkili hale getirmeye yardımcı oluyor.

İşbirlikçi yazma ve kodlama için tasarlanan Canvas gibi güncellemeler ve ChatGPT'nin görüntülerle çalışma şeklini iyileştiren görüntü işleme yetenekleri için ince ayar (fine-tuning), büyük ilgi uyandırdı ve kullanıcıları daha yaratıcı olasılıkları keşfetmeye teşvik etti. Bu arada, yeni API'ler ve adalet testi raporları gibi teknik yükseltmeler, model entegrasyonu ve etik yapay zeka uygulamaları gibi konuları ele alıyor. Gelin, OpenAI'ın en son ChatGPT özelliklerini daha iyi anlamak için derinlemesine inceleyelim!

OpenAI'ın canvas özelliğine genel bakış

Canvas, ChatGPT'nin piyasaya sürülmesinden bu yana kullanıcı arayüzünde (UI) yapılan ilk büyük güncellemedir. İki ekranlı bir düzene, sol kenar çubuğunda istemlere ve sağ taraftaki pencerede yanıtlara sahip yeni bir arayüzdür. Yeni kullanıcı arayüzü, sohbet benzeri tek ekranlı yapının olağan iş akışını ortadan kaldırır ve üretkenliği artırmak amacıyla çoklu görev amaçlarına uygun iki ekranlı bir düzene geçer.

Şekil 1. Canvas, ChatGPT'ye Kullanıcı Arayüzü Güncellemeleri Getiriyor.

Canvas tanıtılmadan önce, ChatGPT'de uzun belgelerle çalışmak, epey yukarı ve aşağı kaydırmak anlamına geliyordu. Yeni düzende, istemler sol kenar çubuğunda görüntülenir ve metin belgesi veya kod parçacığı ekranın çoğunu kaplar. Gerekirse, sol kenar çubuğunun ve çıktı ekranının boyutunu bile özelleştirebilirsiniz. Ayrıca, metnin bir bölümünü veya bir kod bölümünü seçebilir ve tüm belgeyi değiştirmeden belirli bölümü düzenleyebilirsiniz.

Şekil 2. Canvas Kullanarak Metnin Belirli Bölümlerini Düzenleyin.

Canvas'ı kullanırsanız, ChatGPT arayüzünde onu açmak için belirli bir düğme veya geçiş olmadığını fark edeceksiniz. Bunun yerine, GPT-4o modeliyle çalışırken, düzenleme, yazma veya kodlama yaptığınızı algılarsa Canvas otomatik olarak açılır. Daha basit istemler için etkin kalmaz. Manuel olarak açmak isterseniz, "Canvas'ı Aç" veya "Bana Canvas düzenini getir" gibi istemler kullanabilirsiniz.

Şu anda Canvas beta sürümündedir ve yalnızca GPT-4o ile kullanılabilir. Ancak OpenAI, beta sürümünden çıktığında Canvas'ın tüm ücretsiz kullanıcılar için kullanıma sunulacağını belirtti.

ChatGPT'nin API güncellemeleri

OpenAI, verimliliği, ölçeklenebilirliği ve çok yönlülüğü artırmayı amaçlayan üç yeni ChatGPT API güncellemesi yayınladı. Bu güncellemelerin her birine daha yakından bakalım.

Model damıtma (Model distillation)

Geliştiriciler, OpenAI API'leri aracılığıyla Model Damıtma özelliğini kullanarak, GPT-4o mini gibi daha küçük, maliyet açısından verimli modellerin performansını artırmak için GPT-4o veya o1-preview gibi gelişmiş modellerin çıktılarını kullanabilirler. Model damıtma, daha küçük modelleri daha gelişmiş olanların davranışlarını taklit edecek şekilde eğitmeyi içeren ve onları belirli görevler için daha verimli hale getiren bir işlemdir.

Bu özellik tanıtılmadan önce, geliştiricilerin farklı araçlar kullanarak çeşitli görevleri manuel olarak koordine etmeleri gerekiyordu. Bu görevler arasında veri kümeleri oluşturma, model performansını ölçme ve ince ayar modelleri yer alıyordu ve bu da süreci genellikle karmaşık ve hataya açık hale getiriyordu. Model Damıtma güncellemesi, geliştiricilerin API aracılığıyla gelişmiş modeller tarafından üretilen girdi-çıktı çiftlerini yakalayıp depolayarak veri kümelerini otomatik olarak oluşturmalarını sağlayan bir araç olan Stored Completions'ı kullanmalarına olanak tanır.

Model Damıtma'nın bir diğer özelliği olan Evals (şu anda beta sürümünde), özel değerlendirme komut dosyaları oluşturmaya veya ayrı araçlar kullanmaya gerek kalmadan bir modelin belirli görevlerde ne kadar iyi performans gösterdiğini ölçmeye yardımcı olur. Stored Completions ile oluşturulan veri kümelerini kullanarak ve Evals ile performansı değerlendirerek, geliştiriciler kendi özel GPT modellerine ince ayar yapabilirler.

Şekil 3. Model performansını ölçmek için Evals'ı kullanabilirsiniz.

İstem (Prompt) önbelleğe alma

Çoğu zaman yapay zeka uygulamaları, özellikle de sohbet robotları oluştururken, aynı bağlam (mevcut isteği anlamak için gereken arka plan bilgileri veya önceki konuşma geçmişi) birden çok API çağrısı için tekrar tekrar kullanılır. İstem Önbelleğe Alma, geliştiricilerin yakın zamanda kullanılan girdi belirteçlerini (token) (modelin istemi anlamak ve bir yanıt oluşturmak için işlediği metin parçaları) yeniden kullanmalarını mümkün kılarak maliyeti ve gecikmeyi azaltmaya yardımcı olur.

OpenAI, 1 Ekim'den itibaren GPT-4o, GPT-4o mini, o1-preview ve o1-mini gibi modellerine otomatik olarak İstem Önbelleğe Alma uyguladı. Bu, geliştiricilerin uzun bir istemle (1.024'ten fazla belirteç) bir modelle etkileşim kurmak için API'yi kullandıklarında, sistemin zaten işlediği kısımları kaydettiği anlamına gelir. 

Bu sayede, aynı veya benzer istemler tekrar kullanılırsa, bu kısımları yeniden hesaplamayı atlayabilir. Sistem, daha önce karşılaştığı istemin en uzun bölümünü otomatik olarak önbelleğe alır ve 1.024 belirteçle başlayıp istem uzadıkça 128 belirteçlik parçalar halinde ekler.

Gerçek Zamanlı API

Bir sesli asistan oluşturmak genellikle sesi metne dönüştürmeyi, metni işlemeyi ve ardından yanıtı çalmak için sese geri dönüştürmeyi gerektirir. OpenAI'ın Gerçek Zamanlı API'si, tüm bu süreci tek bir API isteğiyle ele almayı amaçlar. API, süreci basitleştirerek yapay zeka ile gerçek zamanlı konuşmaları mümkün kılar. 

Örneğin, Gerçek Zamanlı API ile entegre edilmiş bir sesli asistan, kullanıcı isteklerine göre sipariş verme veya bilgi bulma gibi belirli eylemleri gerçekleştirebilir. API, sesli asistanı daha duyarlı hale getirir ve kullanıcıların ihtiyaçlarına hızla uyum sağlayabilmesini sağlar. Gerçek Zamanlı API, 1 Ekim'de altı sesle halka açık beta sürümü olarak kullanıma sunuldu. 30 Ekim'de beş ses daha eklendi ve toplamda on bir ses kullanıma sunuldu.

Şekil 4. Yeni bir dilde konuşma pratiği yapmak için Gerçek Zamanlı API kullanma örneği.

Görüntü işleme görevleri için ChatGPT'ye ince ayar yapma

Başlangıçta, GPT-4o görsel dil modeli yalnızca metin tabanlı veri kümeleri kullanılarak ince ayar yapılabiliyor ve özelleştirilebiliyordu. Şimdi, görsel ince ayar API'sinin yayınlanmasıyla, geliştiriciler görüntü veri kümelerini kullanarak GPT-4o'yu eğitebilir ve özelleştirebilir. Yayınlandığından beri, görsel ince ayar, geliştiriciler ve bilgisayar görüşü mühendisleri arasında büyük bir ilgi konusu haline geldi.

Geliştiriciler, GPT-4o'nun görme yeteneklerini ince ayar yapmak için 100 ila 50.000 arasında değişen görüntü veri kümeleri kullanabilirler. Veri kümesinin OpenAI tarafından istenen formatla eşleştiğinden emin olduktan sonra, Openai platformuna yüklenebilir ve model belirli uygulamalar için ince ayar yapılabilir. 

Örneğin, bir otomasyon şirketi olan Automat, bir ekran görüntüsü veri kümesini kullanarak GPT-4o'yu eğitti ve bir ekrandaki kullanıcı arayüzü öğelerini bir açıklamaya göre tanımlayabilmesini sağladı. Bu, botların kullanıcı arayüzleriyle etkileşimini kolaylaştırarak Robotik Süreç Otomasyonu'nu (RPA) kolaylaştırmaya yardımcı olur. Model, sabit koordinatlara veya karmaşık seçici kurallarına güvenmek yerine, basit açıklamalara göre kullanıcı arayüzü öğelerini tanımlayabilir, bu da otomasyon kurulumlarını daha uyarlanabilir hale getirir ve arayüzler değiştiğinde bakımlarını kolaylaştırır.

Şekil 5. GPT-4o modelinin ince ayarlı bir sürümünü kullanarak kullanıcı arayüzü öğelerini tespit etme.

ChatGPT'nin adalet ve yanlılık tespiti

Etik kaygılar ve yapay zeka uygulamaları, yapay zeka giderek daha gelişmiş hale geldikçe önemli bir tartışma konusudur. ChatGPT'nin yanıtları, kullanıcı tarafından sağlanan istemlere ve İnternet'te bulunan verilere dayandığından, dilini her zaman sorumlu olacak şekilde ince ayarlamak zor olabilir. Raporlar, ChatGPT'nin yanıtlarının isim, cinsiyet ve ırk konusunda önyargılı olduğunu belirtiyor. Bu sorunu çözmek için OpenAI'nin kurum içi ekibi, birinci şahıs bir adalet testi gerçekleştirdi.

İsimler genellikle kültürümüz ve coğrafi faktörler hakkında ince ipuçları taşır. Çoğu durumda, ChatGPT isimlerdeki ince ipuçlarını göz ardı edecektir. Ancak, bazı durumlarda, ırkı veya kültürü yansıtan isimler, ChatGPT'den farklı yanıtlara yol açar ve bunların yaklaşık %1'i zararlı dil yansıtır. Önyargıları ve zararlı dili ortadan kaldırmak, bir dil modeli için zorlu bir görevdir. Ancak, bu bulguları kamuoyuyla paylaşarak ve modelin sınırlamalarını kabul ederek, OpenAI kullanıcıların daha tarafsız, önyargısız yanıtlar elde etmek için istemlerini iyileştirmelerine yardımcı olur. 

Şekil 6. Kullanıcının adından dolayı farklı yanıtların bir örneği.

ChatGPT aramasını anlama

ChatGPT ilk piyasaya sürüldüğünde, yapay zeka topluluğunda geleneksel web'de gezinmenin yerini alıp alamayacağına dair tartışmalar vardı. Artık birçok kullanıcı Google Arama yerine ChatGPT'yi kullanıyor. 

OpenAI'nin yeni güncellemesi olan Arama özelliği, bunu bir adım öteye taşıyor. Arama ile ChatGPT, güncel yanıtlar oluşturur ve ilgili kaynaklara bağlantılar ekler. 31 Ekim itibarıyla Arama özelliği tüm ChatGPT Plus ve Team kullanıcıları tarafından kullanılabilir ve ChatGPT'nin bir yapay zeka destekli arama motoru gibi çalışmasını sağlar.

Şekil 7. ChatGPT'nin yeni Arama özelliğini kullanmanın bir örneği.

Geleceğe doğru

ChatGPT'nin son güncellemeleri, yapay zekayı daha kullanışlı, esnek ve adil hale getirmeye odaklanıyor. Yeni Canvas özelliği, kullanıcıların daha verimli çalışmasına yardımcı olurken, görsel ince ayar, geliştiricilerin modelleri görsel görevleri daha iyi işleyecek şekilde özelleştirmesine olanak tanır. Adaleti ele almak ve önyargıyı azaltmak da temel önceliklerdir ve yapay zekanın kim olduklarına bakılmaksızın herkes için iyi çalışmasını sağlar. İster model ince ayarı yapan bir geliştirici olun, ister yalnızca en son özellikleri kullanıyor olun, ChatGPT çok çeşitli ihtiyaçları karşılamak için gelişiyor. Gerçek zamanlı yetenekler, görsel entegrasyon ve sorumlu kullanıma odaklanma ile bu güncellemeler, herkes için daha güvenilir ve güvenilir bir yapay zeka deneyimi oluşturuyor.

GitHub depomuzu ziyaret ederek ve topluluğumuza katılarak yapay zeka hakkında daha fazla bilgi edinin. Otonom sürüş ve sağlık hizmetlerinde yapay zeka uygulamaları hakkında daha fazla bilgi edinin.

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın
Bağlantı panoya kopyalandı