OpenAI o1: Yapay zeka muhakemesi için yeni bir OpenAI modelleri serisi

Abirami Vina

5 dakika okuma

13 Eylül 2024

Yeni piyasaya sürülen OpenAI o1 modelleri ve onları özel kılan özellikler hakkında bilgi edinin. Ayrıca nasıl çalıştıklarına ve yapay zekanın geleceği üzerindeki etkilerine de bir göz atacağız.

Yapay zeka topluluğu, OpenAI'nin GPT modellerinin bir sonraki adımı hakkında spekülasyonlarla çalkalanıyor ve birçok kişi bundan "Çilek Projesi" olarak bahsediyor. Bunun arkasındaki neden, GPT-4o 'ya "çilek" kelimesinde kaç R olduğunu sorarsanız, size"çilek" kelimesinde iki R olduğunu söyleyecektir. GPT-4o'nun ne kadar güçlü olduğu düşünüldüğünde bu garip görünebilir. Ancak, model tam kelimeleri değil, alt metni işlemek üzere tasarlanmıştır. Bir sonraki modelin bunu çözmeyi amaçlayacağı söyleniyordu. Sam Altman, X (eski adıyla Twitter) hesabında çilek resimleri yayınlayarak bu söylentileri daha da körükledi.

OpenAI'nin 12 Eylül Perşembe günü yaptığı son duyuru ile nihayet spekülasyonlara bir cevap bulduk! Yanıt vermeden önce yavaşlamak ve düşünmek üzere tasarlanmış yeni bir yapay zeka modeli serisi olan OpenAI o1 yayınlandı. İlginç bir şekilde, OpenAI o1 daha iyi mantık yürütebiliyor ve çileklerle ilgili soruyu doğru yanıtlayabiliyor! Bu makalede, OpenAI o1'in ne olduğunu, nasıl çalıştığını, nerede kullanılabileceğini ve yapay zekanın geleceği için ne anlama geldiğini tartışacağız. Haydi başlayalım!

__wf_reserved_inherit
Şekil 1. OpenAI o1'e çilek hakkında soru sorma örneği.

OpenAI tarafından yapay zekada yeni gelişmeler

Temmuz 2024'te OpenAI yöneticileri, OpenAI'nin araştırmalarının yapay zekanın 2. seviyesi olarak adlandırılan insani problem çözme seviyesine yaklaştığını paylaştı. OpenAI yeni model serisi OpenAI o1'i cevap vermeden önce düşünme olarak tanıttığından, bu seviyenin muhakeme üzerine odaklandığı açıktır. OpenAI o1 yeni bir LLM (büyük dil modeli), büyük miktarlardaki dil verilerinden kalıplar öğrenerek insan benzeri metinleri anlayan ve üreten bir yapay zeka modeli. Derinlemesine muhakeme gerektiren karmaşık sorunların üstesinden gelmek için tasarlanmıştır. 

__wf_reserved_inherit
Şekil 2. OpenAI'nin Yapay Zekanın Aşamalarına Bakış Açısı.

Model, eylemleri için ödüller veya cezalar alarak modelin deneme yanılma yoluyla daha iyi kararlar vermeyi öğrendiği bir teknik olan pekiştirmeli öğrenme kullanılarak eğitilmiştir. Takviyeli öğrenme algoritması, modelin bir düşünce zincirini takip ederek daha etkili düşünmesine yardımcı oluyor. OpenAI ayrıca, o1'in performansının eğitim sırasında daha fazla takviye öğrenme ve problem çözme sırasında daha fazla "düşünme" süresi ile artmaya devam ettiğini paylaştı; bu da hem uzun süreli eğitimin hem de düşünceli işlemenin modelin yeteneklerini artırmaya yardımcı olduğunu gösteriyor.

OpenAI o1 karmaşık muhakeme için önemli bir ilerleme olsa da, hala erken bir modeldir ve ChatGPT'yi kullanışlı kılan web'de gezinme veya dosya ve görüntü yükleme gibi bazı özelliklerden yoksundur. Birçok yaygın görev için GPT-4o şimdilik daha yetenekli olabilir. Ancak OpenAI o1, yapay zekanın karmaşık muhakeme yeteneğinde ileriye doğru büyük bir adıma işaret ediyor, bu nedenle OpenAI yeni bir seri başlatıyor ve buna OpenAI o1 adını veriyor.

Yeni OpenAI modelleri yapay zeka muhakemesini nasıl geliştiriyor?

OpenAI o1, şifreleri çözmek, programlama zorluklarını çözmek, matematik problemlerini yanıtlamak, bulmacaların üstesinden gelmek ve hatta bilim, güvenlik ve sağlık alanlarındaki karmaşık konuları ele almak gibi görevler için kullanılabilir. Projenin kod adına eğlenceli bir gönderme yapan OpenAI, "ÇİLEKTE ÜÇ R VARDIR" mesajını ortaya çıkaran bir şifreyi kırarak modelin muhakeme becerilerini gösterdi. 

OpenAI o1, şifreleri çözmenin ötesinde kodlama konusunda da yeteneklidir. Programcıların zamana bağlı koşullar altında karmaşık kodlama problemlerini çözdüğü bir platform olan Codeforces'ta olduğu gibi rekabetçi programlama mücadelelerinde iyi performans gösteriyor. Bu yarışmalarda model yüksek Elo dereceleri (diğer rakiplere karşı performansa dayalı beceri seviyelerini ölçen bir puanlama sistemi) elde ediyor ve önceki modellerden daha iyi performans gösteriyor. Ayrıca matematikte de başarılıdır ve American Invitational Mathematics Examination (AIME) gibi sınavlarda iyi performans gösterir. 

__wf_reserved_inherit
Şekil 3. o1'in Kodlama Yeteneklerinin Kıyaslanması.

Bu gelişmeler OpenAI o1'i GPT-4o gibi önceki modellere göre önemli bir yükseltme olarak konumlandırıyor. İş dünyası, geliştirme, araştırma ve sağlık hizmetleri gibi alanlarda yapay zeka için yeni olasılıkların önünü açıyor. Örneğin, genetik araştırmalarında, OpenAI o1 çok sayıda araştırma makalesini hızlı bir şekilde gözden geçirebilir, önemli bulguları ve genetik belirteçler ile hastalıklar arasındaki bağlantıları seçebilir. Karmaşık bilimsel dili anlayabilir ve önemli noktaları özetleyerek araştırmacıların en alakalı bilgilere odaklanmasına yardımcı olabilir. 

Düşünce zincirine daha yakından bir bakış

Daha önce OpenAI o1'in bir "Düşünce Zinciri" muhakeme süreci sunduğunu görmüştük. Bu, modelin karmaşık sorunları insan bilişsel stratejilerine benzer bir şekilde ele almasını sağlar. Model, zorlukları daha küçük, yönetilebilir adımlara ayırabilir ve yaklaşımını yinelemeli olarak iyileştirebilir. Anında örüntü tanımaya dayanan önceki modellerin aksine, o1 birden fazla muhakeme yolunu keşfederek, takviye öğrenme yoluyla hem başarılardan hem de hatalardan öğrenerek karar verme sürecini optimize eder.

OpenAI, bu ham düşünce zincirlerini kullanıcılardan gizli tutmaya karar verdi, bunun yerine her adımı açığa çıkarmadan modelin muhakemesine ilişkin içgörü sağlayan özetler sunuyor. Bu karar, modelin düşünce sürecinin kötüye kullanılmasını önlemeye yardımcı olurken, geliştiricilerin yapay zeka güvenliğini ve uyumunu izlemelerine ve iyileştirmelerine olanak tanıyor. Geliştiriciler, gizli zincirleri dahili olarak gözlemleyerek o1'in etik kurallara uymasını ve zararlı davranışlardan kaçınmasını sağlayabilir.

OpenAI o1'in kıyaslanması

OpenAI o1, akıl yürütme ve problem çözme yeteneklerini test eden çeşitli ölçütlerde GPT-4o'ya göre büyük gelişmeler gösterdi. En iyi lise öğrencileri için zorlu bir matematik sınavı olan American Invitational Mathematics Examination (AIME) 2024'te o1, GPT-4o'nun %12'sine kıyasla problem başına sadece bir örnekle %74 doğruluk oranı elde etti. 64 örnekte fikir birliği sağlandığında doğruluk oranı %83'e yükselmiş ve 1.000 örnekle rafine bir yeniden sıralama yöntemi kullanıldığında %93'e ulaşarak ulusal düzeyde ilk 500 öğrenci arasına girmiştir. 

Matematiğin ötesinde o1, kimya, fizik ve biyoloji alanlarında doktora düzeyinde soruları kapsayan GPQA Diamond gibi bilimsel bilgiyi test eden ölçütlerde de olağanüstü iyi performans gösterdi. Dikkat çekici bir şekilde, o1 bu testte doktoralı insan uzmanlardan daha iyi performans gösterdi ve bunu yapan ilk yapay zeka modeli oldu. Ayrıca, tarih, hukuk ve bilim de dahil olmak üzere çeşitli konularda anlayışı test eden MMLU karşılaştırmasında 57 kategoriden 54'ünde GPT-4o'yu geride bıraktı.

__wf_reserved_inherit
Şekil 4. OpenAI o1'in kıyaslanması.

OpenAI o1 ile uygulamalı eğitim alın

OpenAI, o1 serisinde iki yeni yapay zeka modelini tanıttı: o1-preview ve o1-mini. o1-preview modeli, yanıt vermeden önce daha derinlemesine düşünmek için tasarlanmıştır ve bilim, kodlama ve matematik alanlarındaki karmaşık muhakeme görevlerinde mükemmeldir. Zorlu projelerle uğraşan kullanıcılar için gelişmiş problem çözme yetenekleri sunar. Buna karşılık o1-mini, özellikle matematik ve kodlama olmak üzere STEM muhakemesi için özel olarak optimize edilmiş daha küçük, daha hızlı ve daha uygun maliyetli bir modeldir. Daha az geniş dünya bilgisine sahip olsa da, o1-mini, AIME matematik yarışması ve Codeforces kodlama zorlukları gibi önemli değerlendirmelerde o1-preview'un performansına neredeyse eşleşir ve bunların tümü %80 daha az maliyetlidir.

__wf_reserved_inherit
Şekil 5. OpenAI Modellerinin Karşılaştırılması.

Bu modelleri çeşitli OpenAI platformları aracılığıyla deneyebilirsiniz. ChatGPT Plus ve Team kullanıcıları, model seçici aracılığıyla hem o1-preview hem de o1-mini'ye erişebilir ve gelişmiş muhakeme yeteneklerini doğrudan ChatGPT'de deneyimleyebilir. API kullanım kademesi 5 erişimi olan geliştiriciler bu modellerle prototip oluşturmaya başlayabilir, ancak bazı gelişmiş özellikler hala geliştirme aşamasındadır. OpenAI ayrıca o1-mini'yi yakında tüm ChatGPT Free kullanıcıları için kullanılabilir hale getirmeyi planlıyor. Bu modelleri keşfederek, yapay zeka muhakemesindeki gelişmeleri ilk elden deneyimleyebilir ve ihtiyaçlarınıza en uygun olanı seçebilirsiniz.

OpenAI tarafından yapılan etik YZ değerlendirmeleri

OpenAI, o1 model serisini geliştirirken etik ve güvenlik konularına odaklanmıştır. O1-preview ve o1-mini modellerini piyasaya sürmeden önce, izin verilmeyen içerik, halüsinasyon ve önyargı gibi risklere karşı harici testler ve dahili kontroller de dahil olmak üzere kapsamlı değerlendirmeler yaptılar. Modeller, güvenlik kurallarını daha iyi anlamak ve takip etmek için gelişmiş muhakeme yetenekleriyle tasarlanmıştır. 

OpenAI, riskleri yönetmek için blok listeleri ve güvenlik sınıflandırıcıları gibi önlemler de uygulamıştır. o1 modeli orta genel risk derecesine sahiptir. Siber güvenlik ve model özerkliği gibi alanlarda düşük, CBRN (Kimyasal, Biyolojik, Radyolojik ve Nükleer) içerik ve ikna gibi alanlarda ise orta risklere sahiptir. OpenAI'nin Güvenlik Danışma Grubu ve Yönetim Kurulu, modelin kullanımının güvenli ve etik olmasını sağlamak için bu güvenlik önlemlerini gözden geçirmiştir.

__wf_reserved_inherit
Şekil 6. OpenAI o1 Puan Kartı.

Söylentilerden gerçeğe: OpenAI o1 sahneye çıkıyor

OpenAI o1, yapay zeka muhakemesinde ileriye doğru atılmış büyük bir adımdır ve ilk söylentilerden bazılarını gerçeğe dönüştürmektedir. GPT-4o'nun aksine, o1 serisi "Düşünce Zinciri" yaklaşımını kullanarak daha derinlemesine düşünüyor ve karmaşık sorunları daha iyi yanıtlar için daha küçük adımlara ayırıyor. Şu anda ChatGPT ve API'de erken önizleme olarak mevcut olan OpenAI, web'de gezinme, dosya ve resim yükleme gibi özellikler eklemeyi planlıyor. OpenAI ayrıca, yeni OpenAI o1 serisinin yanı sıra GPT serisindeki modelleri geliştirmeye ve yayınlamaya devam etmeyi planladıklarını da paylaştı. Yapay zeka gelişmeye devam ettikçe, bu gibi gelişmeler insan ihtiyaçlarına daha iyi yardımcı olabilecek ve anlayabilecek daha güçlü, sezgisel ve çok yönlü yapay zeka sistemlerinin önünü açıyor.

Topluluğumuza katılarak yapay zeka alanındaki en son gelişmeleri takip edin! Üretim ve sağlık gibi sektörlerde yapay zeka çözümlerine nasıl öncülük ettiğimizi görmek için GitHub depomuza gidin. 🚀

Yapay zekanın gelecekteki
adresini birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın
Panoya kopyalanan bağlantı