OpenAI o1: Yapay zeka akıl yürütme için yeni bir OpenAI modelleri serisi
Yeni piyasaya sürülen OpenAI o1 modelleri hakkında bilgi edin ve onları özel kılan şeyin ne olduğunu öğren. Ayrıca nasıl çalıştıklarına ve yapay zekanın geleceği üzerindeki etkilerine bir göz atacağız.

Yapay zeka topluluğu, OpenAI’s GPT models için atılacak bir sonraki adım hakkında spekülasyonlarla çalkalanıyor ve birçoğu bunu "Proje Çilek" (Project Strawberry) olarak adlandırıyor. Bunun nedeni, eğer prompt GPT-4o aracılığıyla "strawberry" kelimesinde kaç tane R harfi olduğunu sorarsan, sana "strawberry" kelimesinde iki tane R harfi olduğunu söyleyecektir. GPT-4o'nun ne kadar güçlü olduğu düşünüldüğünde bu garip görünebilir. Ancak model, tam kelimelerden ziyade alt metni işlemek üzere oluşturulmuştur. Bir sonraki modelin bunu çözmeyi amaçlayacağı söylentileri yayılmıştı. Sam Altman, X (formerly known as Twitter) account üzerinde çilek fotoğrafları paylaşarak bu söylentileri daha da körükledi.
12 Eylül Perşembe günü yapılan OpenAI’nın son duyurusuyla, nihayet spekülasyonlara bir cevap bulduk! Yanıt vermeden önce yavaşlayıp düşünmek üzere tasarlanmış yeni bir yapay zeka modeli serisi olan OpenAI o1 yayınlandı. İlginç bir şekilde OpenAI o1, daha iyi muhakeme yapabiliyor ve çileklerle ilgili soruyu doğru cevaplayabiliyor! Bu makalede OpenAI o1'in ne olduğunu, nasıl çalıştığını, nerede kullanılabileceğini ve yapay zekanın geleceği için ne anlama geldiğini tartışacağız. Hadi başlayalım!

Şekil 1. OpenAI o1'e çileklerle ilgili soru sorma örneği.
Link to this sectionOpenAI tarafından yapay zekada yeni gelişmeler#
Temmuz 2024'te OpenAI yöneticileri, OpenAI'ın araştırmalarının yapay zeka 2. seviye olarak adlandırılan insan seviyesinde problem çözmeye yaklaştığını paylaştı. OpenAI, yeni model serisi OpenAI o1'i cevap vermeden önce düşünen bir model olarak tanıttığından, bu seviyenin muhakemeye odaklandığı açıktır. OpenAI o1, devasa dil verilerinden kalıpları öğrenerek insan benzeri metinleri anlayan ve üreten yeni bir LLM (büyük dil modeli) modelidir. Derinlemesine muhakeme gerektiren karmaşık sorunları ele almak üzere tasarlanmıştır.

Şekil 2. OpenAI'ın Yapay Zeka Aşamalarına Bakışı.
The model has been trained using reinforcement learning, a technique where the model learns to make better decisions through trial and error by receiving rewards or penalties for its actions. The reinforcement learning algorithm helps the model think more effectively by following a chain of thought. OpenAI also shared that o1’s performance keeps improving with more reinforcement learning during training and with more time spent "thinking" during problem-solving, showing that both extended training and thoughtful processing help boost the model's abilities.
OpenAI o1 karmaşık muhakeme için önemli bir ilerleme olsa da, henüz erken bir modeldir ve web'de gezinme ya da dosya ve görüntü yükleme gibi ChatGPT'yi kullanışlı kılan bazı özelliklerden yoksundur. Birçok yaygın görev için GPT-4o şimdilik daha yetenekli olabilir. Ancak OpenAI o1, yapay zekanın karmaşık muhakemeyi ele alma yeteneğinde büyük bir ileriye doğru adımı temsil eder; bu nedenle OpenAI yeni bir seri başlatıyor ve buna OpenAI o1 adını veriyor.
Link to this sectionYeni OpenAI modelleri yapay zeka muhakemesini nasıl geliştiriyor?#
OpenAI o1; şifre çözme, programlama zorluklarını çözme, matematik problemlerini yanıtlama, bulmacaları ele alma ve hatta bilim, güvenlik ve sağlık gibi karmaşık konularda görevler için kullanılabilir. Projenin kod adına eğlenceli bir gönderme olarak OpenAI, "THERE ARE THREE R’S IN STRAWBERRY" mesajını ortaya çıkaran bir şifreyi çözerek modelin muhakeme becerilerini gösterdi.
Şifreleri çözmenin ötesinde OpenAI o1, kodlama konusunda da yeteneklidir. Programcıların süreli koşullar altında karmaşık kodlama problemlerini çözdüğü bir platform olan Codeforces gibi rekabetçi programlama zorluklarında iyi performans gösterir. Bu zorluklarda model, yüksek Elo dereceleri (diğer rakiplere karşı performansa dayalı beceri seviyelerini ölçen bir puanlama sistemi) elde eder ve önceki modellerden daha iyi performans gösterir. Ayrıca matematikte mükemmeldir ve American Invitational Mathematics Examination (AIME) gibi sınavlarda iyi sonuçlar verir.

Şekil 3. o1'in Kodlama Yeteneklerinin Kıyaslanması.
Bu gelişmeler, OpenAI o1'i GPT-4o gibi önceki modellere göre önemli bir yükseltme olarak konumlandırıyor. İş dünyası, geliştirme, araştırma ve sağlık gibi alanlarda yapay zeka için yeni olanaklar açıyor. Örneğin, genetik araştırmalarında, OpenAI o1 çok sayıda araştırma makalesini hızla inceleyebilir, temel bulguları ve genetik belirteçler ile hastalıklar arasındaki bağlantıları seçebilir. Karmaşık bilimsel dili anlar ve önemli noktaları özetleyerek araştırmacıların en alakalı bilgilere odaklanmasına yardımcı olabilir.
Link to this sectionDüşünce zincirine daha yakından bakış#
We saw earlier that OpenAI o1 introduces a "Chain of Thought" reasoning process. It enables the model to tackle complex problems in a manner similar to human cognitive strategies. The model can break down challenges into smaller, manageable steps and iteratively refine its approach. Unlike earlier models that relied on immediate pattern recognition, o1 optimizes its decision-making by exploring multiple reasoning paths, learning from both successes and mistakes through reinforcement learning.
OpenAI, bu ham düşünce zincirlerini kullanıcılardan gizli tutmaya ve bunun yerine her adımı ifşa etmeden modelin muhakemesine dair içgörü sağlayan özetler sunmaya karar verdi. Bu karar, modelin düşünce sürecinin kötüye kullanılmasını önlemeye yardımcı olurken, geliştiricilerin yapay zeka güvenliğini ve uyumunu izlemesine ve iyileştirmesine olanak tanır. Geliştiriciler, gizli zincirleri dahili olarak gözlemleyerek o1'in etik kurallara bağlı kaldığından ve zararlı davranışlardan kaçındığından emin olabilirler.
Link to this sectionOpenAI o1'in kıyaslanması#
OpenAI o1, muhakeme ve problem çözme yeteneklerini test eden çeşitli kıyaslamalarda GPT-4o'ya göre büyük gelişmeler gösteriyor. Üst düzey lise öğrencileri için zorlu bir matematik sınavı olan American Invitational Mathematics Examination (AIME) 2024'te o1, problem başına sadece bir örnekle %74 doğruluk oranı elde ederken, GPT-4o %12'de kaldı. 64 örnek üzerinden fikir birliği ile doğruluğu %83'e yükseldi ve 1.000 örnekle geliştirilmiş yeniden sıralama yöntemi kullanarak %93'e ulaşarak ulusal çapta ilk 500 öğrenci arasına girdi.
Matematiğin ötesinde o1; kimya, fizik ve biyoloji alanlarında doktora seviyesindeki soruları kapsayan GPQA Diamond gibi bilimsel bilgileri test eden kıyaslamalarda da olağanüstü bir performans sergiledi. Dikkat çekici bir şekilde o1, bu testte doktora derecesine sahip insan uzmanlardan daha iyi performans gösterdi ve bunu başaran ilk yapay zeka modeli oldu. Ayrıca tarih, hukuk ve bilim dahil olmak üzere çeşitli konularda anlayışı test eden MMLU kıyaslamasındaki 57 kategorinin 54'ünde GPT-4o'dan daha iyi performans gösterdi.

Şekil 4. OpenAI o1'in Kıyaslanması.
Link to this sectionOpenAI o1 ile uygulamalı deneyim#
OpenAI, o1 serisinde iki yeni yapay zeka modeli tanıttı: o1-preview ve o1-mini. o1-preview modeli, yanıt vermeden önce daha derinlemesine düşünecek şekilde tasarlanmış olup bilim, kodlama ve matematik alanındaki karmaşık muhakeme görevlerinde üstündür. Zorlu projeler üzerinde çalışan kullanıcılar için gelişmiş problem çözme yetenekleri sunar. Buna karşılık o1-mini, özellikle STEM muhakemesi, özellikle matematik ve kodlama için optimize edilmiş daha küçük, daha hızlı ve daha uygun maliyetli bir modeldir. Daha geniş bir dünya bilgisine sahip olmasa da o1-mini, AIME matematik yarışması ve Codeforces kodlama zorlukları gibi önemli değerlendirmelerde o1-preview'in performansına %80 daha düşük maliyetle neredeyse yaklaşıyor.

Şekil 5. OpenAI Modellerinin Karşılaştırılması.
Bu modelleri çeşitli OpenAI platformları aracılığıyla deneyebilirsin. ChatGPT Plus ve Team kullanıcıları, model seçici aracılığıyla hem o1-preview hem de o1-mini'ye erişebilir ve ChatGPT içinde doğrudan gelişmiş muhakeme yeteneklerini deneyimleyebilirler. API kullanım seviyesi 5 erişimine sahip geliştiriciler, bazı gelişmiş özellikler henüz geliştirme aşamasında olsa da bu modellerle prototip oluşturmaya başlayabilirler. OpenAI ayrıca o1-mini'yi yakında tüm ChatGPT Free kullanıcılarına sunmayı planlıyor. Bu modelleri keşfederek, yapay zeka muhakemesindeki ilerlemeleri ilk elden deneyimleyebilir ve ihtiyaçlarına en uygun olanı seçebilirsin.
Link to this sectionOpenAI tarafından dikkate alınan etik yapay zeka hususları#
OpenAI, o1 model serisini geliştirirken etik ve güvenliğe odaklandı. o1-preview ve o1-mini modellerini piyasaya sürmeden önce, izin verilmeyen içerik, halüsinasyonlar ve önyargı gibi risklere karşı harici testler ve dahili kontroller dahil olmak üzere kapsamlı değerlendirmeler yaptılar. Modeller, güvenlik kurallarını daha iyi anlamak ve bunlara uymak için gelişmiş muhakeme yetenekleriyle tasarlanmıştır.
OpenAI ayrıca riskleri yönetmek için engelleme listeleri ve güvenlik sınıflandırıcıları gibi koruma önlemleri uyguladı. o1 modeli orta seviye genel risk derecelendirmesine sahiptir. Siber güvenlik ve model otonomisi gibi alanlarda düşük risklere, CBRN (Kimyasal, Biyolojik, Radyolojik ve Nükleer) içerik ve ikna gibi alanlarda ise orta seviye risklere sahiptir. OpenAI'ın Güvenlik Danışma Grubu ve Yönetim Kurulu, modelin kullanımının güvenli ve etik olduğundan emin olmak için bu güvenlik önlemlerini gözden geçirdi.

Şekil 6. OpenAI o1 Puan Kartı.
Link to this sectionSöylentilerden gerçeğe: OpenAI o1 sahneye çıkıyor#
OpenAI o1, bazı ilk söylentileri gerçeğe dönüştürerek yapay zeka muhakemesinde ileriye doğru atılmış büyük bir adımdır. GPT-4o'nun aksine o1 serisi, daha iyi yanıtlar için karmaşık problemleri daha küçük adımlara bölen bir "Düşünce Zinciri" yaklaşımı kullanarak daha derinlemesine düşünür. Şu anda ChatGPT ve API'da erken önizleme olarak mevcut olan OpenAI, web'de gezinme ile dosya ve görüntü yükleme gibi özellikler eklemeyi planlıyor. OpenAI ayrıca, yeni OpenAI o1 serisinin yanı sıra GPT serisinde modeller geliştirmeye ve yayınlamaya devam etmeyi planladıklarını paylaştı. Yapay zeka gelişmeye devam ettikçe, bu tür ilerlemeler, insan ihtiyaçlarını daha iyi destekleyebilen ve anlayabilen daha güçlü, sezgisel ve çok yönlü yapay zeka sistemlerinin yolunu açıyor.
Keep up with the latest in AI by joining our community! Head over to our GitHub repository to see how we’re pioneering AI solutions in sectors such as manufacturing and healthcare. 🚀






