YOLO Vision 2025'i kaçırmayın!
25 Eylül 2025
10:00 — 18:00 BST
Hibrit etkinlik
Yolo Vision 2024

OpenAI o1: Yapay Zeka Muhakemesi için Yeni OpenAI Modelleri Serisi

Abirami Vina

5 dakikalık okuma

13 Eylül 2024

Yeni piyasaya sürülen OpenAI o1 modellerini ve onları özel kılan şeyleri öğrenin. Ayrıca, nasıl çalıştıklarına ve yapay zekanın geleceği üzerindeki etkilerine de bir göz atacağız.

Yapay zeka topluluğu, OpenAI'nin GPT modelleri için bir sonraki adım hakkında spekülasyonlarla çalkalanıyor ve çoğu bunu "Proje Çilek" olarak adlandırıyor. Bunun nedeni, GPT-4o'ya "strawberry" kelimesinde kaç tane R olduğunu sorarak strawberry kelimesinde iki tane R olduğunu söylemesidir. GPT-4o'nun ne kadar güçlü olduğu düşünüldüğünde garip görünebilir. Ancak model, tam kelimeleri değil, alt metni işlemek için oluşturulmuştur. Bir sonraki modelin bunu çözmeyi amaçlayacağı söyleniyordu. Sam Altman, X (eski adıyla Twitter) hesabında çilek resimleri yayınlayarak bu söylentileri daha da körükledi.

OpenAI'ın 12 Eylül Perşembe günkü son duyurusuyla, spekülasyonlara nihayet bir cevap bulduk! Cevap vermeden önce yavaşlayıp düşünmek üzere tasarlanmış yeni bir AI model serisi olan OpenAI o1 yayınlandı. İlginç bir şekilde, OpenAI o1 daha iyi akıl yürütebilir ve çileklerle ilgili soruyu doğru cevaplayabilir! Bu makalede, OpenAI o1'in ne olduğunu, nasıl çalıştığını, nerede kullanılabileceğini ve AI'ın geleceği için ne anlama geldiğini tartışacağız. Hadi başlayalım!

__wf_reserved_inherit
Şekil 1. OpenAI o1'e çilekler hakkında soru sormaya bir örnek.

OpenAI tarafından yapay zekadaki yeni gelişmeler

Temmuz 2024'te OpenAI yöneticileri, OpenAI'nin araştırmasının yapay zekanın 2. seviyesi olarak adlandırılan insan düzeyinde problem çözmeye yaklaştığını paylaştı. OpenAI'nin yeni model serisi OpenAI o1'i cevaplamadan önce düşünme olarak tanıtmasıyla bu seviyenin akıl yürütmeye odaklandığı açıkça görülüyor. OpenAI o1, büyük miktarda dil verisinden örüntüler öğrenerek insan benzeri metni anlayan ve üreten yeni bir LLM (büyük dil modeli) olan bir yapay zeka modelidir. Derinlemesine akıl yürütme gerektiren karmaşık sorunların üstesinden gelmek için tasarlanmıştır. 

__wf_reserved_inherit
Şekil 2. OpenAI'ın Yapay Zekanın Aşamalarına Bakışı.

Model, eylemleri için ödüller veya cezalar alarak deneme yanılma yoluyla daha iyi kararlar almayı öğrendiği bir teknik olan pekiştirmeli öğrenme kullanılarak eğitilmiştir. Pekiştirmeli öğrenme algoritması, bir düşünce zincirini izleyerek modelin daha etkili düşünmesine yardımcı olur. OpenAI ayrıca, o1'in performansının eğitim sırasında daha fazla pekiştirmeli öğrenme ile ve problem çözme sırasında daha fazla "düşünme" süresiyle gelişmeye devam ettiğini ve hem uzun süreli eğitimin hem de düşünceli işlemenin modelin yeteneklerini artırmaya yardımcı olduğunu paylaştı.

OpenAI o1 karmaşık akıl yürütme için önemli bir gelişme olsa da, hala erken bir modeldir ve ChatGPT'yi kullanışlı kılan web'de gezinme veya dosya ve resim yükleme gibi bazı özelliklerden yoksundur. Birçok genel görev için GPT-4o şimdilik daha yetenekli olabilir. Ancak OpenAI o1, yapay zekanın karmaşık akıl yürütme yeteneğinde büyük bir adımı işaret ediyor, bu nedenle OpenAI yeni bir seriye başlıyor ve buna OpenAI o1 adını veriyor.

Yeni OpenAI modelleri, yapay zeka muhakemesini nasıl geliştirir

OpenAI o1, şifreleri çözme, programlama zorluklarını çözme, matematik problemlerini yanıtlama, bulmacaları çözme ve hatta bilim, güvenlik ve sağlık hizmetleri alanlarındaki karmaşık konuları ele alma gibi görevler için kullanılabilir. Projenin kod adına eğlenceli bir gönderme olarak OpenAI, modelin "ÇİLEKTE ÜÇ TANE R VARDIR" mesajını ortaya çıkaran bir şifreyi çözerek akıl yürütme becerilerini gösterdi. 

Şifre çözmenin ötesinde, OpenAI o1 kodlamada da yeteneklidir. Programcıların zaman kısıtlaması altında karmaşık kodlama problemlerini çözdüğü bir platform olan Codeforces gibi rekabetçi programlama yarışmalarında iyi performans gösterir. Bu yarışmalarda model, yüksek Elo dereceleri (diğer rakiplere karşı performansa dayalı olarak beceri seviyelerini ölçen bir puanlama sistemi) elde eder ve önceki modellerden daha iyi performans gösterir. Ayrıca matematikte de başarılıdır ve Amerikan Davetli Matematik Sınavı (AIME) gibi sınavlarda iyi performans gösterir. 

__wf_reserved_inherit
Şekil 3. o1'in Kodlama Becerilerinin Kıyaslanması.

Bu gelişmeler, OpenAI o1'i GPT-4o gibi önceki modellere göre önemli bir yükseltme olarak konumlandırıyor. İş, geliştirme, araştırma ve sağlık hizmetleri gibi alanlarda yapay zeka için yeni olanaklar sunuyor. Örneğin, genetik araştırmalarda OpenAI o1, çok sayıda araştırma makalesini hızla inceleyebilir, genetik belirteçler ve hastalıklar arasındaki temel bulguları ve bağlantıları ayıklayabilir. Karmaşık bilimsel dili anlar ve önemli noktaları özetleyerek araştırmacıların en alakalı bilgilere odaklanmasına yardımcı olur. 

Düşünce zincirine daha yakından bir bakış

Daha önce OpenAI o1'in bir "Düşünce Zinciri" muhakeme süreci sunduğunu görmüştük. Bu, modelin karmaşık sorunların üstesinden insan bilişsel stratejilerine benzer bir şekilde gelmesini sağlıyor. Model, zorlukları daha küçük, yönetilebilir adımlara ayırabilir ve yaklaşımını yinelemeli olarak iyileştirebilir. Önceki modellerin anında örüntü tanımaya dayanmasının aksine, o1, birden çok muhakeme yolunu keşfederek, hem başarılardan hem de hatalardan takviyeli öğrenme yoluyla öğrenerek karar almasını optimize eder.

OpenAI, bu ham düşünce zincirlerini kullanıcılardan gizli tutmaya karar verdi ve bunun yerine modelin her adımını göstermeden akıl yürütmesine dair fikir veren özetler sunuyor. Bu karar, modelin düşünce sürecinin kötüye kullanılmasını önlemeye yardımcı olurken, geliştiricilerin yapay zeka güvenliğini ve uyumunu izlemesine ve iyileştirmesine olanak tanıyor. Geliştiriciler, gizli zincirleri dahili olarak gözlemleyerek o1'in etik kurallara uyduğundan ve zararlı davranışlardan kaçındığından emin olabilirler.

OpenAI o1'in kıyaslanması

OpenAI o1, akıl yürütme ve problem çözme yeteneklerini test eden çeşitli kıyaslamalarda GPT-4o'ya göre önemli gelişmeler gösteriyor. En iyi lise öğrencileri için zorlu bir matematik sınavı olan Amerikan Davetli Matematik Sınavı'nda (AIME) 2024, o1 problem başına sadece bir örnekle %74 doğruluk oranına ulaşırken, GPT-4o'nun oranı %12 idi. 64 örnek üzerinde fikir birliği ile doğruluğu %83'e yükseldi ve 1.000 örnekle iyileştirilmiş bir yeniden sıralama yöntemi kullanarak %93'e ulaştı ve bu da onu ülke genelinde ilk 500 öğrenci arasına yerleştirdi. 

Matematiğin ötesinde, o1 ayrıca kimya, fizik ve biyoloji alanlarında doktora seviyesindeki soruları kapsayan GPQA Diamond gibi bilimsel bilgiyi test eden kıyaslamalarda da olağanüstü bir performans sergiledi. O1, bu testte doktora derecesine sahip insan uzmanlardan daha iyi performans göstererek bunu başaran ilk yapay zeka modeli oldu. Ayrıca, tarih, hukuk ve bilim de dahil olmak üzere çeşitli konularda anlayışı test eden MMLU kıyaslamasında 57 kategoriden 54'ünde GPT-4o'yu geride bıraktı.

__wf_reserved_inherit
Şekil 4. OpenAI o1 kıyaslaması.

OpenAI o1 ile uygulamalı deneyim kazanın

OpenAI, o1 serisinde iki yeni yapay zeka modeli tanıttı: o1-preview ve o1-mini. o1-preview modeli, yanıt vermeden önce daha derinlemesine düşünmek üzere tasarlanmıştır ve bilim, kodlama ve matematik alanlarındaki karmaşık akıl yürütme görevlerinde üstündür. Zorlu projelerle uğraşan kullanıcılara gelişmiş problem çözme yetenekleri sunar. Buna karşılık, o1-mini, özellikle matematik ve kodlama olmak üzere STEM akıl yürütmesi için özel olarak optimize edilmiş daha küçük, daha hızlı ve daha uygun maliyetli bir modeldir. Daha geniş dünya bilgisine sahip olmasa da, o1-mini, AIME matematik yarışması ve Codeforces kodlama yarışmaları gibi temel değerlendirmelerde o1-preview'in performansıyla neredeyse eşleşiyor ve tüm bunları %80 daha düşük maliyetle yapıyor.

__wf_reserved_inherit
Şekil 5. OpenAI Modellerinin Karşılaştırılması.

Bu modelleri çeşitli OpenAI platformları aracılığıyla deneyebilirsiniz. ChatGPT Plus ve Team kullanıcıları, model seçici aracılığıyla hem o1-preview hem de o1-mini'ye erişebilir ve doğrudan ChatGPT'de gelişmiş akıl yürütme yeteneklerini deneyimleyebilir. API kullanım katmanı 5 erişimine sahip geliştiriciler, bu modellerle prototip oluşturmaya başlayabilir, ancak bazı gelişmiş özellikler hala geliştirme aşamasındadır. OpenAI ayrıca o1-mini'yi yakında tüm ChatGPT Free kullanıcılarına sunmayı planlıyor. Bu modelleri keşfederek, yapay zeka akıl yürütmesindeki gelişmeleri ilk elden deneyimleyebilir ve ihtiyaçlarınıza en uygun olanı seçebilirsiniz.

OpenAI tarafından yapılan etik yapay zeka değerlendirmeleri

OpenAI, o1 model serisini geliştirirken etik ve güvenliğe odaklanmıştır. o1-preview ve o1-mini modellerini yayınlamadan önce, yasaklı içerik, halüsinasyonlar ve önyargı gibi riskler için harici testler ve dahili kontroller dahil olmak üzere kapsamlı değerlendirmeler yaptılar. Modeller, güvenlik kurallarını daha iyi anlamak ve takip etmek için gelişmiş akıl yürütme yetenekleriyle tasarlanmıştır. 

OpenAI ayrıca riskleri yönetmek için engelleme listeleri ve güvenlik sınıflandırıcıları gibi önlemler de uygulamıştır. o1 modelinin genel risk derecesi orta düzeydedir. Siber güvenlik ve model özerkliği gibi alanlarda düşük risklere ve CBRN (Kimyasal, Biyolojik, Radyolojik ve Nükleer) içerik ve ikna gibi alanlarda orta düzeyde risklere sahiptir. OpenAI'nin Güvenlik Danışma Grubu ve Yönetim Kurulu, modelin kullanımının güvenli ve etik olmasını sağlamak için bu güvenlik önlemlerini incelemiştir.

__wf_reserved_inherit
Şekil 6. OpenAI o1 Puan Kartı.

Söylentilerden gerçeğe: OpenAI o1 sahneye çıkıyor

OpenAI o1, yapay zeka muhakemesinde büyük bir adım olup, ilk söylentilerin bazılarını gerçeğe dönüştürüyor. GPT-4o'dan farklı olarak, o1 serisi, daha iyi yanıtlar için karmaşık sorunları daha küçük adımlara ayıran bir "Düşünce Zinciri" yaklaşımı kullanarak daha derinlemesine düşünüyor. Şu anda ChatGPT ve API'de erken bir önizleme olarak mevcut olan OpenAI, web'de gezinme, dosya ve resim yükleme gibi özellikleri eklemeyi planlıyor. OpenAI ayrıca, yeni OpenAI o1 serisinin yanı sıra GPT serisinde de modeller geliştirmeye ve yayınlamaya devam etmeyi planladıklarını paylaştı. Yapay zeka gelişmeye devam ederken, bunlar gibi gelişmeler, insan ihtiyaçlarını daha iyi destekleyebilen ve anlayabilen daha güçlü, sezgisel ve çok yönlü yapay zeka sistemlerinin önünü açıyor.

Topluluğumuza katılarak yapay zekadaki en son gelişmeleri takip edin! GitHub depomuza giderek, üretim ve sağlık hizmetleri gibi sektörlerde nasıl öncü yapay zeka çözümleri geliştirdiğimizi görün. 🚀

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın
Bağlantı panoya kopyalandı