Düşünce Zinciri (CoT) yönlendirmesi, karmaşık muhakeme görevlerini yerine getirme becerilerini geliştirmek için öncelikle Büyük Dil Modelleri (LLM' ler) ile kullanılan gelişmiş bir tekniktir. CoT, sadece nihai cevabı sormak yerine, modeli ara adımlar veya mantıksal olarak çözüme götüren bir 'düşünce zinciri' oluşturmaya teşvik eder. Bu yaklaşım, insanların problem çözme süreçlerini taklit eder ve modellerin aritmetik, sağduyu veya sembolik akıl yürütme gerektiren problemleri daha etkili bir şekilde ele almasına yardımcı olarak genellikle önemli ölçüde daha iyi doğruluk sağlar. Bu teknik, Google AI tarafından yapılan araştırmada özellikle vurgulanmıştır.
Düşünce Zinciri Yönlendirmesi Nasıl Çalışır?
CoT yönlendirmesi, bir yapay zeka modeline bir sorunu nasıl çözeceğini açıkça göstererek rehberlik eder. İki ana varyant vardır:
- Az Çekimli CoT: Bilgi istemi, her örneğin bir soru, ayrıntılı bir adım adım akıl yürütme süreci (düşünce zinciri) ve nihai cevaptan oluştuğu birkaç örnek (çekim) içerir. Model, sorulan asıl soruya benzer bir muhakeme süreci uygulamak için bu örneklerden öğrenir. Bu, akıl yürütme yollarına uygulanan bir tür az-atışlı öğrenmedir.
- Sıfır Atış CoT: Bu daha basit yaklaşım örnek vermeyi gerektirmez. Bunun yerine, soruya "Adım adım düşünelim" gibi basit bir talimat eklenir. Bu ipucu, modeli nihai cevabı vermeden önce muhakeme sürecini ifade etmeye teşvik eder. Modelin kapsamlı ön eğitimi sırasında öğrendiği doğal yeteneklerinden yararlanır.
CoT, akıl yürütme adımlarını dışsallaştırarak modelin sürecini daha şeffaf hale getirir ve akıl yürütmenin nerede yanlış gitmiş olabileceğine dair daha kolay hata ayıklamaya olanak tanır. Genellikle doğrudan bir cevap isteyen ve birden fazla mantıksal adım gerektiren görevlerde başarısız olabilen standart yönlendirme ile tezat oluşturur.
Faydaları ve Uygulamaları
CoT yönlendirmesinin birincil faydası, standart yönlendirmenin zorlandığı karmaşık görevler için LLM'lerin muhakeme yeteneklerini geliştirme yeteneğidir. Temel avantajlar şunlardır:
- Geliştirilmiş Performans: Matematiksel kelime problemleri, mantıksal bulmacalar ve çok adımlı soru cevaplama gibi görevlerde doğruluğu önemli ölçüde artırır.
- Geliştirilmiş Şeffaflık: Oluşturulan düşünce zinciri, modelin muhakeme sürecine ilişkin içgörüler sağlayarak Açıklanabilir Yapay Zeka'ya (XAI) katkıda bulunur.
- Karmaşıklığın Daha İyi Ele Alınması: Modellerin, daha küçük, yönetilebilir adımlara ayrıştırılması gereken sorunların üstesinden gelmesini sağlar.
Gerçek Dünya Örnekleri:
- Karmaşık Müşteri Desteği: CoT kullanan bir yapay zeka chatbotu, çok parçalı bir teknik sorunu gidermek veya karmaşık bir faturalandırma sorgusunu açıklamak gibi karmaşık müşteri sorunlarını ele alabilir. CoT istemi, yapay zekayı önce temel sorunu tanımlamaya, ardından ilgili politikaları veya teknik adımları hatırlamaya, gerekirse kullanıcı geçmişini kontrol etmeye ve son olarak müşteri için adım adım bir çözüm planı formüle etmeye yönlendirir. Bu, doğrudan bir çözüm tahmin etmekten daha etkilidir. Salesforce Einstein gibi platformlar, müşteri hizmetleri için benzer bir muhakemeden yararlanır.
- Veri Analizi ve Yorumlama: Bir veri kümesi ve karmaşık bir sorgu sunulduğunda (örneğin, "Bu rapora dayanarak son çeyrekte satışların düşmesine katkıda bulunan temel faktörleri belirleyin"), CoT kullanan bir LLM analiz planını ana hatlarıyla belirleyebilir: ilk olarak, ilgili veri noktalarını belirleyin; ikinci olarak, gerekli hesaplamaları veya karşılaştırmaları yapın; üçüncü olarak, bulguları sentezleyin; ve son olarak, sonucu sunun. Bu yapılandırılmış yaklaşım, YZ tarafından üretilen veri analitiği içgörülerinin güvenilirliğini artırır.
CoT, tıbbi görüntü analizi desteği veya finansal modelleme gibi güvenilir ve karmaşık karar verme gerektiren alanlarda özellikle değerlidir ve aşağıdaki gibi modeller tarafından yönlendirilen bilgisayarla görme (CV) gibi alanlardaki gelişmeleri tamamlar Ultralytics YOLO.
İlgili Kavramlarla Karşılaştırma
CoT yönlendirmesi, doğal dil işleme (NLP ) ve makine öğrenimi (ML) alanındaki diğer tekniklerle ilişkili ancak onlardan farklıdır:
- İstem Mühendisliği: Bu, yapay zeka modelleri için etkili girdiler (istemler) tasarlamanın geniş kapsamlı bir uygulamasıdır. CoT, akıl yürütmeyi ortaya çıkarmaya odaklanan özel, gelişmiş bir istem mühendisliği tekniğidir. Diğer teknikler netlik, bağlam sağlama(İstem Zenginleştirme) veya format spesifikasyonuna odaklanabilir.
- İstem Zincirleme: İstem zinciri, karmaşık bir görevi daha basit, birbirine bağlı istemler dizisine bölmeyi içerir; burada bir istemin çıktısı bir sonrakinin girdisi olur. Bu genellikle harici bir düzenleme gerektirir (örneğin, LangChain gibi çerçeveler kullanarak). Buna karşılık CoT, tüm muhakeme sürecini tek bir istem-yanıt etkileşimi içinde ortaya çıkarmayı amaçlar.
- Sıfır Atışlı Öğrenme: Bu, bir modelin herhangi bir örnek olmadan, açıkça eğitilmediği görevleri yerine getirme yeteneğini ifade eder. Zero-shot CoT bunun özel bir uygulamasıdır ve akıl yürütmeyi tetiklemek için genel bir talimat ("Adım adım düşünelim") kullanır. Ancak CoT, saf sıfır vuruşlu öğrenmenin aksine, göreve özgü muhakeme örnekleri sağlayan birkaç vuruşlu bir ortamda genellikle daha iyi performans gösterir.
CoT yönlendirmesi, daha yetenekli ve yorumlanabilir Yapay Zeka (AI) sistemleri oluşturmaya yönelik önemli bir adımı temsil eder. Bu tür tekniklerin anlaşılması ve kullanılması, eğitim ve dağıtımı yönetmek için Ultralytics HUB gibi platformlardan potansiyel olarak yararlanarak sofistike AI modelleri geliştirirken faydalı olabilir. Öz-tutarlılık gibi teknikler, birden fazla muhakeme yolunu örnekleyerek ve en tutarlı cevabı seçerek CoT'yi daha da geliştirebilir.