Anayasal YZ'nin, modelleri önceden tanımlanmış ilkeler ve insani değerlerle uyumlu hale getirerek etik, güvenli ve tarafsız YZ çıktılarını nasıl sağladığını keşfedin.
Anayasal Yapay Zeka (CAI), Anthropic tarafından yapay zeka modellerini, özellikle de Büyük Dil Modellerini (LLM'ler) "anayasa" olarak bilinen belirli bir dizi kural veya ilkeye uyacak şekilde eğitmek için geliştirilen bir yöntemdir. CAI'nin birincil amacı, YZ sistemlerini kapsamlı insan geri bildirimi gerektirmeden yararlı, zararsız ve daha kontrol edilebilir hale getirmektir. İnsanların sürekli olarak zararlı çıktıları etiketlemesi yerine, YZ kendi anayasasındaki yol gösterici ilkelere dayanarak kendi tepkilerini eleştirmeyi ve gözden geçirmeyi öğrenir. Bu yaklaşım, toksik içerik üretimini önlemek ve algoritmik önyargıyı azaltmak gibi YZ etiğindeki temel zorlukların ele alınmasına yardımcı olur.
CAI eğitim süreci tipik olarak iki ana aşamadan oluşur:
CAI'nin gerçek dünyadaki önemli bir örneği, Anthropic'in yapay zeka asistanı Claude'da uygulanmasıdır. Claude'un yapısı, zararlı talimatlar üretmekten kaçınması, yasadışı faaliyetlerde bulunmayı reddetmesi ve yardımcı olmaya devam ederken toksik olmayan bir şekilde iletişim kurması için ona rehberlik ediyor. Bir başka uygulama da, önceden tanımlanmış bir dizi etik yönergeye göre çevrimiçi nefret söylemini veya yanlış bilgiyi belirlemek ve işaretlemek için CAI güdümlü bir modelin kullanılabileceği otomatik içerik moderasyonudur.
CAI'yi benzer terimlerden ayırt etmek önemlidir:
Şu anda, Anayasal YZ, diyalog oluşturma ve metin özetleme gibi görevler için öncelikle LLM'lere uygulanmaktadır. Bununla birlikte, temel ilkeler potansiyel olarak Bilgisayarla Görme (CV) dahil olmak üzere diğer YZ alanlarına da genişletilebilir. Örneğin:
Etkili anayasaların geliştirilmesi ve iyileştirilmesinin yanı sıra YZ'nin çeşitli bağlamlarda bunlara sadakatle bağlı kalmasını sağlamak, Google AI ve AI Safety Institute gibi kuruluşlarda aktif araştırma alanları olmaya devam etmektedir. Ultralytics HUB gibi araçlar, çeşitli YZ modellerinin eğitimini ve dağıtımını kolaylaştırmaktadır ve Anayasal YZ'ye benzer ilkelerin dahil edilmesi, sorumlu model dağıtımını sağlamak için giderek daha önemli hale gelecektir.