Kendi kendine komutlar vererek otonom bir şekilde hedeflere ulaşan, görevlerin üstesinden gelen ve problem çözmede devrim yaratan açık kaynaklı bir yapay zeka olan Auto-GPT'yi keşfedin.
Auto-GPT, aşağıdakilerin yeteneklerini sergileyen deneysel, açık kaynaklı bir uygulamadır Yapay zeka ajanlarının otonom olarak çalışmasını sağlayarak. Tarafından desteklenmektedir Büyük Dil Modelleri (LLM'ler), örneğin OpenAI'nin GPT-4, Auto-GPT'si kendisini standartlardan ayırıyor chatbot'ları kendi kendine öneride bulunma yeteneğine sahiptir. Bir sohbeti yönlendirmek için sürekli kullanıcı girdisine ihtiyaç duymak yerine, bir tek bir üst düzey hedef belirler ve bunu bir dizi alt göreve ayırır. Daha sonra bu görevleri yürütür, kendi görevlerini eleştirir. performansını ölçer ve hedefe ulaşılana kadar yineler. Bu değişim, aşağıdakilere doğru bir hareketi temsil etmektedir etmenli yapay zeka sistemleri Minimum insan müdahalesi ile karmaşık problem çözme yeteneğine sahiptir.
Auto-GPT'nin temel işlevselliği "düşünceler", "akıl yürütme" ve "muhakeme" gibi özyinelemeli bir döngüye dayanır. "planlama" ve "eylem". Bir hedef atandığında, sistem hedefin altında yatan adım adım bir plan oluşturmak için temel model. Aşağıdakiler için Düşünce Zinciri Yön lendirmesi kullanır muhakemeyi simüle ederek bağlamı analiz etmesine ve gerekli eylemleri belirlemesine olanak tanır.
Bu planları uygulamak için Auto-GPT, bilgi toplama ve dosya yönetimi için internet erişimi ile donatılmıştır. veri okuma ve yazma yetenekleri ve bellek yönetim araçları, genellikle bir uzun vadeli bağlamı korumak için vektör veritabanı. Bu bir standardın sınırlamalarının üstesinden gelir LLM'lerdeki bağlam penceresi, temsilcinin aşağıdakileri hatırlamasını sağlar önceki adımlar ve stratejisini iyileştirme. Geliştiriciler kaynak kodunu AutoGPT GitHub deposu bunların nasıl çalıştığını anlamak için bileşenler etkileşime girer.
Auto-GPT, Üretken Yapay Zekanın nasıl kullanılabileceğini gösteriyor sadece metin üretmek yerine eyleme geçirilebilir görevleri gerçekleştirmek için uygulanır.
Auto-GPT öncelikle metinleri işlerken, modern aracılar giderek çok modlu hale gelmekte ve fiziksel ortamlarla etkileşime girmektedir. bilgisayar görüşü (CV) aracılığıyla dünya. Bir ajan bir karar vermeden önce çevresini "görmek" için bir vizyon modeli kullanabilir.
Aşağıdaki örnek, basit bir aracı bileşeni olarak işlev gören bir Python betiğinin aşağıdakileri nasıl kullanabileceğini göstermektedir Ultralytics YOLO11 nesneleri detect etmek ve bir eyleme karar vermek görsel girdiye dayalı olarak.
from ultralytics import YOLO
# Load the YOLO11 model to serve as the agent's "vision"
model = YOLO("yolo11n.pt")
# Run inference on an image to perceive the environment
results = model("office_space.jpg")
# Agent Logic: Check for people to determine if lights should be on
# Class ID 0 typically corresponds to 'person' in COCO datasets
if any(box.cls == 0 for box in results[0].boxes):
print("Agent Decision: Occupants detected. Keeping lights ON.")
else:
print("Agent Decision: Room empty. Switching lights OFF to save energy.")
Auto-GPT'yi YZ ekosistemindeki diğer terimlerden ayırmak önemlidir:
Potansiyeline rağmen Auto-GPT, sık sık yapılan işlemler nedeniyle yüksek işletme maliyetleri gibi zorluklarla karşı karşıyadır. OpenAI gibi sağlayıcılara API çağrıları. Ayrıca, acenteler bazen sonsuz döngülere girebilir veya LLM'lerde halüsinasyon, nerede tasarladıkları yanlış bilgilere dayalı yanlış planlar.
Gelecekteki yinelemeler daha sağlam entegrasyonu amaçlamaktadır geliştirmek için pekiştirmeli öğrenme teknikleri karar verme doğruluğu. Bu ajanlar geliştikçe, büyük olasılıkla aşağıdakilerin merkezinde yer alacaklardır Nesnelerin İnterneti (IoT) Ekosistemler, karmaşık cihaz ağlarını ve veri akışlarını otonom olarak yönetir.

