Hedefleri gerçekleştirmek için düşünceleri birbirine bağlayan otonom AI ajanı Auto-GPT'yi keşfedin. Gelişmiş görme görevleri için Ultralytics ile nasıl entegre olduğunu öğrenin.
Auto-GPT, hedefleri alt görevlere bölerek ve sürekli insan müdahalesi olmadan bunları sırayla gerçekleştirerek hedefleri ulaşmak için tasarlanmış açık kaynaklı, otonom bir yapay zeka ajanıdır. Kullanıcının her adımda sistemi yönlendirmesi gereken standart sohbet robotu arayüzlerinden farklı olarak, Auto-GPT büyük dil modellerini (LLM) kullanarak düşünceleri birbirine "bağlar". Kendi kendine komutlar verir, kendi çalışmalarını eleştirir ve çözümleri yineler, böylece genel hedef ulaşılana kadar etkili bir akıl yürütme ve eylem döngüsü oluşturur. Bu yetenek, reaktif AI araçlarından, karmaşık, çok adımlı iş akışlarını yönetebilen proaktif AI ajanlarına doğru önemli bir değişimi temsil eder. .
Auto-GPT'nin temel işlevselliği, genellikle "düşünce-eylem-gözlem" döngüsü olarak tanımlanan bir konsepte dayanır. "Yeni bir kahve markası için pazarlama planı oluşturun" gibi üst düzey bir hedef verildiğinde, ajan sadece statik bir metin yanıtı üretmez. Bunun yerine, aşağıdaki döngüyü gerçekleştirir:
Bu özerk davranış, planlama ve eleştiri için gerekli olan akıl yürütme yeteneklerini sağlayan GPT-4 gibi gelişmiş temel modeller tarafından desteklenmektedir.
Auto-GPT, Üretken Yapay Zekanın nasıl kullanılabileceğini gösteriyor sadece metin üretmek yerine eyleme geçirilebilir görevleri gerçekleştirmek için uygulanır.
Auto-GPT öncelikle metinleri işlerken, modern aracılar giderek çok modlu hale gelmekte ve fiziksel ortamlarla etkileşime girmektedir. bilgisayar görüşü (CV) aracılığıyla dünya. Bir ajan bir karar vermeden önce çevresini "görmek" için bir vizyon modeli kullanabilir.
Aşağıdaki örnek, basit bir ajan bileşeni olarak işlev gören Python Ultralytics kullanarak detect ve görsel girdilere dayalı olarak bir eylem kararı vermesini göstermektedir.
from ultralytics import YOLO
# Load the YOLO26 model to serve as the agent's "vision"
model = YOLO("yolo26n.pt")
# Run inference on an image to perceive the environment
results = model("https://ultralytics.com/images/bus.jpg")
# Agent Logic: Check for detected objects (class 0 is 'person' in COCO)
# This simulates an agent deciding if a scene is populated
if any(box.cls == 0 for box in results[0].boxes):
print("Agent Status: Person detected. Initiating interaction protocol.")
else:
print("Agent Status: No people found. Continuing patrol mode.")
Auto-GPT'nin özel kullanım alanını anlamak için, onu AI ekosistemindeki diğer terimlerden ayırmak önemlidir:
Auto-GPT gibi ajanların geliştirilmesi, sistemlerin zaman içinde akıl yürütmesini sağlayarak Yapay Genel Zeka (AGI) yönünde bir adım olduğunu gösteriyor. Bu ajanlar daha sağlam hale geldikçe, makine öğrenimi operasyonlarında (MLOps) önemli bir rol oynamaları beklenmektedir. Bu operasyonlarda, model dağıtımını özerk bir şekilde yönetebilir, veri sapmasını izleyebilir ve Ultralytics gibi platformlarda yeniden eğitim döngülerini tetikleyebilirler. Ancak, özerk ajanların yükselişi, AI güvenliği ve kontrolü ile ilgili zorlukları da beraberinde getirmektedir. Bu durum, izin sistemlerinin ve denetim mekanizmalarının dikkatli bir şekilde tasarlanmasını gerektirmektedir.