Large Action Models (LAM)
Büyük Eylem Modellerini (LAM) ve bunların otonom yapay zeka ajanlarını nasıl yönlendirdiğini keşfet. Görmeden eyleme iş akışları ve görev otomasyonu için Ultralytics YOLO26'yı entegre etmeyi öğren.
Büyük Eylem Modelleri (LAM), yalnızca metin üretmenin ötesine geçerek görevleri otonom şekilde yürüten ve dijital ortamlarla etkileşime giren, üretken yapay zekanın gelişmiş bir sınıfıdır. Sadece metin işleyip üreten geleneksel modellerin aksine, LAM'ler AI agents için temel bilişsel motor görevi görür ve insan niyetini somut, çok adımlı eylemlere dönüştürür. Doğal dil anlama ile gerçek dünya uygulaması arasındaki boşluğu dolduran bu modeller, Artificial General Intelligence (AGI) ve yüksek derecede otonom sistemlere doğru atılmış önemli bir sıçramayı temsil eder.
Link to this sectionBüyük Eylem Modelleri Nasıl Çalışır#
LAM'ler, geleneksel foundation models mimarisinin üzerine inşa edilir ancak yazılım, API'ler ve web ortamlarıyla arayüz oluşturmak üzere özel olarak eğitilirler. reinforcement learning ve fonksiyon çağırma gibi teknikleri kullanarak bir LAM, karmaşık bir kullanıcı isteğini mantıksal adımlara bölebilir, grafiksel kullanıcı arayüzlerinde gezinebilir ve API uç noktalarını çalıştırabilir. Örneğin, Anthropic's Claude 3.5 computer use ve Salesforce's xLAM family tarafından geliştirilen yeni gelişmeler, bu sistemlerin tıpkı bir insan operatör gibi otonom bir şekilde düğmelere tıklayabildiğini, formları doldurabildiğini ve iş akışlarını yönetebildiğini göstermektedir.
computer vision sistemleriyle eşleştirildiklerinde LAM'ler çok daha güçlü hale gelir. Görsel girdiler, Ultralytics YOLO26 gibi oldukça verimli modeller tarafından işlenebilir, bu da LAM'in çevresini "görmesine", görsel bağlamı yorumlamasına ve tespit ettiklerine dayanarak belirli programatik eylemleri tetiklemesine olanak tanır.
Link to this sectionGerçek Dünya Uygulamaları#
LAM'ler, pasif yardımdan aktif uygulamaya geçerek endüstrilerin görev otomasyonuna yaklaşımını dönüştürüyor.
- AI in Retail ve Müşteri Desteği: Bir LAM, müşteri sorularını sadece yanıtlamak yerine, bir ürün iadesini otonom olarak işleyebilir. Eğer bir kullanıcı siparişi iptal etmek isterse, model şirketin faturalandırma yazılımında gezinebilir, politikayı doğrulayabilir, para iadesini gerçekleştirebilir ve insan müdahalesi olmadan envanter veritabanını güncelleyebilir.
- AI in Healthcare Yönetimi: Klinik ortamlarda LAM'ler karmaşık iş akışlarını koordine eder. Hasta taleplerini çıkarabilir, doktor müsaitlik durumlarını çapraz kontrol edebilir, dahili tıbbi yazılımlar aracılığıyla Elektronik Sağlık Kayıtlarını (EHR) otomatik olarak güncelleyebilir ve randevu planlamasını nihayete erdirebilirler.
Link to this sectionKod ile Görsel İş Akışlarını Otomatize Etme#
LAMs are frequently integrated with vision models to automate visual inspections. The following Python example demonstrates how a hypothetical LAM workflow might leverage ultralytics to scan an image and trigger an automated inventory action based on the object detection results.
from ultralytics import YOLO
# Load the recommended Ultralytics YOLO26 model for an agentic vision task
model = YOLO("yolo26n.pt")
# The LAM commands the model to scan a warehouse shelf image
results = model.predict("inventory_shelf.jpg")
# The LAM extracts actionable data to autonomously trigger a supply reorder
for result in results:
detected_items = len(result.boxes)
if detected_items < 10:
print(f"Low inventory ({detected_items} items). Action triggered: Reordering supplies via API.")Kullanıcılar, modern yapay zeka çözümleri için güçlü bulut altyapısı sağlayan Ultralytics Platform'ı kullanarak bu tür entegre görsel-eylem iş akışlarını sorunsuz bir şekilde dağıtabilir ve izleyebilirler.
Link to this sectionİlgili Kavramları Ayırt Etme#
Modern yapay zeka ortamını tam olarak kavramak için, LAM'leri yakından ilişkili diğer terimlerden ayırmak yararlıdır:
- LAM ile Large Language Model (LLM) Farkı: Bir LLM, tıpkı çok gelişmiş bir metin tahmincisi gibi, dili işlemek, özetlemek ve üretmek için tasarlanmıştır. Bir LAM ise bu dil anlama yeteneğini bünyesinde barındırır ancak harici araçlarla etkileşime girmek ve dijital eylemleri tamamlamak üzere özel olarak tasarlanmıştır.
- LAM ile Agentic AI Farkı: "Agentic AI", otonom olarak çalışan kapsayıcı sistemi veya yazılım varlığını tanımlar. Büyük Eylem Modeli ise, ajana plan yapma ve bu eylemleri gerçekleştirme yeteneğini veren altta yatan sinir ağıdır, yani "beynidir".
- LAM ile Agentic RAG Farkı: Agentic RAG, üretilen bir cevabın doğruluğunu artırmak için harici bilgileri otonom olarak almaya ve sentezlemeye odaklanır. Bir LAM ise sadece veri almaktan ziyade, sistemleri manipüle etmeye ve durumları değiştirmeye (uçuş rezervasyonu yapmak veya dosya taşımak gibi) odaklanır.






