İşlev çağırma ve araç kullanımının, yapay zekanın API'ler ve veritabanlarıyla etkileşime girmesini nasıl kolaylaştırdığını keşfedin. Ultralytics ajans iş akışlarına entegre etmeyi bugün öğrenin.
Sık sık araç kullanımı olarak adlandırılan işlev çağırma, modern yapay zeka (AI) alanında, modellerin yeteneklerini statik metin veya görüntü oluşturmanın ötesine genişletmelerini sağlayan güçlü bir paradigmadır. Model, yalnızca dahili eğitim verilerine dayalı bir komuta yanıt vermek yerine , yapılandırılmış komutlar üreterek harici programlama işlevlerini tetikleyebilir, veritabanlarını sorgulayabilir veya REST API'leriyle etkileşime girebilir. Bu yaklaşım, AI'ya dijital ortamlarda somut eylemler gerçekleştirme yeteneği kazandırır.
Bir AI sistemi işlev çağrısını kullandığında, geliştiriciler modele JSON Şeması kullanılarak açıklanan mevcut araçların bir listesini sağlar. Kullanıcının komut isteminde gerçek zamanlı veriler veya belirli bir eylem gerekiyorsa, model standart oluşturma sürecini duraklatır ve seçilen aracın gerekli parametrelerine uyan, son derece yapılandırılmış bir JSON formatı yükü üretir. Seçilen araç. OpenAI'nin işlev çağırma API'si ve Anthropic araç kullanım çerçevesigibi çerçeveler bu tekniği popüler hale getirerek, konuşma ajanlarını yetenekli problem çözücülere dönüştürmüştür. Bu teknik, AI sistemlerinin karmaşık problemleri çözme yeteneğini önemli ölçüde artırmaktadır.
Araç kullanımının iş akışlarına entegre edilmesi, yazılımların çalışma şeklini dönüştürmektedir. Berkeley Function Calling Leaderboard gibi karşılaştırmalı değerlendirmelerle ölçülen bu yetenekler, yüksek düzeyde otonom sistemlere doğru bir geçişi tetiklemektedir.
Bir bilgisayar görme modelini, genel bir AI ajanı için işlevsel bir araç olarak ortaya koyabilirsiniz. Bu mimaride, görsel veriler gerektiğinde bir akıl yürütme modelinin tetikleyebileceği, çıkarım gerçekleştiren bir Python tanımlarsınız.
from ultralytics import YOLO
# Define a specific tool function for an AI agent to call
def count_objects_in_scene(image_url: str) -> str:
# Load the highly efficient YOLO26 model
model = YOLO("yolo26n.pt")
# Perform inference to analyze the visual data
results = model(image_url)
object_count = len(results[0].boxes)
# Return structured context back to the calling AI system
return f"Vision Analysis: Detected {object_count} objects in the scene."
# Simulated function call executed by an AI system
print(count_objects_in_scene("https://ultralytics.com/images/bus.jpg"))
Modern AI mimarilerini tam olarak kavramak için, işlev çağrısının benzer kavramlarla nasıl ilişkili olduğunu ve onlardan nasıl farklı olduğunu anlamak yararlıdır :