Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

İşlev Çağırma (Alet Kullanımı)

İşlev çağırma ve araç kullanımının, yapay zekanın API'ler ve veritabanlarıyla etkileşime girmesini nasıl kolaylaştırdığını keşfedin. Ultralytics ajans iş akışlarına entegre etmeyi bugün öğrenin.

Sık sık araç kullanımı olarak adlandırılan işlev çağırma, modern yapay zeka (AI) alanında, modellerin yeteneklerini statik metin veya görüntü oluşturmanın ötesine genişletmelerini sağlayan güçlü bir paradigmadır. Model, yalnızca dahili eğitim verilerine dayalı bir komuta yanıt vermek yerine , yapılandırılmış komutlar üreterek harici programlama işlevlerini tetikleyebilir, veritabanlarını sorgulayabilir veya REST API'leriyle etkileşime girebilir. Bu yaklaşım, AI'ya dijital ortamlarda somut eylemler gerçekleştirme yeteneği kazandırır.

Bir AI sistemi işlev çağrısını kullandığında, geliştiriciler modele JSON Şeması kullanılarak açıklanan mevcut araçların bir listesini sağlar. Kullanıcının komut isteminde gerçek zamanlı veriler veya belirli bir eylem gerekiyorsa, model standart oluşturma sürecini duraklatır ve seçilen aracın gerekli parametrelerine uyan, son derece yapılandırılmış bir JSON formatı yükü üretir. Seçilen araç. OpenAI'nin işlev çağırma API'si ve Anthropic araç kullanım çerçevesigibi çerçeveler bu tekniği popüler hale getirerek, konuşma ajanlarını yetenekli problem çözücülere dönüştürmüştür. Bu teknik, AI sistemlerinin karmaşık problemleri çözme yeteneğini önemli ölçüde artırmaktadır.

Gerçek Dünya Uygulamaları

Araç kullanımının iş akışlarına entegre edilmesi, yazılımların çalışma şeklini dönüştürmektedir. Berkeley Function Calling Leaderboard gibi karşılaştırmalı değerlendirmelerle ölçülen bu yetenekler, yüksek düzeyde otonom sistemlere doğru bir geçişi tetiklemektedir.

  • Otomatik Perakende ve Müşteri Hizmetleri: Perakendede yapay zeka, sanal bir asistan işlev çağırmayı kullanarak canlı envanteri arayabilir. Bir müşteri "Siparişim nerede?" diye sorarsa, model bir veritabanı API'sine işlev çağrısı oluşturur, takip durumunu alır ve doğal dilde bir yanıt döndürür.
  • Görme Destekli Veri Çıkarma: Bir görme-dil modeli (VLM), Ultralytics YOLO nesne algılayıcılarını araç olarak kullanabilir. Bir fabrika görüntüsünde güvenlik uyumluluğunu doğrulaması istenirse, ana konuşma yapay zekası, Ultralytics modelini çalıştıran bir komut dosyasını çağırarak detect ve nesne algılama sonuçlarını sorunsuz bir şekilde kullanıcının diyaloğuna geri döndürebilir.

Bilgisayar Görüşünü Bir Araç Olarak Entegre Etmek

Bir bilgisayar görme modelini, genel bir AI ajanı için işlevsel bir araç olarak ortaya koyabilirsiniz. Bu mimaride, görsel veriler gerektiğinde bir akıl yürütme modelinin tetikleyebileceği, çıkarım gerçekleştiren bir Python tanımlarsınız.

from ultralytics import YOLO


# Define a specific tool function for an AI agent to call
def count_objects_in_scene(image_url: str) -> str:
    # Load the highly efficient YOLO26 model
    model = YOLO("yolo26n.pt")

    # Perform inference to analyze the visual data
    results = model(image_url)
    object_count = len(results[0].boxes)

    # Return structured context back to the calling AI system
    return f"Vision Analysis: Detected {object_count} objects in the scene."


# Simulated function call executed by an AI system
print(count_objects_in_scene("https://ultralytics.com/images/bus.jpg"))

İlgili Terimlerin Farklılaştırılması

Modern AI mimarilerini tam olarak kavramak için, işlev çağrısının benzer kavramlarla nasıl ilişkili olduğunu ve onlardan nasıl farklı olduğunu anlamak yararlıdır :

  • Model Bağlam Protokolü (MCP): İşlev çağrısı, model isteminde aktarılan belirli API tanımlarına dayanırken, MCP kapsamlı, standartlaştırılmış bir mimaridir. MCP, AI modellerini veri kaynaklarına bağlamak için evrensel bir protokol oluştururken, işlev çağrısı, modellerin bu bağlantıları gerçekten çağırmak için kullandıkları yerelleştirilmiş bir mekanizmadır.
  • Geri Alma ile Güçlendirilmiş Üretim (RAG): RAG, LLM'nin komut istemini güçlendirmek için ilgili metinleri veya belgeleri almak üzere özel olarak tasarlanmış bir metodolojidir. İşlev çağırma daha geniş bir mekanizmadır; bir AI, RAG'yi gerçekleştirmek için bir araç kullanabilir, ancak aynı zamanda dosyaları diske yazmak veya e-posta göndermek için de araçlar kullanabilir. Araçları kullanan RAG'nin kapsamlı uygulamalarını PyTorch ve Google multimodal kılavuzlarında bulabilirsiniz.
  • AI Ajanı: AI ajanı, çevresini algılayan ve bir hedefe ulaşmak için eylemlerde bulunan tam otonom bir sistemdir. İşlev çağırma, ajanlara bu eylemleri gerçekleştirme yeteneği kazandıran temel beceridir. Büyük ölçekli ajan sistemleri dağıtırken, ekipler genellikle Ultralytics kullanarak bu ajanların dünyayı görmek için çağırdıkları temel görsel modelleri sorunsuz bir şekilde eğitir ve sunar. Statik modellerden ajan iş akışlarına geçiş yapan kuruluşlar genellikle TensorFlow gibi derin öğrenme kütüphanelerine güvenir. TensorFlow gibi derin öğrenme kütüphanelerine güvenirler.

Ultralytics YOLO ile güçlenin

Projeleriniz için gelişmiş yapay zeka vizyonu edinin. Hedeflerinize uygun lisansı bugün bulun.

Lisanslama seçeneklerini keşfedin