Khám phá cách gọi hàm và sử dụng công cụ giúp AI tương tác với API và cơ sở dữ liệu. Tìm hiểu cách tích hợp Ultralytics YOLO26 được tích hợp vào quy trình làm việc dựa trên tác nhân ngay hôm nay.
Gọi hàm, thường được gọi là sử dụng công cụ, là một mô hình mạnh mẽ trong trí tuệ nhân tạo (AI) hiện đại, cho phép các mô hình mở rộng khả năng của chúng vượt ra ngoài việc tạo văn bản hoặc hình ảnh tĩnh. Thay vì chỉ trả lời một lời nhắc dựa trên dữ liệu huấn luyện nội bộ, mô hình có thể xuất ra các lệnh có cấu trúc để kích hoạt các chức năng lập trình bên ngoài, truy vấn cơ sở dữ liệu hoặc tương tác với API REST . Cách tiếp cận này giúp AI có khả năng thực hiện các hành động hữu hình trong môi trường kỹ thuật số.
Khi một hệ thống AI sử dụng phương pháp gọi hàm, các nhà phát triển sẽ cung cấp cho mô hình một danh sách các công cụ có sẵn được mô tả bằng JSON Schema . Nếu yêu cầu của người dùng cần dữ liệu thời gian thực hoặc một hành động cụ thể, mô hình sẽ tạm dừng quá trình tạo dữ liệu tiêu chuẩn và xuất ra một tải trọng định dạng JSON có cấu trúc cao, phù hợp với các tham số cần thiết của công cụ đã chọn. Các framework như API gọi hàm của OpenAI và framework sử dụng công cụ của Anthropic đã phổ biến kỹ thuật này, biến các tác nhân hội thoại thành những người giải quyết vấn đề hiệu quả.
Việc tích hợp sử dụng công cụ vào quy trình làm việc sẽ thay đổi cách thức hoạt động của phần mềm. Được đánh giá bởi các tiêu chuẩn như Berkeley Function Calling Leaderboard , những khả năng này đang thúc đẩy sự chuyển dịch hướng tới các hệ thống tự động hóa cao.
Bạn có thể trình bày mô hình thị giác máy tính như một công cụ chức năng cho một tác nhân AI tổng thể. Trong kiến trúc này, bạn định nghĩa một Python Phương pháp thực hiện suy luận, mà mô hình lý luận có thể kích hoạt khi cần dữ liệu trực quan.
from ultralytics import YOLO
# Define a specific tool function for an AI agent to call
def count_objects_in_scene(image_url: str) -> str:
# Load the highly efficient YOLO26 model
model = YOLO("yolo26n.pt")
# Perform inference to analyze the visual data
results = model(image_url)
object_count = len(results[0].boxes)
# Return structured context back to the calling AI system
return f"Vision Analysis: Detected {object_count} objects in the scene."
# Simulated function call executed by an AI system
print(count_objects_in_scene("https://ultralytics.com/images/bus.jpg"))
Để nắm bắt đầy đủ các kiến trúc AI hiện đại, việc hiểu được mối liên hệ và sự khác biệt giữa việc gọi hàm với các khái niệm tương tự là rất hữu ích: