Function Calling (Tool Use)

함수 호출 및 도구 사용(function calling and tool use)이 AI가 API 및 데이터베이스와 상호 작용할 수 있도록 어떻게 힘을 실어주는지 알아보십시오. 오늘날 에이전트 워크플로에 Ultralytics YOLO26을 통합하는 방법을 학습하십시오.

도구 사용이라고도 자주 불리는 함수 호출은 모델이 정적인 텍스트나 이미지 생성을 넘어 그 기능을 확장할 수 있도록 하는 현대 인공지능(AI)의 강력한 패러다임입니다. 모델은 내부 학습 데이터에 기반하여 프롬프트에 답변하는 것에 그치지 않고, 외부 프로그래밍 함수를 실행하거나, 데이터베이스를 조회하거나, REST API와 상호작용하기 위한 구조화된 명령을 출력할 수 있습니다. 이러한 접근 방식은 AI가 디지털 환경에서 실질적인 행동을 취할 수 있는 능력을 효과적으로 부여합니다.

AI 시스템이 함수 호출을 활용할 때, 개발자는 JSON Schema를 사용하여 설명된 사용 가능한 도구 목록을 모델에 제공합니다. 사용자의 프롬프트에 실시간 데이터나 특정 작업이 필요한 경우, 모델은 표준 생성 프로세스를 일시 중지하고 선택된 도구의 필수 매개변수와 일치하는 고도로 구조화된 JSON 형식 페이로드를 출력합니다. OpenAI의 함수 호출 API 및 Anthropic의 도구 사용 프레임워크와 같은 프레임워크는 이 기술을 대중화하여 대화형 에이전트를 유능한 문제 해결사로 탈바꿈시켰습니다.

Link to this section실제 애플리케이션 사례#

워크플로우에 도구 사용을 통합하는 것은 소프트웨어 운영 방식을 변화시킵니다. Berkeley Function Calling Leaderboard와 같은 벤치마크를 통해 평가되는 이러한 기능은 고도로 자율적인 시스템으로의 전환을 주도하고 있습니다.

자동화된 리테일 및 고객 서비스: 리테일 AI에서 가상 비서는 function calling을 사용하여 실시간 재고를 조회할 수 있습니다. 고객이 "내 주문은 어디에 있나요?"라고 물으면, 모델은 데이터베이스 API에 대한 함수 호출을 생성하고, 배송 상태를 검색한 후 자연어 응답을 반환합니다.
비전 보조 데이터 추출: vision-language model (VLM)은 Ultralytics YOLO 객체 탐지기를 도구로 사용할 수 있습니다. 공장 이미지에서 안전 규정 준수 여부를 확인하라는 요청을 받으면, 메인 대화형 AI는 Ultralytics YOLO26 모델을 실행하는 스크립트를 호출하여 안전모를 탐지하고, 그 object detection 결과를 사용자의 대화창에 원활하게 반환할 수 있습니다.

Link to this section컴퓨터 비전을 도구로 통합하기#

컴퓨터 비전 모델을 전체적인 AI agent를 위한 기능적 도구로 노출할 수 있습니다. 이 아키텍처에서는 추론을 수행하는 Python 메서드를 정의하며, 추론 모델은 시각적 데이터가 필요할 때 이 메서드를 트리거할 수 있습니다.

from ultralytics import YOLO


# Define a specific tool function for an AI agent to call
def count_objects_in_scene(image_url: str) -> str:
    # Load the highly efficient YOLO26 model
    model = YOLO("yolo26n.pt")

    # Perform inference to analyze the visual data
    results = model(image_url)
    object_count = len(results[0].boxes)

    # Return structured context back to the calling AI system
    return f"Vision Analysis: Detected {object_count} objects in the scene."


# Simulated function call executed by an AI system
print(count_objects_in_scene("https://ultralytics.com/images/bus.jpg"))

Link to this section관련 용어 차별화#

현대 AI 아키텍처를 완전히 파악하려면 함수 호출이 유사한 개념들과 어떻게 관련되어 있고 어떻게 다른지 이해하는 것이 도움이 됩니다:

Model Context Protocol (MCP): 함수 호출은 모델 프롬프트에 전달되는 특정 API 정의에 의존하지만, MCP는 포괄적이고 표준화된 아키텍처입니다. MCP는 AI 모델을 데이터 소스에 연결하기 위한 보편적인 프로토콜을 생성하는 반면, 함수 호출은 모델이 이러한 연결을 실제로 호출하기 위해 사용하는 국소적인 메커니즘입니다.
Retrieval Augmented Generation (RAG): RAG는 LLM의 프롬프트를 보강하기 위해 관련 텍스트나 문서를 가져오도록 설계된 방법론입니다. 함수 호출은 더 광범위한 메커니즘입니다. AI는 도구를 사용하여 RAG를 수행할 수 있지만, 도구를 사용하여 디스크에 파일을 쓰거나 이메일을 보낼 수도 있습니다. 도구를 활용하는 RAG의 포괄적인 구현 방법은 PyTorch Documentation 및 Google Gemini multimodal guides에서 확인할 수 있습니다.
AI Agent: AI 에이전트는 환경을 인식하고 목표를 달성하기 위해 행동을 취하는 완전한 자율 시스템입니다. 함수 호출은 에이전트가 그러한 행동을 실행할 수 있는 능력을 부여하는 핵심 기술입니다. 대규모 에이전트 시스템을 배포할 때 팀은 종종 Ultralytics Platform을 사용하여 에이전트가 세상을 보기 위해 호출하는 기반 시각적 모델을 원활하게 학습하고 서빙합니다. 정적 모델에서 에이전트 워크플로우로 전환하는 조직은 종종 TensorFlow와 같은 딥러닝 라이브러리를 사용하여 이러한 함수들이 통신하는 엔드포인트를 최적화합니다.