Yolo 비전 선전
선전
지금 참여하기
용어집

도구 사용(도구 활용)

함수 호출과 도구 사용이 어떻게 AI가 API 및 데이터베이스와 상호작용할 수 있게 하는지 알아보세요. 지금 바로 Ultralytics 에이전트 기반 워크플로에 통합하는 방법을 배우세요.

함수 호출은 흔히 도구 사용이라고 불리며, 현대 인공지능(AI) 에서 모델이 정적 텍스트나 이미지 생성 이상의 능력을 확장할 수 있게 하는 강력한 패러다임이다. 내부 훈련 데이터에 기반해 프롬프트에 단순히 응답하는 대신, 모델은 외부 프로그래밍 함수를 실행하거나 데이터베이스를 쿼리하거나 REST API와 상호작용하는 구조화된 명령을 출력할 수 있다. 이 접근법은 효과적으로 AI가 디지털 환경에서 실질적인 행동을 취할 수 있는 능력을 부여한다.

AI 시스템이 함수 호출을 활용할 때 개발자는 JSON 스키마를 사용하여 설명된 사용 가능한 도구 목록을 모델에 제공합니다. 사용자의 프롬프트가 실시간 데이터나 특정 작업을 요구하는 경우, 모델은 표준 생성 프로세스를 일시 중지하고 선택된 도구의 필수 매개변수와 일치하는 고도로 구조화된 JSON 형식 페이로드를 출력합니다. OpenAI의 함수 호출 API나 Anthropic 도구 사용 프레임워크같은 기술이 이 기법을 대중화하여 대화형 에이전트를 유능한 문제 해결사로 변모시켰습니다.

실제 애플리케이션

도구 사용을 워크플로에 통합하면 소프트웨어 운영 방식이 변모합니다. 버클리 함수 호출 리더보드( Berkeley Function Calling Leaderboard)와 같은 벤치마크로 평가되는 이러한 기능들은 고도로 자율적인 시스템으로의 전환을 주도하고 있습니다.

  • 자동화된 소매 및 고객 서비스: 소매업에서 인공지능은 가상 비서가 함수 호출을 통해 실시간 재고를 조회할 수 있게 합니다. 고객이 "내 주문은 어디 있나요?"라고 묻는 경우, 모델은 데이터베이스 API에 대한 함수 호출을 생성하고 추적 상태를 조회한 후 자연어 응답을 반환합니다.
  • 비전 보조 데이터 추출: 비전-언어 모델(VLM)Ultralytics YOLO 객체 탐지기를 도구로 활용할 수 있습니다. 공장 이미지에서 안전 규정 준수를 확인하라는 요청을 받으면, 주 대화형 AI는 Ultralytics 모델을 실행하는 스크립트를 호출하여 detect , 탐지 결과를 사용자의 대화창에 원활하게 반환할 수 있습니다.

컴퓨터 비전을 도구로 통합하기

컴퓨터 비전 모델을 포괄적인 AI 에이전트를 위한 기능적 도구로 노출할 수 있습니다. 이 아키텍처에서는 추론을 수행하는 Python 정의하며, 이 메서드는 시각적 데이터가 필요할 때 추론 모델이 트리거할 수 있습니다.

from ultralytics import YOLO


# Define a specific tool function for an AI agent to call
def count_objects_in_scene(image_url: str) -> str:
    # Load the highly efficient YOLO26 model
    model = YOLO("yolo26n.pt")

    # Perform inference to analyze the visual data
    results = model(image_url)
    object_count = len(results[0].boxes)

    # Return structured context back to the calling AI system
    return f"Vision Analysis: Detected {object_count} objects in the scene."


# Simulated function call executed by an AI system
print(count_objects_in_scene("https://ultralytics.com/images/bus.jpg"))

관련 용어 차별화

현대 AI 아키텍처를 완전히 이해하려면 함수 호출이 유사한 개념들과 어떻게 관련되고 어떻게 다른지 이해하는 것이 도움이 됩니다:

  • 모델 컨텍스트 프로토콜(MCP): 함수 호출이 모델 프롬프트에 전달된 특정 API 정의에 의존하는 반면, MCP는 포괄적이고 표준화된 아키텍처입니다. MCP는 AI 모델을 데이터 소스에 연결하기 위한 보편적 프로토콜을 생성하는 반면, 함수 호출은 모델이 실제로 해당 연결을 호출하기 위해 사용하는 지역화된 메커니즘입니다.
  • 검색 강화 생성(RAG): RAG는 LLM 프롬프트를 보강하기 위해 관련 텍스트나 문서를 검색하도록 특별히 설계된 방법론입니다. 함수 호출은 더 광범위한 메커니즘입니다. AI는 도구를 사용하여 RAG를 수행할 수 있지만, 도구를 사용하여 파일을 디스크에 쓰거나 이메일을 보낼 수도 있습니다. 도구 활용을 통한 RAG의 포괄적인 구현 예시는 PyTorch Google 멀티모달 가이드에서 확인할 수 있습니다.
  • AI 에이전트: AI 에이전트는 환경을 인지하고 목표 달성을 위해 행동을 취하는 완전한 자율 시스템입니다. 함수 호출은 에이전트가 이러한 행동을 실행할 수 있게 하는 핵심 기술입니다. 대규모 에이전트 기반 시스템을 배포할 때 팀들은 종종 Ultralytics 활용하여 이러한 에이전트가 세상을 보기 위해 호출하는 기반 시각 모델을 원활하게 훈련하고 서비스합니다. 정적 모델에서 에이전트 기반 워크플로로 전환하는 조직들은 종종 TensorFlow와 같은 딥러닝 라이브러리에 의존합니다. TensorFlow 를 활용하여 이러한 함수들이 통신하는 엔드포인트를 최적화합니다.

Ultralytics YOLO 파워업

프로젝트에 필요한 고급 AI 비전을 확보하세요. 오늘 목표에 맞는 라이선스를 찾아보세요.

라이선스 옵션 살펴보기