Yolo 비전 선전
선전
지금 참여하기
용어집

AI 에이전트

AI 에이전트가 무엇이며 이러한 자율 시스템이 최신 자동화를 어떻게 지원하는지 알아보세요. 인지-사고-행동 루프와 컴퓨터 비전 및 로봇 공학에서의 역할을 알아보세요.

AI 에이전트는 환경을 인식하고 특정 목표를 달성하는 방법을 추론하여 특정 목표를 달성하기 위한 조치를 취하도록 설계된 자율 시스템입니다. 단순히 입력을 처리하여 출력을 생성하는 정적 AI 모델과 달리 단순히 입력을 처리하여 출력을 생성하는 정적 AI 모델과 달리, AI 에이전트는 데이터를 수집하고, 그 데이터를 기반으로 의사 결정을 내리고 데이터를 기반으로 의사 결정을 내리고 사람의 지속적인 개입 없이 작업을 실행합니다. 이러한 기능 덕분에 에이전트는 인공지능 세계의 '실행자'가 되어 인공지능 에이전트는 추상적인 데이터 분석과 실제 영향력 사이의 간극을 메워주는 역할을 합니다.

인식-사고-행동 루프

AI 에이전트의 핵심 기능은 흔히 다음과 같은 운영 주기로 정의됩니다. 인식-행동 루프. 이 지속적인 프로세스를 통해 에이전트는 변화하는 환경에 적응하고 적응하고 시간이 지남에 따라 개선할 수 있습니다.

  1. 인식(감지): 에이전트는 센서를 사용하여 주변 환경에 대한 정보를 수집합니다. 컴퓨터 비전(CV)의 컴퓨터 비전(CV)의 맥락에서 이러한 "눈"은 시각적 데이터를 캡처하는 카메라 또는 LiDAR 시스템입니다.
  2. 생각하기(처리 및 의사 결정): 에이전트는 감각 입력을 처리하기 위해 "두뇌"-일반적으로 머신 러닝(ML) 모델 또는 대규모 언어 모델(LLM)을 사용합니다. 에이전트는 다음을 분석합니다. 현재 상태를 목표와 비교하여 최상의 행동 방침을 결정합니다. 고급 에이전트는 다음을 사용할 수 있습니다. 강화 학습을 통해 최적의 전략을 학습할 수 있습니다.
  3. 행위(실행): 에이전트가 액추에이터를 사용하여 선택한 결정을 실행합니다. 로봇 공학에서는 기계 팔을 움직일 수 있습니다. 기계 팔을 움직이거나, 소프트웨어에서는 API 요청을 보내거나 파일을 작성하거나 알림을 트리거합니다.

AI 에이전트 대 AI 모델

용어가 혼동되는 경우가 많으므로 AI 에이전트와 AI 모델을 구분하는 것이 중요합니다.

  • AI 모델: 수학 엔진( YOLO11)을 통해 패턴을 인식하거나 예측하도록 훈련된 수학적 엔진. 수동적이며 입력을 기다렸다가 결과를 반환합니다. 디지털 백과사전이나 고속 카메라와 같은 정교한 도구라고 생각하세요. 백과사전이나 고속 카메라와 같은 정교한 도구라고 생각하세요.
  • AI 에이전트: 하나 이상의 모델을 도구로 사용하여 목표를 달성하는 자율 시스템입니다. 에이전트는 워크플로우를 관리하고, 과거의 상호작용을 기억하며, 세상과 적극적으로 소통합니다. 모델이 엔진이라면 엔진이라면 에이전트는 운전자라고 할 수 있습니다.

실제 애플리케이션

AI 에이전트는 과거에는 사람의 감독이 필요했던 복잡한 워크플로우를 자동화하여 산업을 혁신하고 있습니다.

스마트 제조 및 로봇 공학

산업 환경에서 로봇 공학 분야의 AI는 품질 관리를 감독하는 품질 관리를 감독하는 에이전트를 강화합니다. 물체 감지 모델을 탑재한 육안 검사 에이전트는 물체 감지 모델이 장착된 시각 검사 에이전트는 컨베이어 벨트. 결함을 감지하면 단순히 오류를 기록하는 데 그치지 않고 로봇 팔(액추에이터)을 작동하여 결함이 있는 품목을 즉시 제거합니다. 이 자율 루프는 효율성을 높이고 낭비를 줄입니다.

자율 주행 차량

자율 주행 자동차는 가장 가장 정교한 AI 에이전트의 예입니다. 자율 주행 자동차는 일련의 센서를 활용하여 차선 표시, 교통 표지판, 그리고 보행자. 온보드 에이전트는 이러한 데이터 스트림을 실시간으로 처리하여 조향, 가속, 제동 등 생명에 중요한 결정을 내립니다, 가속 또는 제동과 같은 생명과 직결된 결정을 내림으로써 A 지점에서 B 지점까지 안전하게 이동할 수 있습니다. Waymo와 같은 회사는 이러한 자율주행 차량을 공공 도로에 자율주행 차량을 배치하는 데 앞장서고 있습니다.

간단한 비전 에이전트 구축

개발자는 YOLO11 같은 모델을 지각 엔진으로 사용하여 비전 기반 에이전트를 구축할 수 있습니다. 다음 Python 예제는 이미지를 인식하고, 권한이 없는 사람이 있는지 확인하고, 시뮬레이션된 경고를 트리거하여 시뮬레이션된 경고를 트리거하여 작동하는 간단한 "보안 에이전트"를 보여줍니다.

from ultralytics import YOLO

# Load the YOLO11 model (The Agent's "Brain" for perception)
model = YOLO("yolo11n.pt")

# 1. Perceive: The agent captures/receives visual data
results = model("secure_zone.jpg")

# 2. Think & 3. Act: The agent evaluates the scene and takes action
for result in results:
    # Check if a 'person' (class ID 0) is detected with high confidence
    if 0 in result.boxes.cls and result.boxes.conf.max() > 0.5:
        print("ACTION: Security Alert! Person detected in restricted area.")
    else:
        print("ACTION: Log entry - Area secure.")

관련 개념

  • 강화 학습: A 에이전트가 보상이나 페널티를 받음으로써 의사 결정을 학습하는 훈련 방법으로, 게임 플레이에 필수적입니다. 에이전트 및 복잡한 로봇 공학에 필수적입니다.
  • 엣지 AI: 클라우드가 아닌 로컬 디바이스(카메라, 드론 등)에 직접 에이전트를 클라우드가 아닌 로컬 디바이스(카메라 또는 드론 등)에 직접 배포하여 더 빠른 실시간 추론과 조치가 가능합니다.
  • 인공 일반 지능(AGI): 에이전트가 인간처럼 다양한 업무에 걸쳐 지식을 이해하고, 학습하고, 적용할 수 있는 능력을 갖춘 다양한 작업을 이해하고 학습하며 적용할 수 있는 능력을 갖춘 에이전트입니다.

인텔리전트 에이전트의 아키텍처에 대한 자세한 내용은 다음 리소스를 참조하십시오. IBM과 스탠포드 대학교의 자료에서 심도 있는 학계 및 업계의 관점을 확인할 수 있습니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기