Yolo 비전 선전
선전
지금 참여하기
용어집

AI 에이전트

인공지능 에이전트의 세계를 탐험하세요. 이 자율 시스템들이 Ultralytics 활용하여 복잡한 과제를 해결하기 위해 실시간으로 인지하고, 추론하며, 행동하는 방식을 알아보세요.

인공지능 에이전트는 환경을 인지하고, 복잡한 논리를 통해 추론하여 결정을 내리며, 정의된 목표를 달성하기 위해 특정 행동을 취할 수 있는 자율 시스템입니다. 입력을 수동적으로 처리하여 출력을 생성하는 정적인 머신러닝 모델과 달리, 에이전트는 지속적인 워크플로우 내에서 동적으로 작동합니다. 이러한 시스템은 디지털 예측과 현실 세계 실행 사이의 간극을 메우는 인공지능의"능동적" 계층을 형성합니다. 기억과 적응형 학습을 활용함으로써, 에이전트는 지속적인 인간 개입 없이 소프트웨어 자동화부터 물리적 탐색에 이르는 다양한 작업을 처리할 수 있습니다.

인식-추론-행동 루프

인공지능 에이전트의 기능은 종종 지각-행동 루프( Perception-Action Loop)로 설명되는 순환적 과정에 의존합니다. 이 아키텍처는 에이전트가 주변 환경과 의미 있게 상호작용할 수 있도록 합니다.

  1. 인식(감지): 에이전트는 세상으로부터 정보를 수집합니다. 컴퓨터 비전 애플리케이션에서 에이전트는 카메라를 "눈"으로 사용합니다. YOLO26과 같은 고속 모델을 활용하여 객체 탐지 또는 분할을 수행하며, 원시 픽셀을 구조화된 데이터로 변환합니다.
  2. 추론(사고): 에이전트는 인지된 데이터를 목표에 맞춰 처리합니다. 이 단계에서는 의미 이해를 위해 대규모 언어 모델(LLM) 을 통합하거나 의사결정 전략을 최적화하기 위해 강화 학습 알고리즘을 활용하는 경우가 많습니다. 고급 에이전트는 체스 선수처럼 미래의 수를 예측하듯 여러 단계 앞을 계획할 수 있습니다.
  3. 작업(실행): 추론 결과를 바탕으로 에이전트가 작업을 실행합니다. 이는 데이터베이스 조회나 경고 발송과 같은 디지털 작업이거나, 로봇 팔이 컨베이어 벨트에서 특정 품목을 집어 올리는 것과 같은 물리적 작업일 수 있습니다.

AI 에이전트 vs. AI 모델

에이전트와 모델은 기술 스택 내에서 서로 다른 역할을 수행하므로 이 둘을 구분하는 것이 중요합니다.

  • AI 모델: 모델은 패턴을 인식하도록 훈련된 신경망과 같은 수학적 엔진입니다. 이는 예측(예: "이것은 자동차입니다")을 제공하는 도구이지만, 본질적으로 그 예측에 따라 행동하지는 않습니다.
  • AI 에이전트: 에이전트는 모델을 도구로 활용하는 포괄적인 시스템입니다. 이는 주체성—변화를 주도할 수 있는 능력—을 지닙니다. 예를 들어, 모델이 빨간 불을 식별하는 동안 에이전트는 브레이크를 작동하기로 결정합니다.

실제 애플리케이션

인공지능 에이전트는 인지적 유연성이 필요한 업무 흐름을 자동화함으로써 산업을 변화시키고 있다.

  • 스마트 제조: 산업 자동화에서 시각적 에이전트가 생산 라인을 모니터링합니다. 품질 관리 시스템이 결함을 식별하면 에이전트가 자율적으로 기계를 정지시키고 해당 사건을 기록하여 낭비를 방지합니다.
  • 자율 물류: 창고에서는 재고 관리를 위해 에이전트형 로봇을 활용합니다. 이 에이전트들은 동적 환경을 탐색하기 위해 SLAM(동시 위치 추정 및 매핑)과 비전 모델을 사용하여 패키지를 효율적으로 위치 파악, 픽업 및 운반합니다.

간단한 비전 에이전트 구축

개발자는 인지 모델과 조건부 논리를 결합하여 기본 에이전트를 구축할 수 있습니다. 다음 Python 를 사용한 간단한 "보안 에이전트"를 보여줍니다. ultralytics 에이전트는 사람을 감지하고 모델의 신뢰도에 따라 경보를 발령할지 여부를 결정합니다.

from ultralytics import YOLO

# Load the YOLO26 model (The Agent's Perception)
model = YOLO("yolo26n.pt")

# 1. Perceive: The agent analyzes an image
results = model("bus.jpg")

# 2. Reason & 3. Act: Decision logic based on perception
for result in results:
    # Check if a 'person' (class 0) is detected with high confidence
    if 0 in result.boxes.cls and result.boxes.conf.max() > 0.5:
        print("ACTION: Person detected! Initiating security protocol.")
    else:
        print("ACTION: Area clear. Continuing surveillance.")

관련 개념

  • 엣지 AI: 실시간 반응을 위해 에이전트는 NVIDIA 같은 하드웨어에서 로컬로 실행되며, 클라우드 대신 소스에서 데이터를 처리함으로써 지연 시간을 최소화합니다.
  • 인공 일반 지능(AGI): 현재의 에이전트들은 특화된(좁은 AI) 반면, AGI는 인간이 수행할 수 있는 모든 지적 작업을 수행할 수 있는 가상적 에이전트를 의미한다.
  • 생성형 AI: 현대 에이전트들은 동적 응답이나 코드를 생성하기 위해 생성형 AI를 자주 활용하며, 워크플로우의 일환으로 콘텐츠를 생성할 수 있는 보조 도구 역할을 수행합니다.

에이전트용 기반 모델을 훈련하려는 분들을 위해 Ultralytics 데이터셋 주석 작업 및 훈련 실행 관리를 위한 간소화된 환경을 제공합니다. 에이전트 아키텍처에 대한 추가 자료는 스탠퍼드 HAIDeepMind와 같은 기관의 연구에서 확인할 수 있습니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기