YOLO26 소개: 차세대 비전 AI입니다.
Ultralytics
Ultralytics 용어집으로 돌아가기

Visual Reasoning

AI의 시각적 추론을 탐구하고 모델이 공간 논리를 어떻게 추론하는지 학습하십시오. Ultralytics YOLO26을 사용하여 고급 추론 파이프라인을 구축하는 방법을 알아보십시오.

인공지능 분야에서 시각적 추론(Visual reasoning)이란 모델이 시각적 및 공간적 데이터를 분석하고 해석하여 논리적 결론을 도출하는 능력을 의미합니다. 표준 컴퓨터 비전(CV) 시스템이 장면 내에 어떤 객체가 존재하는지 식별하는 데 탁월하다면, 시각적 추론은 이러한 객체들이 어떻게 그리고 상호작용하는지 이해하는 단계로 나아갑니다. 인간의 인지적 시각 추론 능력에서 영감을 얻고 표준 인지 심리학 테스트를 통해 평가되는 이 역량은 AI 모델이 오직 시각적 맥락만을 바탕으로 복잡한 이미지 분석을 수행하고, 공간적 관계를 추론하며, 다단계 문제를 해결할 수 있게 합니다. 이는 멀티모달 AI 시스템에서 원시 지각과 실행 가능한 인텔리전스 사이의 간극을 메우는 데 중요한 요소입니다.

Link to this section핵심 개념 및 "이미지로 사고하기" 패러다임#

역사적으로 머신러닝 모델은 논리적 추론을 적용하기 전에 이미지 데이터를 텍스트로 변환했습니다. 그러나 2024년과 2025년의 최근 개발 흐름은 모델이 본질적으로 이미지로 사고하는(think with images) 패러다임을 대중화했습니다. 잠재적 시각 추론을 활용함으로써, 고도화된 비전-언어 모델(VLM)은 결론에 도달하기 전에 NIH 툴박스 공간 매개변수에 정의된 것처럼 인간이 정신적 지도를 시각화하는 것과 유사한 중간 시각적 표현을 생성할 수 있습니다.

이 접근 방식은 종종 멀티모달 사고 시각화(MVoT, Multimodal Visualization-of-Thought)라고 알려진 메커니즘을 사용합니다. 텍스트 기반의 사고 연쇄에만 의존하는 대신, 시스템은 공간 시각화 추론을 탐색하여 기하학적 변화를 검증하고, 가려짐(occlusion)을 평가하며, 3D 공간 내의 연속적인 움직임을 추적할 수 있습니다.

Link to this section시각적 추론과 관련 역량 비교#

시각적 추론을 다른 중첩되는 AI 용어와 구분하면 이해에 도움이 됩니다:

  • 추론 모델(Reasoning Models): 이는 일반적으로 텍스트, 수학, 코딩 분야에서 다단계 논리 추론을 위해 설계된 모델을 포함하는 더 넓은 범주입니다. 시각적 추론은 이러한 추론 원칙을 시각적 및 공간적 데이터에 구체적으로 적용합니다.
  • 시각적 질의응답(VQA): VQA는 AI가 이미지에 대한 사용자 질문에 자연어로 답변을 제공하는 특정 응용 프로그램 또는 작업입니다. 시각적 추론은 VQA를 구동하는 근본적인 인지 역량으로서, 모델이 공간적 맥락을 바탕으로 올바른 답변을 추론하게 합니다.

Link to this section실제 애플리케이션 사례#

공간적 맥락을 동적으로 해석하는 능력은 물리적 영역과 디지털 영역 전반에서 혁신적인 에이전트 워크플로(agentic workflows)를 실현하고 있습니다.

  • 로봇 공학 및 체화된 지능 분야의 AI: 자율 에이전트와 로봇 팔은 복잡한 환경을 탐색하기 위해 정교한 공간 지능을 필요로 합니다. 시각적 추론을 활용함으로써, 로봇은 깨지기 쉬운 물체가 무거운 상자 아래에 쌓여 있음을 추론하고, 동적 물리적 제약 조건 평가에 크게 의존하여 손상 없이 이를 회수하기 위한 일련의 움직임을 논리적으로 계획할 수 있습니다.
  • 의료 진단 분야의 AI: 의료 영상 분야에서 전문가들은 기본적인 이상 탐지(anomaly detection)를 넘어 시각적 추론 시스템을 사용합니다. 모델은 3D MRI 스캔을 평가하여 주변 장기와 비교한 종양의 성장 궤적을 구조적으로 추론함으로써 수술 계획을 위한 중요한 기하학적 맥락을 제공할 수 있습니다.

Link to this section추론 파이프라인을 위한 지각 구현#

효과적인 추론 시스템을 구축하기 위해 개발자들은 물리적 세계에서 구조적 맥락을 추출하는 고속 지각 모델에 의존합니다. Ultralytics YOLO26은 강력한 기반 계층으로서, 픽셀을 구조화된 bounding box 좌표와 객체 클래스로 빠르게 변환합니다. 이 구조화된 데이터는 공간 논리를 평가하기 위해 PyTorchTensorFlow와 같은 프레임워크로 구축된 특수 시각 추론 엔진에 전달됩니다.

이 작업을 위해 YOLO26과 YOLO11을 비교하고 있다면, YOLO26의 네이티브 엔드투엔드 아키텍처가 추론 지연 시간을 최소화하므로 실시간 논리 파이프라인에 이상적입니다.

다음 Python 코드 스니펫은 YOLO26을 사용하여 공간 좌표를 추출하는 방법을 보여주며, 이는 후속 공간 추론에 필요한 필수적인 지각 입력을 제공합니다:

from ultralytics import YOLO

# Load the Ultralytics YOLO26 model to act as the perception layer
model = YOLO("yolo26n.pt")

# Run inference to detect objects in a scene
results = model("https://ultralytics.com/images/bus.jpg")

# Extract structured spatial data for the visual reasoning engine
for result in results:
    for box in result.boxes:
        cls_name = model.names[int(box.cls)]
        # xyxy provides exact spatial coordinates (left, top, right, bottom)
        coords = box.xyxy[0].tolist()
        print(f"Object: {cls_name}, Spatial Coordinates: {coords}")

이러한 복잡한 멀티모달 애플리케이션을 확장하려면 탄탄한 인프라가 필요합니다. Ultralytics Platform공간 지능(spatial intelligence) 데이터셋을 원활하게 어노테이션하고, 클라우드에서 모델을 학습시키며, 신뢰할 수 있는 엣지 지각 시스템을 배포할 수 있는 통합 환경을 제공합니다. 분야가 더 진보된 공간 작업을 위한 에이전트 프레임워크로 발전하고 첨단 비전 연구가 이를 뒷받침함에 따라, 고정밀 객체 탐지(object detection)와 논리적 추론을 결합하는 것은 인공지능의 차세대 개척 분야가 될 것입니다.

Explore solutions

Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.

더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.

더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.

더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.

더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.

더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.

더 알아보기
Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.

더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.

더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.

더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.

더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.

더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.

더 알아보기
Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.

더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.

더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.

더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.

더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.

더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.

더 알아보기

미래의 AI를 함께 구축합시다!

머신 러닝의 미래와 함께 여정을 시작하십시오.