YOLO26 소개: 차세대 비전 AI입니다.
Ultralytics
Ultralytics 용어집으로 돌아가기

TensorRT

TensorRT가 NVIDIA GPU를 위해 딥러닝 모델을 어떻게 최적화하는지 살펴보세요. 저지연 및 고속 추론을 위해 Ultralytics YOLO26을 TensorRT로 내보내는 방법을 지금 배우세요.

TensorRT는 NVIDIA에서 개발한 고성능 딥러닝 추론 소프트웨어 개발 키트(SDK)입니다. 이 SDK는 딥러닝 애플리케이션을 위해 낮은 추론 지연 시간(inference latency)과 높은 처리량을 제공하며, 배포를 위한 신경망 모델을 최적화하도록 설계되었습니다. 최적화 컴파일러로서 작동하는 TensorRT는 PyTorch 및 TensorFlow와 같은 대중적인 프레임워크에서 학습된 네트워크를 가져와 NVIDIA GPU에서 효율적으로 실행되도록 재구성합니다. 이러한 기능은 속도와 효율성이 무엇보다 중요한 프로덕션 환경에서 복잡한 AI 모델을 실행하는 데 매우 중요합니다.

Link to this sectionTensorRT가 모델을 최적화하는 방법#

TensorRT의 핵심 기능은 학습된 신경망을 대상 하드웨어에 맞게 조정된 최적화된 "엔진"으로 변환하는 것입니다. 이는 다음과 같은 몇 가지 고급 기술을 통해 달성됩니다.

  • 레이어 융합(Layer Fusion): 최적화 도구는 신경망(neural network)의 여러 레이어를 단일 커널로 결합하여 메모리 액세스 오버헤드를 줄이고 실행 속도를 향상시킵니다.
  • 정밀도 보정(Precision Calibration): TensorRT는 혼합 정밀도(mixed precision)(FP16) 및 정수 양자화(INT8)와 같은 정밀도 감소 모드를 지원합니다. 숫자를 표현하는 데 사용되는 비트 수를 줄임으로써(종종 정확도 손실을 최소화하면서) 개발자는 수학 연산 속도를 크게 높이고 메모리 사용량을 줄일 수 있습니다. 이는 모델 양자화(model quantization)의 한 형태입니다.
  • 커널 자동 튜닝(Kernel Auto-Tuning): 이 소프트웨어는 사용 중인 특정 GPU 아키텍처에 가장 적합한 데이터 레이어와 알고리즘을 자동으로 선택하여 CUDA를 통해 하드웨어의 병렬 처리 기능을 최대한 활용합니다.

Link to this section실제 애플리케이션 사례#

최소한의 지연 시간으로 방대한 양의 데이터를 처리할 수 있는 능력 덕분에, TensorRT는 타이밍이 중요한 컴퓨터 비전(computer vision) 및 복잡한 AI 작업을 수행하는 산업 분야에서 널리 채택되고 있습니다.

  1. 자율 주행 시스템: 자동차 AI(AI in automotive) 분야에서 자율 주행 차량은 여러 카메라의 비디오 피드를 처리하여 보행자, 표지판, 장애물을 즉시 감지해야 합니다. TensorRT를 사용하면 객체 탐지(object detection) 네트워크와 같은 인식 모델이 밀리초 단위로 프레임을 분석할 수 있어, 차량의 제어 시스템이 지연 없이 안전과 직결된 결정을 내릴 수 있습니다.

  2. Industrial Automation: Modern factories utilize AI in manufacturing for automated optical inspection. High-speed cameras capture images of products on assembly lines, and TensorRT-optimized models identify defects or anomalies in real time. This ensures that quality control keeps pace with high-speed production environments, often deploying on edge AI devices like the NVIDIA Jetson platform directly on the factory floor.

Link to this sectionUltralytics YOLO와 함께 TensorRT 사용하기#

최신 AI 도구를 사용하면 워크플로우에 TensorRT를 쉽게 통합할 수 있습니다. ultralytics 패키지는 표준 PyTorch 모델을 TensorRT 엔진으로 변환하는 원활한 방법을 제공합니다. 이를 통해 사용자는 Ultralytics YOLO26의 최첨단 아키텍처와 NVIDIA GPU의 하드웨어 가속 기능을 활용할 수 있습니다. 내보내기 전에 데이터 세트와 학습 파이프라인을 관리하려는 팀을 위해, Ultralytics Platform은 이러한 고성능 배포를 위해 모델을 준비할 수 있는 포괄적인 환경을 제공합니다.

다음 예제는 YOLO26 모델을 TensorRT 엔진 파일(.engine)로 내보내고 이를 실시간 추론(real-time inference)에 사용하는 방법을 보여줍니다:

from ultralytics import YOLO

# Load the latest stable YOLO26 model (nano size)
model = YOLO("yolo26n.pt")

# Export the model to TensorRT format (creates 'yolo26n.engine')
# This step optimizes the computational graph for your specific GPU
model.export(format="engine")

# Load the optimized TensorRT engine for high-speed inference
trt_model = YOLO("yolo26n.engine")

# Run inference on an image source
results = trt_model("https://ultralytics.com/images/bus.jpg")

Link to this sectionTensorRT vs. ONNX vs. 학습 프레임워크#

모델 배포(model deployment) 환경에서 자주 언급되는 다른 용어들과 TensorRT를 구별하는 것이 중요합니다.

  • vs. PyTorch/TensorFlow: PyTorch와 같은 프레임워크는 주로 모델 학습 및 연구를 위해 설계되었으며, 유연성과 디버깅 용이성을 제공합니다. TensorRT는 학습된 모델을 최대한 빠르게 실행하기 위해 설계된 추론 엔진입니다. 학습용으로는 사용되지 않습니다.
  • vs. ONNX: ONNX(Open Neural Network Exchange) 형식은 프레임워크 간의 중간 가교 역할을 합니다. ONNX는 상호 운용성(예: PyTorch에서 다른 플랫폼으로 모델 이동)을 제공하지만, TensorRT는 하드웨어별 최적화에 중점을 둡니다. 종종 모델을 먼저 ONNX로 변환한 다음, TensorRT가 이를 파싱하여 최종 엔진을 생성합니다.

AI 에이전트(AI agents) 또는 비전 시스템의 성능을 극대화하려는 개발자에게 학습 프레임워크에서 TensorRT와 같은 최적화된 런타임으로 전환하는 것을 이해하는 것은 전문적인 MLOps의 핵심 단계입니다.

Explore solutions

Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.
더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.
더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.
더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.
더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.
더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.
더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.
더 알아보기
Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.
더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.
더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.
더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.
더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.
더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.
더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.
더 알아보기
Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.
더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.
더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.
더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.
더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.
더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.
더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.
더 알아보기

미래의 AI를 함께 구축합시다!

머신 러닝의 미래와 함께 여정을 시작하십시오.