YOLO Vision 2025를 놓치지 마세요!
2025년 9월 25일
10:00 — 18:00 BST
하이브리드 이벤트
Yolo Vision 2024
용어집

실시간 추론

Ultralytics YOLO를 사용한 실시간 추론이 자율 주행 및 보안 시스템과 같은 AI 애플리케이션을 위한 즉각적인 예측을 어떻게 가능하게 하는지 알아보세요.

실시간 추론은 훈련된 머신 러닝(ML) 모델을 사용하여 지연을 최소화하면서 새로운 실시간 데이터에 대한 예측을 수행하는 프로세스입니다. AI컴퓨터 비전(CV)의 맥락에서 이는 시스템이 비디오 스트림과 같은 정보를 처리하고 거의 즉각적으로 출력을 생성할 수 있음을 의미합니다. 목표는 의사 결정에 즉시 유용하도록 추론 지연 시간을 충분히 낮추는 것입니다. 이 기능은 타이밍이 중요한 애플리케이션에 매우 중요하며 자동차에서 의료에 이르기까지 산업이 AI를 활용하는 방식을 변화시킵니다.

실시간 추론 vs. 배치 추론

실시간 추론과 배치 추론을 구별하는 것이 중요합니다. 주요 차이점은 데이터 처리 방식에 있습니다.

  • 실시간 추론: 일반적으로 한 번에 하나의 입력 또는 작은 스트림으로 데이터가 생성되거나 수신될 때 데이터를 처리합니다. 우선 순위는 입력과 출력 사이의 지연 시간(latency, 지연 시간)을 최소화하는 것입니다. 이는 대화형 및 시간에 민감한 시스템에 필수적입니다.
  • 배치 추론: 일정 기간 동안 데이터를 수집하여 대규모 배치로 한 번에 모두 처리하는 것을 포함합니다. 이 접근 방식은 지연 시간을 최소화하기보다는 처리량(시간 경과에 따라 처리되는 데이터 양)을 최대화하는 데 우선 순위를 둡니다. 배치 처리는 일일 보고서 생성 또는 대규모 데이터 세트의 주기적 분석과 같은 긴급하지 않은 작업에 적합합니다.

둘 다 학습된 모델을 사용하여 예측을 수행하지만, 결과의 긴급성에 따라 사용 사례는 근본적으로 다릅니다.

실제 세계에서의 애플리케이션

즉각적인 의사 결정을 내릴 수 있는 능력은 다양한 분야에서 광범위하고 강력한 애플리케이션을 가능하게 합니다.

  1. 자율 시스템: 자율 주행차에서 실시간 추론은 안전 문제입니다. 모델은 안전하게 탐색하고 충돌을 피하기 위해 밀리초 단위로 보행자, 다른 차량 및 도로 표지판을 식별하기 위해 객체 감지를 수행해야 합니다. 마찬가지로 드론과 로봇은 탐색과 환경과의 상호 작용을 위해 이에 의존합니다.
  2. 스마트 제조: 생산 라인에서 AI가 장착된 카메라는 실시간 품질 관리를 수행할 수 있습니다. Ultralytics YOLO11과 같은 모델은 컨베이어 벨트에서 움직이는 제품의 결함을 감지하여 즉시 제거할 수 있습니다. 이는 현대적인 제조 분야의 AI의 핵심 구성 요소입니다.
  3. 대화형 의료: 수술 절차 중 모델은 카메라의 실시간 비디오를 분석하여 외과의에게 실시간 지침을 제공할 수 있습니다. 진단 환경에서 실시간 의료 영상 분석은 의사가 라이브 스캔 중에 이상 징후를 더 빠르게 식별하는 데 도움이 될 수 있습니다.
  4. 스마트 감시: 최신 보안 시스템은 실시간 추론을 사용하여 비디오 피드를 분석하고 무단 침입 또는 버려진 패키지와 같은 잠재적 위협을 식별하여 즉각적인 경고를 트리거합니다. 이는 단순한 기록을 넘어 능동적인 지능형 모니터링으로 발전합니다.

실시간 성능 달성

실시간 컴퓨팅 애플리케이션에 충분히 빠르게 모델을 실행하려면 상당한 최적화가 필요한 경우가 많습니다.

  • 모델 최적화: 모델 양자화(모델 가중치의 정밀도 감소) 및 모델 가지치기(모델의 불필요한 부분 제거)와 같은 기술은 계산 부하 및 메모리 사용량을 줄입니다.
  • 하드웨어 가속: GPU, TPU(Tensor Processing Unit) 또는 에지 장치(예: NVIDIA Jetson, Google Coral Edge TPU)의 전용 AI 가속기와 같은 특수 하드웨어를 활용하면 계산 속도를 크게 높일 수 있습니다. 에지 컴퓨팅 자체는 지연 시간을 최소화하면서 로컬에서 데이터를 처리하는 데 매우 중요합니다.
  • 효율적인 추론 엔진: TensorRT, OpenVINO, ONNX Runtime과 같은 소프트웨어 라이브러리 및 런타임과 PyTorch 또는 TensorFlow와 같은 프레임워크는 학습된 모델에 대해 최적화된 실행 경로를 제공합니다. 추론 엔진은 예측을 위해 모델을 효율적으로 실행하도록 특별히 설계되었습니다.

Ultralytics YOLO와 같은 모델은 효율성과 정확성을 염두에 두고 설계되었으므로 실시간 객체 감지 작업에 적합합니다. Ultralytics HUB와 같은 플랫폼은 모델을 학습, 최적화(예: ONNX 또는 TensorRT 형식으로 내보내기) 및 배포하는 도구를 제공하여 다양한 배포 옵션에서 실시간 추론 솔루션의 구현을 용이하게 합니다.

Ultralytics 커뮤니티에 참여하세요

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기
클립보드에 링크가 복사되었습니다.