Neural Processing Unit (NPU)
신경 처리 장치(NPU)가 AI를 어떻게 가속화하는지 배우십시오. 효율적인 저전력 엣지 컴퓨팅 및 추론을 위해 NPU에 Ultralytics YOLO26을 배포하는 방법을 알아보십시오.
신경망 처리 장치(NPU)는 인공지능 및 머신러닝 알고리즘의 실행을 가속화하기 위해 특별히 설계된 특수 하드웨어 회로입니다. 범용 프로세서와 달리 NPU는 딥러닝 모델의 핵심인 복잡한 병렬 행렬 연산을 기본적으로 처리하도록 설계된 아키텍처를 갖추고 있습니다. 이러한 연산을 극도로 효율적으로 실행함으로써 NPU는 전력 소비를 획기적으로 줄이는 동시에 추론 지연 시간을 크게 개선합니다. 이로 인해 NPU는 최신 휴대폰, 노트북 및 특수 IoT 장치의 필수 구성 요소가 되었으며, 빠른 배터리 소모 없이 복잡한 모델을 효율적으로 배포하는 것이 매우 중요합니다.
Link to this sectionNPU와 다른 프로세서 비교#
NPU의 가치를 이해하기 위해 AI 환경에서 흔히 사용되는 다른 하드웨어 가속기와 NPU를 구분하는 것이 도움이 됩니다:
- 중앙 처리 장치 (CPU): 컴퓨터의 범용 '두뇌'입니다. 머신러닝 코드를 실행할 수는 있지만, CPU는 작업을 순차적으로 처리하므로 최신 비전 모델에 필요한 대규모 행렬 곱셈에는 느리고 비효율적입니다.
- 그래픽 처리 장치 (GPU): 병렬 처리를 위해 설계된 GPU는 방대한 딥러닝 워크로드를 처리하는 데 탁월합니다. 그러나 많은 전력을 소비하고 상당한 열을 발생시키므로 배터리로 작동하는 엣지 컴퓨팅보다는 클라우드 학습에 더 적합합니다.
- 텐서 처리 장치 (TPU): Google에서 머신러닝을 위해 개발한 애플리케이션별 집적 회로입니다. 개념적으로는 NPU와 유사하지만, TPU는 일반적으로 거대한 클라우드 컴퓨팅 서버 랙과 관련이 있는 반면, NPU는 대개 소비자용 시스템 온 칩(SoC)에 직접 통합됩니다.
Link to this sectionNPU의 실제 적용 사례#
NPU의 부상은 지속적인 클라우드 연결에 의존하지 않고도 사용자 기기에서 직접 인공지능(AI)을 실행할 수 있는 능력을 열어주었습니다.
- 스마트폰 및 모바일 비전: 최신 모바일 기기는 Apple Neural Engine 또는 Qualcomm Hexagon NPU와 같은 내부 NPU를 적극적으로 활용하여 계산 사진술, 실시간 안면 인식, 로컬 텍스트 번역 기능을 구현합니다. 기기 내에서 이미지 데이터를 처리함으로써 배터리 수명을 보존하고 데이터 개인정보 보호를 보장합니다.
- AI 지원 노트북: 최신 PC 프로세서는 통합 NPU를 탑재하여 화상 회의 중 배경 흐림 처리 및 시선 교정과 같은 백그라운드 작업을 관리함으로써 메인 CPU에 부담을 주지 않고 사용자가 원활하게 멀티태스킹할 수 있도록 합니다.
- 엣지 AI 배포: 스마트 감시 카메라와 로봇은 Google Coral Edge TPU나 임베디드 Intel 하드웨어와 같은 특수 NPU를 활용하여 소스에서 직접 즉각적인 객체 탐지를 수행합니다. 이를 통해 대역폭 병목 현상을 제거하고 찰나의 순간에 의사결정을 내릴 수 있습니다.
Link to this sectionUltralytics YOLO로 NPU 사용하기#
NPU를 활용하려는 개발자에게 컴퓨터 비전 모델 배포는 매우 간단해졌습니다. 강력한 Ultralytics YOLO26 모델을 사용하면 학습된 네트워크를 다양한 하드웨어 가속기에 최적화된 형식으로 내보낼 수 있습니다. 이 전체 라이프사이클을 간소화하기 위해 Ultralytics Platform은 클라우드 데이터셋 관리, 자동 주석, 그리고 사실상 모든 모델 배포 환경으로 최적화된 모델을 배포하기 위한 강력한 도구를 제공합니다.
로컬에서 작업할 때는 ONNX Runtime, PyTorch ExecuTorch 또는 TensorFlow Lite와 같은 프레임워크 통합을 사용하여 NPU를 타겟팅할 수 있습니다. 아래는 YOLO 모델을 OpenVINO 형식으로 내보내는 간단한 Python 예제로, 이는 가속화된 실시간 추론을 위해 Intel NPU에 컴퓨팅 워크로드를 원활하게 위임합니다.
from ultralytics import YOLO
# Load the highly recommended Ultralytics YOLO26 Nano model
model = YOLO("yolo26n.pt")
# Export to OpenVINO with int8 quantization for optimal NPU performance
model.export(format="openvino", int8=True)
# Run highly efficient, accelerated inference on the edge device
results = model("path/to/environment_image.jpg")





