용어집

신경망 처리 장치(NPU)

신경망 처리 장치(NPU)가 AI 성능을 어떻게 향상시키는지 알아보세요. 효율적이고 저전력인 엣지 컴퓨팅 및 추론을 위해 NPU에 Ultralytics 배포하는 방법을 확인해 보세요.

신경 처리 장치(NPU)는 인공 지능 및 기계 학습 알고리즘의 실행 속도를 높이기 위해 특별히 설계된 전용 하드웨어 회로입니다. 범용 프로세서와 달리, NPU는 딥러닝 모델의 핵심인 복잡한 병렬 행렬 연산을 기본적으로 처리할 수 있는 아키텍처로 설계되었습니다. 이러한 계산을 극도로 효율적으로 수행함으로써, NPU는 전력 소비를 대폭 줄이는 동시에 추론 지연 시간을 크게 개선합니다. 이로 인해 NPU는 복잡한 모델을 효율적으로 구현하면서도 배터리 소모가 급격히 증가하지 않아야 하는 현대적인 스마트폰, 노트북, 특화형 IoT 기기에서 필수적인 구성 요소가 되었습니다.

NPU 대 다른 프로세서

NPU의 가치를 이해하려면, AI 분야에서 흔히 볼 수 있는 다른 하드웨어 가속기와 구분해 보는 것이 도움이 됩니다:

중앙 처리 장치(CPU): 컴퓨터의 범용 "두뇌"입니다. 머신러닝 코드를 실행할 수는 있지만, CPU는 작업을 순차적으로 처리하기 때문에, 최신 비전 모델에 필요한 대용량 행렬 곱셈 작업에는 속도가 느리고 비효율적입니다.
그래픽 처리 장치(GPU): 병렬 처리를 위해 설계된 GPU는 방대한 딥러닝 워크로드를 처리하는 데 탁월합니다. 하지만 전력 소모가 크고 상당한 열을 발생시키기 때문에, 배터리로 구동되는 엣지 컴퓨팅보다는 클라우드 기반 훈련에 더 적합합니다.
Tensor 장치(TPU): Google 머신러닝 Google 개발한 전용 집적회로입니다. 개념적으로는 NPU와 유사하지만, TPU는 일반적으로 대규모 클라우드 컴퓨팅 서버 랙과 연관되는 반면, NPU는 주로 소비자용 시스템 온 칩(SoC)에 직접 통합됩니다.

NPU의 실제 적용 사례

NPU의 등장으로, 지속적인 클라우드 연결에 의존하지 않고도 사용자 기기에서 직접 인공지능(AI)을 실행할 수 있게 되었습니다.

스마트폰과 모바일 비전: 최신 모바일 기기들은 애플 뉴럴 엔진(Apple Neural Engine)이나 퀄컴 헥사곤 NPU(Qualcomm Hexagon NPU)와 같은 내장형 NPU를 적극 활용하여 컴퓨테이셔널 포토그래피, 실시간 얼굴 인식, 그리고 로컬 텍스트 번역 기능을 구현합니다. 기기 내에서 이미지 데이터를 처리함으로써 배터리 수명을 절약하고 데이터 프라이버시를 보장합니다.
AI 지원 노트북: 최신 PC 프로세서에는 NPU가 내장되어 있어 화상 회의중 배경 흐림 효과나 시선 보정 같은 백그라운드 작업을 CPU 부담을 주지 않고 처리할 수 있어, 사용자가 원활하게 멀티태스킹을 할 수 있습니다.
엣지 AI 배포: 스마트 감시 카메라와 로봇은 TPU Google Edge TPU 임베디드 Intel 같은 전용 NPU를 활용하여 소스에서 직접 즉각적인 물체 감지를 수행합니다. 이를 통해 대역폭 병목 현상을 해소하고 순식간에 의사 결정을 내릴 수 있습니다.

Ultralytics YOLO에서 NPU 사용

NPU를 활용하려는 개발자들에게 있어 컴퓨터 비전 모델 배포는 이제 놀라울 정도로 간편해졌습니다. 강력한 Ultralytics 모델을 사용하면 훈련된 네트워크를 다양한 하드웨어 가속기에 최적화된 형식으로 내보낼 수 있습니다. 이러한 전체 라이프사이클을 효율화하기 위해 Ultralytics 클라우드 데이터셋 관리, 자동 주석 처리, 그리고 거의 모든 모델 배포 환경에 최적화된 모델을 배포할 수 있는 강력한 도구를 제공합니다.

로컬 환경에서 작업할 때는 ONNX , PyTorch 또는 TensorFlow 프레임워크 통합 기능을 사용하여 NPU를 대상으로 할 수 있습니다. 아래는 YOLO OpenVINO 내보내는 방법을 보여주는 간단한 Python . OpenVINO 연산 부하를 Intel 원활하게 위임하여 실시간 추론 속도를 높여줍니다.

from ultralytics import YOLO

# Load the highly recommended Ultralytics YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Export to OpenVINO with int8 quantization for optimal NPU performance
model.export(format="openvino", int8=True)

# Run highly efficient, accelerated inference on the edge device
results = model("path/to/environment_image.jpg")

신경망 처리 장치(NPU)

17가지 이상의 형식으로 내보내기. 전 세계 43개 지역에 배포.

H100 GPU에서 YOLO26을 시간당 2.39달러에 훈련하세요.

비전 AI 프로젝트를 뒷받침하는 유연한 기업용 라이선스.

차기 프로젝트를 성공적으로 이끌어 줄 엔터프라이즈 라이선스

스마트 주석 기능을 통해 최대 10배 더 빠르게 라벨링하세요

라벨링. 학습. 배포. 단일 플랫폼에서 모두 해결.

NPU 대 다른 프로세서

NPU의 실제 적용 사례

Ultralytics YOLO에서 NPU 사용

이 카테고리에서 더 읽어보기

Ultralytics 활용한 폴리곤 주석 달기 가이드

독일 하노버 메세 Ultralytics 주요 하이라이트

컴퓨터 비전 프로젝트를 TensorFlow PyTorch TensorFlow 중 선택하기

함께 AI의 미래를 만들어 갑시다!

신경망 처리 장치(NPU)

17가지 이상의 형식으로 내보내기. 전 세계 43개 지역에 배포.

H100 GPU에서 YOLO26을 시간당 2.39달러에 훈련하세요.

비전 AI 프로젝트를 뒷받침하는 유연한 기업용 라이선스.

차기 프로젝트를 성공적으로 이끌어 줄 엔터프라이즈 라이선스

스마트 주석 기능을 통해 최대 10배 더 빠르게 라벨링하세요

라벨링. 학습. 배포. 단일 플랫폼에서 모두 해결.

NPU 대 다른 프로세서

NPU의 실제 적용 사례

Ultralytics YOLO에서 NPU 사용

이 카테고리에서 더 읽어보기

Ultralytics 활용한 폴리곤 주석 달기 가이드

독일 하노버 메세 Ultralytics 주요 하이라이트

컴퓨터 비전 프로젝트를 TensorFlow PyTorch TensorFlow 중 선택하기

함께 AI의 미래를 만들어 갑시다!

라벨링. 학습. 배포. 단일 플랫폼에서 모두 해결.