Узнайте, как нейронный процессор (NPU) ускоряет работу искусственного интеллекта. Узнайте, как развернуть Ultralytics на нейронных процессорах для эффективных и энергоэффективных вычислений и инференции на периферии.
Нейронный процессор (NPU) — это специализированная аппаратная схема, разработанная специально для ускорения выполнения алгоритмов искусственного интеллекта и машинного обучения. В отличие от процессоров общего назначения, NPU построены на архитектуре, которая изначально рассчитана на выполнение сложных параллельных матричных операций, лежащих в основе моделей глубокого обучения. Выполняя эти вычисления с чрезвычайной эффективностью, NPU резко снижает энергопотребление и при этом значительно сокращает задержку инференса. Это делает их незаменимым компонентом современных мобильных телефонов, ноутбуков и специализированных устройств Интернета вещей (IoT), где эффективное развертывание сложных моделей без быстрого разряда батареи имеет решающее значение.
Чтобы понять ценность NPU, полезно отличать его от других распространенных аппаратных ускорителей в сфере искусственного интеллекта :
Развитие NPU открыло возможность запуска си стем искусственного интеллекта (ИИ) непосредственно на пользовательских устройствах без необходимости постоянного подключения к облаку.
Для разработчиков, желающих использовать возможности нейронных процессоров (NPU), развертывание моделей компьютерного зрения стало невероятно простым. С помощью мощной модели Ultralytics вы можете экспортировать обученную сеть в форматы, оптимизированные для различных аппаратных ускорителей. Чтобы оптимизировать весь этот цикл разработки, Ultralytics предоставляет надежные инструменты для управления наборами данных в облаке, автоматической аннотации и развертывания оптимизированных моделей практически в любой среде развертывания моделей.
При локальной работе можно использовать интеграции с фреймворками, такими как ONNX , PyTorch или TensorFlow , для работы с NPU. Ниже приведен краткий Python , демонстрирующий, как экспортировать YOLO в OpenVINO , который беспрепятственно передает вычислительные задачи на Intel для ускоренного выполнения инференции в реальном времени.
from ultralytics import YOLO
# Load the highly recommended Ultralytics YOLO26 Nano model
model = YOLO("yolo26n.pt")
# Export to OpenVINO with int8 quantization for optimal NPU performance
model.export(format="openvino", int8=True)
# Run highly efficient, accelerated inference on the edge device
results = model("path/to/environment_image.jpg")
Начните свой путь в будущее машинного обучения