Tìm hiểu cách Bộ xử lý thần kinh (NPU) tăng tốc trí tuệ nhân tạo. Khám phá cách triển khai. Ultralytics YOLO26 trên NPUs cho điện toán biên và suy luận hiệu quả, tiết kiệm năng lượng.
Bộ xử lý thần kinh (NPU) là một mạch phần cứng chuyên dụng được thiết kế đặc biệt để tăng tốc quá trình thực thi các thuật toán trí tuệ nhân tạo và học máy. Không giống như các bộ xử lý đa năng, NPU được thiết kế với kiến trúc xử lý tự nhiên các phép toán ma trận song song phức tạp, vốn là trọng tâm của các mô hình học sâu . Bằng cách thực hiện các phép tính này với hiệu quả cực cao, NPU giảm đáng kể mức tiêu thụ điện năng đồng thời cải thiện đáng kể độ trễ suy luận . Điều này làm cho chúng trở thành một thành phần thiết yếu của điện thoại di động, máy tính xách tay hiện đại và các thiết bị IoT chuyên dụng, nơi việc triển khai các mô hình phức tạp một cách hiệu quả mà không làm hao pin nhanh chóng là rất quan trọng.
Để hiểu được giá trị của NPU, cần phân biệt nó với các bộ tăng tốc phần cứng phổ biến khác trong lĩnh vực trí tuệ nhân tạo:
Sự ra đời của NPU đã mở ra khả năng chạy trí tuệ nhân tạo (AI) trực tiếp trên thiết bị của người dùng mà không cần phụ thuộc vào kết nối đám mây liên tục.
Đối với các nhà phát triển muốn tận dụng NPU, việc triển khai các mô hình thị giác máy tính đã trở nên vô cùng đơn giản. Sử dụng mô hình Ultralytics YOLO26 mạnh mẽ, bạn có thể xuất mạng đã được huấn luyện của mình sang các định dạng được tối ưu hóa cho nhiều bộ tăng tốc phần cứng khác nhau. Để đơn giản hóa toàn bộ vòng đời này, Nền tảng Ultralytics cung cấp các công cụ mạnh mẽ để quản lý tập dữ liệu trên đám mây, chú thích tự động và triển khai các mô hình được tối ưu hóa đến hầu hết mọi môi trường triển khai mô hình .
Khi làm việc cục bộ, bạn có thể sử dụng các tích hợp khung như ONNX Runtime , PyTorch ExecuTorch hoặc TensorFlow Lite để nhắm mục tiêu vào NPU. Dưới đây là một ví dụ nhanh. Python Ví dụ minh họa cách xuất khẩu một YOLO chuyển đổi mô hình sang định dạng OpenVINO , cho phép phân bổ khối lượng công việc tính toán một cách liền mạch. Intel Bộ xử lý thần kinh (NPU) giúp tăng tốc suy luận thời gian thực .
from ultralytics import YOLO
# Load the highly recommended Ultralytics YOLO26 Nano model
model = YOLO("yolo26n.pt")
# Export to OpenVINO with int8 quantization for optimal NPU performance
model.export(format="openvino", int8=True)
# Run highly efficient, accelerated inference on the edge device
results = model("path/to/environment_image.jpg")

Bắt đầu hành trình của bạn với tương lai của học máy