Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Edge AI (AI biên)

Khám phá cách Edge AI cho phép xử lý AI theo thời gian thực, an toàn và hiệu quả trên thiết bị, chuyển đổi các ngành như chăm sóc sức khỏe và xe tự hành.

Trí tuệ nhân tạo biên (Edge AI) tạo ra một môi trường điện toán phi tập trung, nơi các thuật toán trí tuệ nhân tạo (AI)học máy (ML) được xử lý trực tiếp trên thiết bị cục bộ, thay vì dựa vào các máy chủ từ xa. Bằng cách thực hiện xử lý dữ liệu gần nguồn - chẳng hạn như trên cảm biến, camera hoặc cổng IoT - Trí tuệ nhân tạo biên (Edge AI) giảm đáng kể độ trễ và mức sử dụng băng thông. Phương pháp này rất cần thiết cho các ứng dụng yêu cầu suy luận thời gian thực, trong đó mili giây rất quan trọng, hoặc trong môi trường kết nối internet không ổn định. Việc chuyển đổi từ xử lý tập trung sang biên cho phép các thiết bị tự đưa ra quyết định, tăng cường quyền riêng tư dữ liệu bằng cách lưu trữ thông tin nhạy cảm trên phần cứng cục bộ.

Edge AI Hoạt Động Như Thế Nào

Trong quy trình làm việc AI Edge điển hình, một thiết bị vật lý thu thập dữ liệu thông qua các cảm biến đầu vào. Thay vì truyền dữ liệu thô đến trung tâm điện toán đám mây , thiết bị sử dụng bộ vi xử lý nhúng hoặc bộ tăng tốc chuyên dụng—chẳng hạn như mô-đun NVIDIA Jetson hoặc Google Coral Edge TPU —để chạy các mô hình ML cục bộ.

Để hoạt động hiệu quả trên các thiết bị hạn chế tài nguyên, các mô hình thường trải qua các quy trình tối ưu hóa. Các kỹ thuật như lượng tử hóa mô hìnhcắt tỉa mô hình giúp giảm kích thước tệp và độ phức tạp tính toán của mạng nơ-ron mà không làm giảm đáng kể độ chính xác . Các nền tảng được tối ưu hóa, chẳng hạn như TensorRTIntel OpenVINO , hoạt động như một công cụ suy luận để tăng tốc các mô hình này trên các kiến trúc phần cứng cụ thể.

So sánh Edge AI và Edge Computing

Mặc dù thường được sử dụng cùng nhau, nhưng việc phân biệt hai khái niệm có liên quan sau đây sẽ rất hữu ích:

  • Điện toán biên : Đây là kiến trúc vật lý và cơ sở hạ tầng rộng hơn giúp đưa sức mạnh tính toán và lưu trữ dữ liệu đến gần hơn với vị trí cần thiết. Nó bao gồm phần cứng và cấu trúc mạng.
  • Trí tuệ nhân tạo biên (Edge AI): Đây là một ứng dụng cụ thể của điện toán biên. Nó bao gồm việc chạy các thuật toán thông minh, chẳng hạn như thị giác máy tính (CV) hoặc phân tích dự đoán, trên cơ sở hạ tầng biên đó.

Các Ứng dụng Thực tế

Việc triển khai Edge AI đang chuyển đổi các ngành công nghiệp bằng cách cho phép vận hành tự động và phân tích thông minh hơn.

  • Hệ thống tự động: Xe tự lái sử dụng Edge AI để xử lý dữ liệu đầu vào từ LiDAR, radar và camera ngay lập tức. Chúng phải detect Người đi bộ, đọc biển báo giao thông và điều hướng làn đường theo thời gian thực. Việc dựa vào đám mây sẽ gây ra độ trễ nguy hiểm; do đó, việc phát hiện vật thể diễn ra hoàn toàn trong máy tính tích hợp của xe.
  • Sản xuất Thông minh: Trong tự động hóa công nghiệp , Edge AI hỗ trợ các hệ thống kiểm tra trực quan trên dây chuyền lắp ráp. Camera được trang bị trên các model như Ultralytics YOLO11 có thể phát hiện lỗi sản phẩm hoặc nguy cơ mất an toàn ngay lập tức. Quá trình xử lý cục bộ này cho phép phát hiện bất thường nhanh chóng và tích hợp với cánh tay robot để loại bỏ các sản phẩm lỗi mà không cần dừng sản xuất.
  • Thành phố thông minh: Các đô thị triển khai Edge AI để quản lý giao thông thông minh . Đèn giao thông có thể điều chỉnh thời gian linh hoạt dựa trên phân tích lưu lượng phương tiện được thực hiện cục bộ tại giao lộ, giúp giảm tắc nghẽn và tối ưu hóa khả năng di chuyển trong đô thị.

Triển khai mô hình đến Edge

Việc triển khai mô hình lên thiết bị biên thường liên quan đến việc xuất mô hình đã được huấn luyện sang định dạng không phụ thuộc phần cứng. Định dạng ONNX (Open Neural Network Exchange - Trao đổi Mạng Nơ-ron Mở) là một tiêu chuẩn cho phép mô hình chạy trên nhiều nền tảng khác nhau.

Ví dụ sau đây minh họa cách xuất một tệp nhẹ YOLO11 mô hình lý tưởng cho việc triển khai biên giới do tốc độ và hiệu quả của nó:

from ultralytics import YOLO

# Load a lightweight YOLO11 nano model
model = YOLO("yolo11n.pt")

# Export the model to ONNX format for edge deployment
# The 'dynamic' argument allows for variable input sizes
model.export(format="onnx", dynamic=True)

Thách thức và xu hướng tương lai

Việc triển khai Edge AI gặp phải những thách thức, chủ yếu liên quan đến nguồn năng lượng và tài nguyên bộ nhớ hạn chế của các thiết bị biên so với các trung tâm dữ liệu lớn. Các nhà phát triển phải cân bằng hiệu suất mô hình với mức tiêu thụ năng lượng, thường sử dụng thiết kế hệ thống trên chip (SoC) từ các công ty như Qualcomm hoặc Ambarella .

Nhìn về tương lai, việc tích hợp mạng 5G sẽ nâng cao hơn nữa AI biên (Edge AI) bằng cách cung cấp kết nối tốc độ cao cần thiết cho việc phối hợp thiết bị, được gọi là trí tuệ bầy đàn. Ngoài ra, các kỹ thuật như học liên kết cho phép các thiết bị biên cùng nhau cải thiện các mô hình toàn cầu trong khi vẫn giữ dữ liệu thô được phân cấp và riêng tư.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay