Khám phá cách Edge AI cho phép xử lý AI theo thời gian thực, an toàn và hiệu quả trên thiết bị, chuyển đổi các ngành như chăm sóc sức khỏe và xe tự hành.
Edge AI là một mô hình điện toán phi tập trung, trong đó trí tuệ nhân tạo (AI) và các thuật toán học máy (ML) được xử lý cục bộ trên một thiết bị phần cứng, gần với nguồn tạo dữ liệu. Thay vì gửi dữ liệu đến một máy chủ đám mây tập trung để xử lý, Edge AI thực hiện suy luận trực tiếp trên chính thiết bị đó. Cách tiếp cận này giảm đáng kể độ trễ, tăng cường quyền riêng tư của dữ liệu và giảm yêu cầu về băng thông, khiến nó trở nên lý tưởng cho các ứng dụng cần kết quả ngay lập tức và phải hoạt động khi có hoặc không có kết nối internet. Thị trường Edge AI đang phát triển phản ánh sự chấp nhận ngày càng tăng của nó trong nhiều ngành công nghiệp khác nhau.
Trong một quy trình làm việc Edge AI điển hình, dữ liệu được thu thập bởi một cảm biến, chẳng hạn như máy ảnh hoặc micrô, trên một thiết bị vật lý. Dữ liệu này sau đó được đưa trực tiếp vào một mô hình ML được tối ưu hóa, được huấn luyện trước đang chạy trên bộ xử lý cục bộ của thiết bị. Bộ xử lý, thường là một bộ tăng tốc AI chuyên dụng hoặc Hệ thống trên Chip (SoC), thực thi mô hình để tạo ra một đầu ra, chẳng hạn như xác định một đối tượng hoặc nhận dạng một lệnh. Toàn bộ quá trình này diễn ra trong vài mili giây mà không cần dựa vào các mạng bên ngoài.
Để đạt được điều này, cần có các mô hình hiệu quả cao và phần cứng chuyên dụng. Các mô hình phải được tối ưu hóa thông qua các kỹ thuật như lượng tử hóa mô hình và tỉa bớt mô hình để phù hợp với các ràng buộc về tính toán và bộ nhớ hạn chế của các thiết bị biên. Các giải pháp phần cứng bao gồm từ các mô-đun mạnh mẽ như NVIDIA Jetson đến các vi điều khiển công suất thấp và các bộ tăng tốc chuyên dụng như Google Edge TPU và Qualcomm AI engines.
Mặc dù liên quan chặt chẽ, Edge AI (AI biên) và Edge Computing (Điện toán biên) là những khái niệm riêng biệt.
Edge AI đang chuyển đổi các ngành công nghiệp bằng cách cho phép đưa ra quyết định thông minh, theo thời gian thực ở những nơi cần thiết nhất, đặc biệt là trong thị giác máy tính.
Mặc dù có những lợi ích, việc triển khai Edge AI đặt ra một số thách thức. Sức mạnh tính toán và bộ nhớ hạn chế của các thiết bị biên đòi hỏi các nhà phát triển phải sử dụng các mô hình hiệu quả cao, chẳng hạn như các mô hình từ họ YOLO, và các framework tối ưu hóa như NVIDIA TensorRT và Intel's OpenVINO. Việc quản lý triển khai mô hình và cập nhật trên hàng nghìn thiết bị phân tán có thể phức tạp, thường đòi hỏi các nền tảng MLOps mạnh mẽ và các công cụ container hóa như Docker. Hơn nữa, việc đảm bảo độ chính xác của mô hình nhất quán trong các điều kiện thực tế đa dạng và khó đoán vẫn là một trở ngại chính đối với các nhà phát triển.