Khám phá cách Edge AI cho phép xử lý AI theo thời gian thực, an toàn và hiệu quả trên các thiết bị, chuyển đổi các ngành công nghiệp như chăm sóc sức khỏe và xe tự hành.
Edge AI đề cập đến hoạt động chạy các thuật toán trí tuệ nhân tạo (AI) trực tiếp trên các thiết bị phần cứng cục bộ, được gọi là thiết bị biên, chẳng hạn như điện thoại thông minh, máy ảnh, cảm biến hoặc hệ thống nhúng. Thay vì gửi dữ liệu đến các máy chủ điện toán đám mây từ xa để xử lý, Edge AI cho phép phân tích dữ liệu và ra quyết định diễn ra gần hơn với nguồn dữ liệu được tạo ra. Phương pháp này tận dụng những tiến bộ trong phần cứng, như chip AI chuyên dụng và các mô hình học máy (ML) hiệu quả để đưa trí thông minh đến biên của mạng. Nó cho phép các thiết bị thực hiện các tác vụ như nhận dạng hình ảnh , xử lý ngôn ngữ tự nhiên (NLP) và phát hiện bất thường tại địa phương.
Quá trình này thường bao gồm việc đào tạo một mô hình AI, thường sử dụng các tài nguyên đám mây mạnh mẽ hoặc máy chủ cục bộ. Sau khi được đào tạo, mô hình sẽ trải qua các kỹ thuật tối ưu hóa như lượng tử hóa mô hình hoặc cắt tỉa mô hình để giảm kích thước và yêu cầu tính toán của nó. Việc tối ưu hóa này rất quan trọng để chạy các mô hình hiệu quả trên các thiết bị biên bị hạn chế về tài nguyên, thường có công suất xử lý hạn chế ( CPU / GPU ), bộ nhớ và thời lượng pin. Sau đó, mô hình được tối ưu hóa sẽ được triển khai trên thiết bị biên bằng các khuôn khổ như TensorFlow Lite , PyTorch Mobile , ONNX Runtime hoặc các SDK chuyên dụng như OpenVINO của Intel . Sau đó, thiết bị có thể thực hiện suy luận thời gian thực bằng các cảm biến cục bộ (ví dụ: camera, micrô) để xử lý dữ liệu và tạo thông tin chi tiết hoặc hành động mà không cần kết nối internet liên tục. Việc quản lý các triển khai này có thể được sắp xếp hợp lý bằng các nền tảng như Ultralytics HUB .
Sự khác biệt chính nằm ở nơi diễn ra quá trình tính toán AI. Cloud AI xử lý dữ liệu trên các máy chủ tập trung, cung cấp các tài nguyên tính toán khổng lồ phù hợp với các mô hình phức tạp và dữ liệu đào tạo quy mô lớn. Tuy nhiên, nó gây ra độ trễ do truyền dữ liệu và yêu cầu kết nối internet đáng tin cậy. Ngược lại, Edge AI xử lý dữ liệu cục bộ trên thiết bị. Điều này giảm thiểu độ trễ, tăng cường quyền riêng tư của dữ liệu vì thông tin nhạy cảm không cần phải rời khỏi thiết bị và cho phép hoạt động trong môi trường ngoại tuyến hoặc băng thông thấp. Đánh đổi là các thiết bị biên có tài nguyên hạn chế, hạn chế tính phức tạp của các mô hình có thể triển khai. Đọc thêm về Edge AI so với Cloud AI .
Edge AI là một ứng dụng cụ thể trong lĩnh vực rộng hơn của điện toán biên . Điện toán biên đề cập đến mô hình chung về việc chuyển các tác vụ tính toán ra khỏi các trung tâm dữ liệu tập trung sang "biên" của mạng, gần hơn với người dùng và nguồn dữ liệu. Edge AI áp dụng cụ thể khái niệm này cho khối lượng công việc AI và ML, cho phép xử lý thông minh trực tiếp trên các thiết bị biên. Trong khi điện toán biên có thể liên quan đến nhiều loại xử lý khác nhau, Edge AI tập trung vào việc triển khai và chạy các mô hình AI cục bộ. Bạn có thể tìm hiểu thêm về điện toán biên tại đây .
Edge AI đang chuyển đổi nhiều ngành công nghiệp, đặc biệt là trong lĩnh vực thị giác máy tính (CV) . Nhu cầu ngày càng tăng được phản ánh trong quy mô thị trường Edge AI đang phát triển.
Bất chấp những lợi ích của nó, Edge AI phải đối mặt với những thách thức bao gồm các nguồn tài nguyên tính toán hạn chế ( tác động đến sức mạnh tính toán ) của các thiết bị biên, nhu cầu về các mô hình được tối ưu hóa cao ( như hiệu quả của YOLOv9 ), quản lý việc triển khai và cập nhật mô hình trên nhiều thiết bị phân tán (thường sử dụng các công cụ như Docker ) và đảm bảo hiệu suất mô hình trong các điều kiện thực tế khác nhau. Phần cứng chuyên dụng như Google Edge TPU và các cảm biến như Sony IMX500 giúp giải quyết một số hạn chế về phần cứng này. Các khuôn khổ như NVIDIA TensorRT cũng hỗ trợ tối ưu hóa.
Edge AI đại diện cho sự thay đổi đáng kể trong cách cung cấp khả năng AI, chuyển trí thông minh từ đám mây tập trung sang các thiết bị cục bộ. Điều này cho phép tạo ra thế hệ ứng dụng AI phản hồi, riêng tư và đáng tin cậy mới có thể hoạt động hiệu quả ở rìa mạng, tác động đến mọi thứ từ thiết bị điện tử tiêu dùng đến các hệ thống công nghiệp quan trọng.