Khám phá cách công cụ suy luận hỗ trợ AI bằng cách đưa ra dự đoán theo thời gian thực, tối ưu hóa mô hình và cho phép triển khai đa nền tảng.
Trong lĩnh vực trí tuệ nhân tạo (AI) và học máy (ML) , công cụ suy luận là một thành phần phần mềm hoặc phần cứng quan trọng chịu trách nhiệm thực thi các mô hình đã được đào tạo để đưa ra dự đoán về dữ liệu mới, chưa từng thấy. Sau khi một mô hình đã học được các mẫu trong giai đoạn đào tạo, công cụ suy luận sẽ lấy mô hình đã được đào tạo này và áp dụng nó vào các đầu vào trong thế giới thực. Quá trình này, được gọi là suy luận, cho phép các hệ thống AI thực hiện các tác vụ như phát hiện đối tượng , phân loại hình ảnh hoặc xử lý ngôn ngữ tự nhiên (NLP) trong các ứng dụng thực tế. Về cơ bản, đây là trái tim hoạt động của một mô hình AI được triển khai, chuyển đổi kiến thức đã học thành đầu ra có thể hành động một cách hiệu quả.
Công cụ suy luận sử dụng mô hình được đào tạo trước, thường được phát triển bằng các khuôn khổ học sâu (DL) như PyTorch hoặc TensorFlow , đóng gói kiến thức cần thiết cho một tác vụ cụ thể. Khi dữ liệu mới (ví dụ: hình ảnh, clip âm thanh hoặc câu văn bản) được cung cấp làm đầu vào, công cụ suy luận sẽ xử lý dữ liệu đó thông qua cấu trúc tính toán của mô hình (thường là mạng nơ-ron ). Điều này tạo ra đầu ra, chẳng hạn như xác định các đối tượng có hộp giới hạn trong hình ảnh, phiên âm giọng nói hoặc phân loại cảm xúc. Ví dụ, các mô hình YOLO Ultralytics phụ thuộc vào các công cụ suy luận hiệu quả để đạt được khả năng phát hiện và phân đoạn đối tượng theo thời gian thực trên nhiều nền tảng khác nhau, từ các máy chủ đám mây mạnh mẽ đến các thiết bị biên bị hạn chế về tài nguyên. Hiệu suất của công cụ suy luận ảnh hưởng trực tiếp đến tốc độ và khả năng phản hồi của ứng dụng, thường được đo bằng độ trễ suy luận và thông lượng.
Một vai trò quan trọng của các công cụ suy luận hiện đại là tối ưu hóa. Chạy trực tiếp một mô hình học sâu lớn đã được đào tạo có thể tốn kém về mặt tính toán và chậm. Các công cụ suy luận sử dụng nhiều kỹ thuật khác nhau để làm cho các mô hình nhanh hơn và hiệu quả hơn, cho phép triển khai trên nhiều phần cứng khác nhau. Các chiến lược tối ưu hóa mô hình phổ biến bao gồm:
Nhiều công cụ suy luận cũng hỗ trợ các định dạng mô hình chuẩn hóa như ONNX (Open Neural Network Exchange) , cho phép các mô hình được đào tạo trong một khuôn khổ (như PyTorch ) được chạy bằng một công cụ hoặc nền tảng khác. Các công cụ suy luận phổ biến bao gồm NVIDIA TensorRT , OpenVINO của Intel và TensorFlow Lite . Ultralytics các mô hình hỗ trợ xuất sang nhiều định dạng tương thích với các công cụ này, được nêu chi tiết trong hướng dẫn Tùy chọn triển khai mô hình .
Điều quan trọng là phải phân biệt công cụ suy luận với khuôn khổ đào tạo.
Công cụ suy luận rất quan trọng để triển khai AI trong các tình huống thực tế:
Về bản chất, các công cụ suy luận thu hẹp khoảng cách giữa các mô hình AI được đào tạo và ứng dụng thực tế của chúng, đảm bảo rằng các khả năng AI phức tạp có thể được cung cấp hiệu quả trên nhiều thiết bị và nền tảng khác nhau, bao gồm quản lý các mô hình thông qua các nền tảng như Ultralytics HUB .