Trước đây, chúng ta đã khám phá cách AI có thể được sử dụng trong các ngành khác nhau như chăm sóc sức khỏe, sản xuất và du lịch. Chúng ta cũng đã xem xét cách AI có thể cải thiện các công việc hàng ngày và thảo luận về các ý tưởng kinh doanh AI hàng đầu. Tất cả những cuộc thảo luận này chắc chắn dẫn đến cùng một câu hỏi quan trọng: làm thế nào chúng ta có thể đo lường sự thành công của việc triển khai AI như vậy? Đó là một câu hỏi quan trọng vì chỉ triển khai các giải pháp AI là không đủ. Đảm bảo rằng các giải pháp này thực sự mang lại kết quả mới là điều tạo nên sự thay đổi cuộc chơi.

Chúng ta có thể đo lường các metrics hiệu suất AI để xác định xem một mô hình AI có thực sự hiệu quả trong việc làm cho các quy trình hiệu quả hơn, tạo ra sự đổi mới hoặc giải quyết vấn đề hay không. Bằng cách tập trung vào các key performance indicators (KPI) phù hợp, chúng ta có thể hiểu rõ giải pháp AI đang hoạt động tốt như thế nào và có thể cần cải thiện ở đâu.

Trong bài viết này, chúng ta sẽ xem xét cách đo lường sự thành công của việc triển khai AI bằng các KPI phù hợp nhất. Chúng ta sẽ đề cập đến sự khác biệt giữa KPI kinh doanh và KPI hiệu suất AI, xem xét các metrics chính như precision và recall và giúp bạn chọn các KPI tốt nhất cho các giải pháp AI cụ thể của mình.

Sự khác biệt giữa KPI kinh doanh AI và KPI hiệu suất AI

__wf_reserved_inherit — Hình 1. So sánh KPI kinh doanh AI và KPI hiệu suất AI.

‍

Khi bạn nghĩ về KPI, điều tự nhiên là cho rằng chúng đều liên quan đến các số liệu kinh doanh như lợi tức đầu tư (ROI), tiết kiệm chi phí hoặc doanh thu được tạo ra - đặc biệt khi nói về AI doanh nghiệp. Các KPI kinh doanh AI này đo lường tác động của AI đến thành công chung của một công ty và phù hợp với các mục tiêu kinh doanh rộng lớn hơn.

Tuy nhiên, KPI hiệu suất AI tập trung vào mức độ hoạt động tốt của chính hệ thống AI, sử dụng các số liệu như độ chính xác (accuracy), độ chụm (precision) và độ phủ (recall). Chúng ta sẽ đi vào chi tiết của các số liệu này bên dưới, nhưng về bản chất, trong khi KPI kinh doanh thể hiện những lợi ích tài chính và chiến lược của AI, thì KPI hiệu suất đảm bảo rằng mô hình AI đang thực hiện công việc của mình một cách hiệu quả.

Một số số liệu nhất định thực sự có thể phục vụ cả hai mục đích. Ví dụ: cải thiện hiệu quả, chẳng hạn như giảm thời gian hoặc nguồn lực cần thiết để hoàn thành một nhiệm vụ, có thể vừa là KPI hiệu suất (cho thấy giải pháp AI hoạt động tốt như thế nào) vừa là KPI kinh doanh (đo lường mức tiết kiệm chi phí và cải thiện năng suất). Sự hài lòng của khách hàng là một số liệu giao thoa khác. Nó có thể phản ánh sự thành công của một công cụ dịch vụ khách hàng do AI điều khiển cả về hiệu suất kỹ thuật và tác động của nó đối với các mục tiêu kinh doanh tổng thể.

Tìm hiểu các số liệu hiệu suất AI chính

Có một vài số liệu phổ biến được sử dụng để đo lường mức độ hoạt động tốt của một mô hình AI. Đầu tiên, chúng ta sẽ xem xét định nghĩa của chúng và cách chúng được tính toán. Sau đó, chúng ta sẽ xem cách các số liệu này có thể được theo dõi.

Độ chụm (Precision)

Độ chính xác là một chỉ số đo lường mức độ chính xác của mô hình AI trong việc xác định các kết quả dương tính thực (trường hợp mô hình xác định chính xác một đối tượng hoặc tình trạng như mong đợi). Ví dụ, trong hệ thống nhận dạng khuôn mặt , kết quả dương tính thực sẽ xảy ra khi hệ thống nhận dạng và xác định chính xác khuôn mặt của một người mà nó đã được đào tạo để detect .

Để tính độ chụm (precision), trước tiên hãy đếm số lượng true positives. Sau đó, bạn có thể chia số này cho tổng số mục mà mô hình đã gắn nhãn là positive. Tổng số này bao gồm cả các nhận dạng chính xác và sai sót, được gọi là false positives. Về cơ bản, độ chụm (precision) cho bạn biết tần suất mô hình chính xác khi nó tuyên bố đã nhận ra điều gì đó.

‍

Điều này đặc biệt quan trọng trong các tình huống mà hậu quả của false positive có thể gây tốn kém hoặc gián đoạn. Ví dụ: trong sản xuất tự động, tỷ lệ precision cao cho thấy rằng hệ thống có thể gắn cờ các sản phẩm bị lỗi một cách chính xác hơn và ngăn chặn việc loại bỏ hoặc làm lại không cần thiết các sản phẩm tốt. Một ví dụ điển hình khác là giám sát an ninh. Độ chính xác cao giúp giảm thiểu báo động giả và chỉ tập trung vào các mối đe dọa thực sự cần phản ứng an ninh.

Recall

Chỉ số thu hồi giúp đo lường khả năng của mô hình AI trong việc xác định tất cả các trường hợp liên quan, hay còn gọi là kết quả dương tính thật, trong một tập dữ liệu. Nói một cách đơn giản, chỉ số này thể hiện mức độ hiệu quả mà một hệ thống AI có thể nắm bắt tất cả các trường hợp thực tế của một tình trạng hoặc đối tượng mà nó được thiết kế để xử lý. detect . Có thể tính toán khả năng thu hồi bằng cách chia số lần phát hiện chính xác cho tổng số trường hợp dương tính đáng lẽ phải được phát hiện (bao gồm cả những trường hợp mà mô hình đã xác định chính xác và những trường hợp mà mô hình bỏ sót).

Hãy xem xét một hệ thống hình ảnh y tế hỗ trợ AI được sử dụng để phát hiện ung thư. Trong bối cảnh này, recall phản ánh tỷ lệ phần trăm các trường hợp ung thư thực tế mà hệ thống xác định chính xác. Recall cao là rất quan trọng trong các tình huống như vậy vì bỏ sót chẩn đoán ung thư có thể dẫn đến hậu quả nghiêm trọng cho việc chăm sóc bệnh nhân.

Precision so với recall

Precision và recall giống như hai mặt của cùng một đồng xu khi nói đến đánh giá hiệu suất của một mô hình AI, và chúng thường đòi hỏi sự cân bằng. Thách thức là việc cải thiện một số liệu thường có thể phải trả giá bằng số liệu khác.

Giả sử bạn thúc đẩy độ chính xác cao hơn. Mô hình có thể trở nên chọn lọc hơn và chỉ có thể xác định những positive mà nó rất chắc chắn. Mặt khác, nếu bạn muốn cải thiện recall, mô hình có thể xác định nhiều positive hơn, nhưng điều này có thể bao gồm nhiều false positive hơn và cuối cùng làm giảm độ chính xác.

Điều quan trọng là tìm ra sự cân bằng phù hợp giữa precision và recall dựa trên nhu cầu cụ thể của ứng dụng của bạn. Một công cụ hữu ích cho việc này là đường cong Precision-Recall, cho thấy mối quan hệ giữa hai số liệu ở các ngưỡng khác nhau. Bằng cách phân tích đường cong này, bạn có thể xác định điểm tối ưu nơi mô hình hoạt động tốt nhất cho trường hợp sử dụng cụ thể của bạn. Hiểu được sự đánh đổi này sẽ giúp ích khi tinh chỉnh các mô hình AI để hoạt động tối ưu cho các trường hợp sử dụng dự kiến của chúng.

‍

Độ chính xác trung bình ( mAP )

Độ chính xác trung bình ( mAP ) là một số liệu được sử dụng để đánh giá hiệu suất của các mô hình AI cho các nhiệm vụ như phát hiện đối tượng , trong đó mô hình cần xác định và classify nhiều đối tượng trong một hình ảnh. mAP cung cấp cho bạn một điểm số duy nhất thể hiện hiệu suất của mô hình trên tất cả các danh mục khác nhau mà nó được đào tạo để nhận dạng. Hãy cùng xem cách tính điểm số này.

Diện tích bên dưới Đường cong Độ chính xác-Thu hồi cung cấp Độ chính xác trung bình ( AP ) cho lớp đó. AP đo lường mức độ chính xác của mô hình đưa ra dự đoán cho một lớp cụ thể, xem xét cả độ chính xác và khả năng thu hồi trên nhiều mức độ tin cậy khác nhau (mức độ tin cậy đề cập đến mức độ chắc chắn của mô hình trong các dự đoán của nó). Khi AP được tính toán cho mỗi lớp, mAP được xác định bằng cách lấy trung bình những AP giá trị trên tất cả các lớp.

‍

mAP hữu ích trong các ứng dụng như lái xe tự động , nơi nhiều đối tượng, chẳng hạn như người đi bộ, phương tiện và biển báo giao thông, cần được phát hiện đồng thời. Một cao mAP Điểm số có nghĩa là mô hình luôn hoạt động tốt trên mọi hạng mục, khiến mô hình trở nên đáng tin cậy và chính xác trong nhiều tình huống khác nhau.

Tính toán các chỉ số hiệu suất một cách dễ dàng

Các công thức và phương pháp tính toán các chỉ số hiệu suất AI chính có vẻ phức tạp. Tuy nhiên, các công cụ như gói Ultralytics có thể giúp bạn thực hiện việc này một cách đơn giản và nhanh chóng. Cho dù bạn đang làm việc với các tác vụ phát hiện , phân đoạn hay phân loại đối tượng, Ultralytics cung cấp các tiện ích cần thiết để nhanh chóng tính toán các số liệu quan trọng như độ chính xác, độ thu hồi và độ chính xác trung bình ( mAP ).

Để bắt đầu tính toán số liệu hiệu suất bằng Ultralytics , bạn có thể cài đặt Ultralytics gói như hình dưới đây.

Trong ví dụ này, chúng tôi sẽ tải một mô hình YOLOv8 đã được đào tạo trước và sử dụng nó để xác thực các số liệu hiệu suất, nhưng bạn có thể tải bất kỳ mô hình nào được Ultralytics hỗ trợ. Sau đây là cách thực hiện:

Sau khi mô hình được tải, bạn có thể thực hiện xác thực trên tập dữ liệu của mình. Đoạn mã sau sẽ giúp bạn tính toán các số liệu hiệu suất khác nhau, bao gồm độ chính xác, độ thu hồi và mAP :

Sử dụng các công cụ như Ultralytics giúp việc tính toán số liệu hiệu suất dễ dàng hơn nhiều, do đó bạn có thể dành nhiều thời gian hơn để cải thiện mô hình của mình và ít thời gian lo lắng hơn về các chi tiết của quy trình đánh giá.

Hiệu suất của AI được đo lường như thế nào sau khi triển khai?

Khi phát triển mô hình AI, việc kiểm tra hiệu suất của nó trong môi trường có kiểm soát rất dễ dàng. Tuy nhiên, sau khi mô hình được triển khai, mọi thứ có thể trở nên phức tạp hơn. May mắn thay, có những công cụ và phương pháp tốt nhất có thể giúp bạn giám sát giải pháp AI sau khi triển khai.

Các công cụ như Prometheus, Grafana và Evidently AI được thiết kế để liên tục track hiệu suất mô hình của bạn. Chúng có thể cung cấp thông tin chi tiết theo thời gian thực, detect Các công cụ này vượt xa khả năng giám sát truyền thống bằng cách cung cấp các giải pháp tự động, có khả năng mở rộng, thích ứng với bản chất năng động của các mô hình AI trong sản xuất.

Để đo lường sự thành công của mô hình AI sau khi triển khai, đây là một số phương pháp tốt nhất nên tuân theo:

Thiết lập các chỉ số hiệu suất rõ ràng: Xác định các chỉ số chính như độ chính xác, độ chuẩn xác và thời gian phản hồi để thường xuyên kiểm tra hiệu quả hoạt động của mô hình.
‍
Thường xuyên kiểm tra độ lệch dữ liệu: Theo dõi những thay đổi trong dữ liệu mà mô hình của bạn đang xử lý, vì điều này có thể ảnh hưởng đến các dự đoán nếu không được quản lý đúng cách.
‍
Thực hiện kiểm thử A/B: Sử dụng kiểm thử A/B để so sánh hiệu suất của mô hình hiện tại với các phiên bản hoặc điều chỉnh mới. Điều này sẽ cho phép bạn đánh giá định lượng các cải tiến hoặc hồi quy trong hành vi của mô hình.
‍
Ghi lại và kiểm tra hiệu suất: Lưu giữ nhật ký chi tiết về các chỉ số hiệu suất và các thay đổi được thực hiện đối với hệ thống AI của bạn. Điều này rất quan trọng đối với việc kiểm tra, tuân thủ và cải thiện kiến trúc mô hình của bạn theo thời gian.

Việc lựa chọn KPI AI tối ưu chỉ là bước khởi đầu

Việc triển khai và quản lý thành công một giải pháp AI phụ thuộc vào việc lựa chọn đúng KPI và cập nhật chúng thường xuyên. Nhìn chung, việc chọn các chỉ số làm nổi bật hiệu quả hoạt động của giải pháp AI về mặt kỹ thuật và tác động kinh doanh là rất quan trọng. Khi mọi thứ thay đổi, cho dù đó là tiến bộ công nghệ hay thay đổi trong chiến lược kinh doanh của bạn, điều quan trọng là phải xem xét lại và điều chỉnh các KPI này.

Bằng cách giữ cho các đánh giá hiệu suất của bạn luôn linh hoạt, bạn có thể giữ cho hệ thống AI của mình phù hợp và hiệu quả. Bằng cách luôn cập nhật các chỉ số này, bạn sẽ có được những hiểu biết có giá trị giúp cải thiện hoạt động của mình. Một cách tiếp cận chủ động đảm bảo rằng những nỗ lực AI của bạn thực sự có giá trị và giúp thúc đẩy doanh nghiệp của bạn tiến lên!

Tham gia cộng đồng của chúng tôi và đổi mới cùng chúng tôi! Khám phá kho lưu trữ GitHub của chúng tôi để xem những tiến bộ về AI của chúng tôi. Tìm hiểu cách chúng tôi đang định hình lại các ngành công nghiệp như sản xuất và chăm sóc sức khỏe bằng công nghệ AI tiên phong. 🚀

Đo lường hiệu suất AI để đánh giá tác động của những cải tiến của bạn

Sự khác biệt giữa KPI kinh doanh AI và KPI hiệu suất AI