Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Thị giác AI

Tất cả những điều bạn cần biết về AI có thể giải thích (XAI)

Khám phá cách AI có thể giải thích (XAI) xây dựng niềm tin bằng cách giúp các dự đoán AI trở nên minh bạch và đáng tin cậy trong các lĩnh vực y tế, bảo mật, lái xe tự động, và hơn thế nữa.

ABAbirami Vina
4 min read
Tổng quan về AI có thể giải thích (XAI) trong thị giác máy tính

Bạn đã bao giờ nhìn thấy phản hồi từ một công cụ trí tuệ nhân tạo (AI) như ChatGPT và tự hỏi làm thế nào nó đưa ra kết luận đó chưa? Nếu vậy, bạn đã gặp phải mối lo ngại về "hộp đen" của AI. Đây là thuật ngữ chỉ sự thiếu minh bạch trong cách các model AI xử lý và phân tích dữ liệu. Ngay cả các kỹ sư và nhà khoa học AI làm việc thường xuyên với các thuật toán AI tiên tiến cũng có thể thấy việc hiểu thấu đáo cơ chế bên trong của chúng là một thách thức. Trên thực tế, chỉ 22% chuyên gia CNTT thực sự hiểu rõ khả năng của các công cụ AI.

Sự không chắc chắn xung quanh cách các model AI đưa ra quyết định có thể gây rủi ro, đặc biệt là trong các lĩnh vực quan trọng như thị giác máy tính trong y tếAI trong tài chính. Tuy nhiên, những tiến bộ đáng kể đang được thực hiện để giải quyết các thách thức này và cải thiện tính minh bạch.

Cụ thể, trí tuệ nhân tạo có thể giải thích (XAI) tập trung hoàn toàn vào việc giải quyết mối lo ngại này. Nói một cách đơn giản, đó là một tập hợp các quy trình và phương pháp giúp người dùng hiểu và tin tưởng vào các kết quả hoặc đầu ra được đưa ra bởi các thuật toán học máy phức tạp.

XAI có thể giúp các nhà phát triển đảm bảo rằng các hệ thống AI đang hoạt động như mong đợi. Nó cũng có thể giúp các công ty AI đáp ứng các tiêu chuẩn quy định. Trong bài viết này, chúng ta sẽ khám phá về trí tuệ nhân tạo có thể giải thích và phạm vi ứng dụng rộng rãi của nó. Hãy bắt đầu ngay thôi!

Link to this sectionTầm quan trọng của trí tuệ nhân tạo có thể giải thích#

Khả năng giải thích là yếu tố then chốt khi làm việc với AI. Điều này đặc biệt đúng khi đề cập đến lĩnh vực con của AI là thị giác máy tính, vốn được sử dụng rộng rãi trong các ứng dụng tại nhiều ngành công nghiệp như y tế. Khi sử dụng các vision model trong các ngành nhạy cảm như vậy, điều quan trọng là cơ chế hoạt động của model phải minh bạch và có thể diễn giải được đối với mọi người.

Khả năng diễn giải trong các model thị giác máy tính giúp người dùng hiểu rõ hơn về cách một dự đoán được đưa ra và logic đằng sau nó. Tính minh bạch góp phần vào điều này bằng cách làm rõ cơ chế hoạt động của model cho mọi người, thông qua việc vạch rõ các hạn chế của model và đảm bảo dữ liệu được sử dụng một cách đạo đức. Ví dụ, thị giác máy tính có thể giúp các bác sĩ chẩn đoán hình ảnh xác định hiệu quả các biến chứng sức khỏe trong ảnh X-quang.

Ảnh chụp X-quang ngực được phân tích bằng vision AI để phân loại bệnh lao

Hình 1. Ảnh chụp X-quang ngực được phân tích bằng thị giác AI cho thấy các phân loại bệnh lao: khỏe mạnh, mắc bệnh, đang hoạt động và tiềm ẩn.

Tuy nhiên, một hệ thống thị giác chỉ chính xác thôi là chưa đủ. Hệ thống đó còn cần có khả năng giải thích các quyết định của mình. Giả sử hệ thống có thể hiển thị những phần nào của hình ảnh dẫn đến kết luận của nó - khi đó, mọi đầu ra sẽ trở nên rõ ràng hơn. Mức độ minh bạch như vậy sẽ giúp các chuyên gia y tế kiểm tra chéo các phát hiện của họ và đảm bảo rằng chăm sóc bệnh nhân đáp ứng các tiêu chuẩn y tế.

Một lý do khác khiến khả năng giải thích trở nên cần thiết là nó giúp các công ty AI có trách nhiệm giải trình và xây dựng lòng tin nơi người dùng. AI đáng tin cậy khiến người dùng cảm thấy tự tin rằng các đổi mới AI hoạt động ổn định, đưa ra các quyết định công bằng và xử lý dữ liệu một cách có trách nhiệm.

Link to this sectionCác kỹ thuật XAI quan trọng trong thị giác máy tính#

Bây giờ chúng ta đã thảo luận tại sao khả năng giải thích lại quan trọng trong thị giác máy tính, hãy cùng xem xét các kỹ thuật XAI then chốt được sử dụng trong thị giác AI.

Link to this sectionSaliency maps#

Mạng thần kinh là các model lấy cảm hứng từ bộ não con người, được thiết kế để nhận diện các mẫu và đưa ra quyết định bằng cách xử lý dữ liệu qua các lớp nút (nơ-ron) kết nối với nhau. Chúng có thể được sử dụng để giải quyết các vấn đề phức tạp trong thị giác máy tính với độ chính xác cao. Ngay cả với độ chính xác này, chúng vẫn là những hộp đen theo thiết kế.

Saliency maps là một kỹ thuật XAI có thể được sử dụng để giúp hiểu rõ những gì mạng thần kinh đang thấy khi chúng phân tích hình ảnh. Nó cũng có thể được sử dụng để xử lý sự cố cho các model trong trường hợp chúng không hoạt động như mong đợi.

Saliency maps hoạt động bằng cách tập trung vào việc những phần nào của hình ảnh (pixel) xác định các dự đoán của model. Quá trình này rất giống với lan truyền ngược, nơi model truy vết ngược từ dự đoán đến đầu vào. Nhưng thay vì cập nhật trọng số của model dựa trên các lỗi, chúng ta chỉ quan sát xem mỗi pixel "có ý nghĩa" như thế nào đối với dự đoán. Saliency maps rất hữu ích cho các tác vụ thị giác máy tính như phân loại hình ảnh.

Ví dụ, nếu một model phân loại hình ảnh dự đoán rằng một hình ảnh là con chó, chúng ta có thể nhìn vào saliency map của nó để hiểu tại sao model lại nghĩ đó là con chó. Điều này giúp chúng ta xác định pixel nào ảnh hưởng đến đầu ra nhiều nhất. Saliency map sẽ làm nổi bật tất cả các pixel góp phần vào dự đoán cuối cùng rằng hình ảnh là một con chó.

Chế độ xem song song của hình ảnh đầu vào và các bản đồ nổi bật (saliency maps) của chúng

Hình 2. Góc nhìn song song của các hình ảnh đầu vào và saliency maps của chúng.

Link to this sectionClass Activation Mapping (CAM)#

Class Activation Mapping là một kỹ thuật XAI khác được sử dụng để hiểu những phần nào của hình ảnh mà mạng thần kinh tập trung vào khi đưa ra dự đoán phân loại hình ảnh. Nó hoạt động tương tự như saliency maps nhưng tập trung vào việc xác định các đặc trưng quan trọng trong hình ảnh thay vì các pixel cụ thể. Đặc trưng là các mẫu hoặc chi tiết, như hình dạng hoặc kết cấu, mà model phát hiện được trong hình ảnh.

Các phương pháp như Gradient Weighted Class Activation Mapping (Grad-CAM) và Grad-CAM++ xây dựng dựa trên cùng một ý tưởng, với một số cải tiến.

Dưới đây là cách CAM hoạt động:

  • Trước khi mạng thần kinh đưa ra quyết định cuối cùng, nó sử dụng một bước gọi là gộp trung bình toàn cục (GAP) để đơn giản hóa thông tin. GAP kết hợp tất cả các pixel trong một mẫu được phát hiện thành một giá trị trung bình duy nhất, tạo ra một bản tóm tắt cho mỗi bản đồ đặc trưng (biểu diễn trực quan của các mẫu được phát hiện).
  • Mỗi bản đồ đặc trưng sau đó được gán một trọng số cho thấy mức độ quan trọng của nó đối với việc dự đoán một lớp nhất định (như "chim" hoặc "mèo").
  • Tuy nhiên, một hạn chế của CAM là bạn có thể cần phải đào tạo lại model để tính toán các trọng số này, điều này có thể tốn thời gian.

Grad-CAM cải thiện điều này bằng cách sử dụng gradients, là các tín hiệu cho thấy mỗi bản đồ đặc trưng ảnh hưởng đến dự đoán cuối cùng như thế nào. Phương pháp này tránh được nhu cầu sử dụng GAP và giúp dễ dàng thấy được model tập trung vào cái gì mà không cần đào tạo lại. Grad-CAM++ tiến xa hơn bằng cách chỉ tập trung vào các ảnh hưởng tích cực, giúp kết quả trở nên rõ ràng hơn nữa.

So sánh CAM, Grad-CAM và Grad-CAM++

Hình 3. So sánh giữa CAM, Grad-CAM và Grad-CAM++.

Link to this sectionGiải thích phản thực (Counterfactual explanations)#

Giải thích phản thực là một yếu tố quan trọng của trí tuệ nhân tạo có thể giải thích. Giải thích phản thực liên quan đến việc mô tả một tình huống hoặc kết quả bằng cách xem xét các kịch bản thay thế hoặc các sự kiện không xảy ra nhưng có thể đã xảy ra. Nó có thể chứng minh các thay đổi trong các biến đầu vào cụ thể dẫn đến các kết quả khác nhau như thế nào, ví dụ như: "Nếu X không xảy ra, thì Y đã không xuất hiện."

Khi nói đến AI và thị giác máy tính, một giải thích phản thực xác định thay đổi nhỏ nhất cần thiết trong một đầu vào (như một hình ảnh hoặc dữ liệu) để khiến một model AI tạo ra một kết quả khác biệt, cụ thể. Ví dụ, thay đổi màu sắc của một vật thể trong hình ảnh có thể thay đổi dự đoán của model phân loại hình ảnh từ "mèo" sang "chó."

Một ví dụ điển hình khác là thay đổi góc độ hoặc ánh sáng trong một hệ thống nhận diện khuôn mặt. Điều này có thể khiến model nhận diện ra một cá nhân khác, cho thấy những thay đổi nhỏ trong đầu vào có thể ảnh hưởng đến các dự đoán của model như thế nào.

Cách đơn giản nhất để tạo ra các giải thích này là thử và sai: bạn có thể thay đổi ngẫu nhiên các phần của đầu vào (như các đặc trưng của hình ảnh hoặc dữ liệu) cho đến khi model AI đưa ra kết quả mong muốn. Các phương pháp khác bao gồm các cách tiếp cận bất biến với model (model-agnostic), sử dụng tối ưu hóa và các kỹ thuật tìm kiếm để tìm ra các thay đổi, và các cách tiếp cận dành riêng cho model (model-specific), dựa trên các cài đặt hoặc tính toán nội bộ để xác định các thay đổi cần thiết.

Link to this sectionCác ứng dụng của trí tuệ nhân tạo có thể giải thích trong thị giác máy tính#

Bây giờ chúng ta đã khám phá XAI là gì và các kỹ thuật then chốt của nó, chúng ta có thể đi sâu vào cách nó được sử dụng trong thực tế. XAI có nhiều ứng dụng đa dạng trên nhiều lĩnh vực. Hãy đi sâu vào một số trường hợp sử dụng làm nổi bật tiềm năng của nó:

  • Hệ thống an ninh: XAI có thể được sử dụng để tăng cường các hệ thống an ninh bằng cách phát hiện các hình ảnh bị biến đổi (morphed) trong các tài liệu nhận dạng như hộ chiếu và bằng lái xe. Điều này đảm bảo tính xác thực của hình ảnh, củng cố các quy trình xác minh danh tính và ngăn chặn các hoạt động gian lận trong các ứng dụng nhạy cảm.

Cách thức hoạt động của XAI để phát hiện hình ảnh đã qua chỉnh sửa

Hình 4. Cách XAI hoạt động để phát hiện các hình ảnh bị biến đổi.

  • Lái xe tự động: Việc hiểu khả năng và hạn chế của hệ thống thị giác AI trên xe tự lái có thể là một phần quan trọng trong việc thử nghiệm xe trước khi nó được triển khai trên đường thực tế. XAI có thể giúp các công ty xe hơi xác định và giải quyết các vấn đề một cách rõ ràng hơn.

  • Hệ thống pháp luật: Các hệ thống phân tích tài liệu được hỗ trợ bởi thị giác máy tính ngày càng được sử dụng nhiều trong việc đưa ra các quyết định tư pháp. XAI hỗ trợ các kết quả công bằng và cho phép giám sát các phán quyết tự động. Nó cũng giúp các chuyên gia pháp lý hiểu cách một model AI đạt được các quyết định của mình.

  • Giám sát động vật hoang dã: Bẫy ảnh thường được sử dụng để theo dõi động vật hoang dã và thu thập dữ liệu về các loài động vật. XAI có thể được sử dụng để giải thích cách AI phân loại các loài này trong hình ảnh. Bằng cách đó, các nỗ lực bảo tồn có thể trở nên đáng tin cậy và chính xác hơn.

Link to this sectionCác điểm chính về trí tuệ nhân tạo có thể giải thích#

Trí tuệ nhân tạo có thể giải thích giúp việc hiểu cách các hệ thống AI hoạt động và lý do tại sao chúng đưa ra các quyết định nhất định trở nên dễ dàng hơn. Tính minh bạch về các model AI xây dựng lòng tin và trách nhiệm giải trình. Tri thức là sức mạnh và giúp các đổi mới AI được sử dụng một cách có trách nhiệm hơn. Trong các lĩnh vực quan trọng như y tế, an ninh, lái xe tự động và hệ thống pháp luật, XAI có thể được sử dụng để giúp các nhà phát triển và người dùng hiểu các dự đoán của AI, xác định sai sót, và đảm bảo việc sử dụng công bằng và có đạo đức. Bằng cách làm cho AI trở nên minh bạch hơn, XAI thu hẹp khoảng cách giữa công nghệ và lòng tin của con người, khiến nó trở nên an toàn và đáng tin cậy hơn cho các ứng dụng trong thế giới thực.

Để tìm hiểu thêm, hãy truy cập kho lưu trữ GitHub của chúng tôi và tham gia với cộng đồng của chúng tôi. Khám phá các ứng dụng AI trong xe tự láinông nghiệp trên các trang giải pháp của chúng tôi. 🚀

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning