Khám phá Mạng Bayesian và vai trò của chúng trong suy luận xác suất. Tìm hiểu cách các mô hình đồ họa này nâng cao trí tuệ nhân tạo có thể giải thích được và kết hợp với... Ultralytics YOLO26.
Mạng Bayesian là một loại mô hình đồ họa xác suất sử dụng đồ thị không chu trình có hướng (DAG) để biểu diễn một tập hợp các biến và sự phụ thuộc có điều kiện của chúng. Không giống như các thuật toán "hộp đen" chỉ đơn giản là ánh xạ đầu vào thành đầu ra, các mạng này mô hình hóa rõ ràng các mối quan hệ nhân quả giữa các yếu tố khác nhau. Cấu trúc này cho phép các nhà khoa học dữ liệu thực hiện mô hình dự đoán và suy luận trong điều kiện không chắc chắn, khiến chúng trở nên rất hiệu quả trong các trường hợp dữ liệu có thể không đầy đủ hoặc cần kết hợp kiến thức chuyên môn với bằng chứng thống kê.
Cốt lõi của các mạng lưới này là định lý Bayes , một công thức toán học được sử dụng để cập nhật xác suất của một giả thuyết khi có thêm bằng chứng hoặc thông tin. Trong mạng Bayes, các nút đại diện cho các biến – chẳng hạn như triệu chứng, chỉ số cảm biến hoặc nhãn phân loại – trong khi các cạnh (mũi tên) đại diện cho các mối quan hệ xác suất. Nếu tồn tại một liên kết từ nút A đến nút B, điều đó cho thấy A có ảnh hưởng trực tiếp đến B. Kiến trúc này rất quan trọng đối với Trí tuệ Nhân tạo Có thể Giải thích (XAI) vì nó cho phép người dùng theo dõi quá trình suy luận của mô hình, mang lại sự minh bạch mà thường khó đạt được với các kiến trúc học sâu phức tạp.
Các mô hình này đặc biệt phù hợp trong các lĩnh vực đòi hỏi đánh giá rủi ro nghiêm ngặt. Bằng cách sử dụng phân phối xác suất có điều kiện , mạng Bayes có thể trả lời các câu hỏi về trạng thái của một biến cụ thể dựa trên bằng chứng quan sát được về các biến khác. Quá trình này, thường được gọi là suy luận xác suất, khác biệt với phép xấp xỉ hàm được thực hiện bởi các mạng nơ-ron tiêu chuẩn.
Mạng Bayes được sử dụng rộng rãi trong các ngành công nghiệp mà việc ra quyết định đòi hỏi phải cân nhắc nhiều yếu tố không chắc chắn.
Điều quan trọng là phải phân biệt Mạng Bayes với các mô hình thống kê và học máy khác:
Trong khi mạng Bayes xử lý các đồ thị nhân quả rõ ràng, các mô hình học sâu hiện đại cũng đưa ra các điểm số độ tin cậy xác suất phản ánh mức độ chắc chắn. Khi sử dụng các công cụ như nền tảng Ultralytics để huấn luyện mô hình trên các tập dữ liệu tùy chỉnh, việc hiểu các xác suất này là chìa khóa để diễn giải hiệu suất của mô hình.
Sau đây Python Đoạn mã này minh họa cách truy cập phân bố xác suất (độ tin cậy) cho một nhiệm vụ phân loại bằng cách sử dụng mô hình đã được huấn luyện trước. Điều này cho thấy mức độ chắc chắn được định lượng như thế nào trong quy trình suy luận hiện đại.
from ultralytics import YOLO
# Load the YOLO26n-cls classification model
model = YOLO("yolo26n-cls.pt")
# Run inference on an image source
# This returns a results object containing probability data
results = model("https://ultralytics.com/images/bus.jpg")
# Iterate through results to display class probability
for result in results:
# Access the 'probs' attribute for classification probabilities
top_class_index = result.probs.top1
confidence = result.probs.top1conf
print(f"Predicted Class Index: {top_class_index}, Confidence: {confidence:.4f}")