Khám phá cách học có giám sát cung cấp năng lượng cho AI bằng dữ liệu được gắn nhãn, cho phép dự đoán chính xác và các ứng dụng như object detection và phân tích сентимент.
Học có giám sát là một mô hình cơ bản trong Học máy (ML), trong đó thuật toán học cách ánh xạ dữ liệu đầu vào đến các mục tiêu đầu ra cụ thể bằng cách sử dụng tập dữ liệu được gắn nhãn. Trong khuôn khổ giáo dục này, "người giám sát" là tập hợp dữ liệu được gắn nhãn cung cấp các câu trả lời chính xác, hướng dẫn quá trình huấn luyện của mô hình. Mục tiêu chính là huấn luyện hệ thống đủ tốt để nó có thể dự đoán chính xác đầu ra cho dữ liệu thử nghiệm mới, chưa từng thấy. Phương pháp này là nền tảng của nhiều ứng dụng Trí tuệ nhân tạo (AI) thương mại thành công nhất hiện nay, từ bộ lọc thư rác đến các công cụ chẩn đoán tinh vi.
Quá trình bắt đầu với một tập dữ liệu chứa các cặp đầu vào (đặc trưng) và đầu ra mong muốn (nhãn). Trong giai đoạn huấn luyện mô hình , thuật toán xử lý các đầu vào và đưa ra dự đoán. Một công thức toán học được gọi là hàm mất mát sẽ tính toán sai số—sự khác biệt giữa dự đoán của mô hình và nhãn thực tế.
Để giảm thiểu lỗi này, một thuật toán tối ưu hóa , chẳng hạn như Thuật toán Giảm Độ Phức Ngẫu Nhiên ( SGD ) , sẽ điều chỉnh lặp đi lặp lại các trọng số nội bộ của mô hình . Chu kỳ này lặp lại qua nhiều epoch cho đến khi mô hình đạt được độ chính xác cao mà không bị quá khớp với các ví dụ huấn luyện. Để hiểu sâu hơn về mặt kỹ thuật, hướng dẫn về học có giám sát của Scikit-learn cung cấp tài liệu tuyệt vời về các thuật toán khác nhau.
Các nhiệm vụ học có giám sát thường được chia thành hai loại chính dựa trên bản chất của biến đầu ra:
Học có giám sát là động lực thúc đẩy nhiều công nghệ mang tính đột phá:
Để hiểu rõ hơn về lĩnh vực trí tuệ nhân tạo, việc phân biệt học có giám sát với các mô hình khác là rất hữu ích:
Các thư viện hiện đại giúp việc triển khai học có giám sát trở nên dễ dàng hơn. Sau đây là một số điểm nổi bật: Python Đoạn mã này minh họa cách huấn luyện mô hình phân loại YOLO11 trên tập dữ liệu MNIST , một bộ dữ liệu chuẩn để nhận dạng chữ số viết tay.
from ultralytics import YOLO
# Load a pretrained model (YOLO11n-cls) to start transfer learning
model = YOLO("yolo11n-cls.pt")
# Train the model using the MNIST dataset for 5 epochs
# The 'mnist160' dataset is automatically downloaded by Ultralytics
results = model.train(data="mnist160", epochs=5, imgsz=64)
# Run inference on a sample image to verify the learned behavior
print(model("https://ultralytics.com/images/bus.jpg"))