Khám phá cách học có giám sát hỗ trợ AI bằng dữ liệu được gắn nhãn, cho phép dự đoán chính xác và ứng dụng như phát hiện đối tượng và phân tích tình cảm.
Học có giám sát là một phạm trù cơ bản của học máy (ML), trong đó các thuật toán học từ một tập dữ liệu chứa các cặp đầu vào-đầu ra, được gọi là dữ liệu được gắn nhãn. Về bản chất, thuật toán được "giám sát" vì nó học bằng cách so sánh các dự đoán của nó trên dữ liệu đầu vào với các đầu ra chính xác đã biết (nhãn) được cung cấp trong dữ liệu đào tạo . Mục tiêu là để thuật toán học một hàm ánh xạ có thể dự đoán chính xác đầu ra cho các đầu vào mới, chưa từng thấy. Cách tiếp cận này là trọng tâm của nhiều ứng dụng Trí tuệ nhân tạo (AI) hiện đại, cho phép các hệ thống đưa ra dự đoán hoặc quyết định dựa trên các ví dụ lịch sử được tìm thấy trong các tập dữ liệu chuẩn hoặc các tập dữ liệu tùy chỉnh.
Quá trình bắt đầu với một tập dữ liệu được chuẩn bị cẩn thận, trong đó mỗi điểm dữ liệu bao gồm các tính năng đầu vào và nhãn đầu ra chính xác tương ứng. Điều này thường liên quan đến nỗ lực đáng kể trong việc thu thập dữ liệu và chú thích . Ví dụ, trong tác vụ phân loại hình ảnh , đầu vào sẽ là hình ảnh (có thể được xử lý trước bằng các kỹ thuật từ các thư viện như OpenCV ) và nhãn sẽ là các danh mục mà chúng thuộc về (ví dụ: 'mèo', 'chó'). Thuật toán lặp đi lặp lại đưa ra dự đoán trên dữ liệu đào tạo và điều chỉnh các tham số nội bộ (hoặc trọng số mô hình ) của nó bằng thuật toán tối ưu hóa như Stochastic Gradient Descent (SGD) hoặc Adam để giảm thiểu sự khác biệt giữa các dự đoán của nó và các nhãn thực tế. Sự khác biệt này được đo bằng hàm mất mát . Quá trình đào tạo này tiếp tục, thường là qua nhiều kỷ nguyên , cho đến khi mô hình đạt được mức độ chính xác thỏa đáng hoặc các số liệu hiệu suất có liên quan khác trên dữ liệu xác thực riêng biệt, đảm bảo rằng nó tổng quát hóa tốt với dữ liệu mới và tránh quá khớp .
Học có giám sát cực kỳ linh hoạt và hỗ trợ một loạt các ứng dụng trong đó dữ liệu lịch sử có thể dự đoán các sự kiện trong tương lai hoặc phân loại thông tin mới. Khả năng học trực tiếp từ các ví dụ được gắn nhãn của nó khiến nó phù hợp với các tác vụ đòi hỏi độ chính xác cao. Nhiều tác vụ thị giác máy tính (CV) phụ thuộc rất nhiều vào học có giám sát, bao gồm cả những tác vụ được thực hiện bởi các mô hình tiên tiến như Ultralytics YOLO .
Sau đây là hai ví dụ cụ thể:
Các ứng dụng phổ biến khác bao gồm phát hiện đối tượng trong hình ảnh và video (được sử dụng trong xe tự hành và hệ thống an ninh ), lọc email rác, dự đoán giá nhà (một tác vụ hồi quy ) và nhận dạng khuôn mặt . Nó cũng được áp dụng trong AI để quản lý hàng tồn kho bán lẻ thông minh hơn và AI trong các giải pháp nông nghiệp .
Một số khái niệm đóng vai trò trung tâm trong việc hiểu và áp dụng hiệu quả phương pháp học có giám sát:
Học có giám sát khác biệt với các mô hình học máy cơ bản khác:
Tóm lại, học có giám sát là một kỹ thuật mạnh mẽ và được sử dụng rộng rãi, tận dụng dữ liệu được gắn nhãn để đào tạo các mô hình cho các nhiệm vụ dự đoán. Nó tạo thành xương sống của nhiều ứng dụng AI thành công, bao gồm cả những ứng dụng được phát triển và hỗ trợ bởi Ultralytics và là một kỹ năng quan trọng đối với bất kỳ ai làm việc trong lĩnh vực khoa học dữ liệu hoặc AI.