Thuật ngữ

Học có giám sát

Khám phá cách học có giám sát hỗ trợ AI bằng dữ liệu được gắn nhãn, cho phép dự đoán chính xác và ứng dụng như phát hiện đối tượng và phân tích tình cảm.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Học có giám sát là một phạm trù cơ bản của học máy (ML), trong đó các thuật toán học từ một tập dữ liệu chứa các cặp đầu vào-đầu ra, được gọi là dữ liệu được gắn nhãn. Về bản chất, thuật toán được "giám sát" vì nó học bằng cách so sánh các dự đoán của nó trên dữ liệu đầu vào với các đầu ra chính xác đã biết (nhãn) được cung cấp trong dữ liệu đào tạo . Mục tiêu là để thuật toán học một hàm ánh xạ có thể dự đoán chính xác đầu ra cho các đầu vào mới, chưa từng thấy. Cách tiếp cận này là trọng tâm của nhiều ứng dụng Trí tuệ nhân tạo (AI) hiện đại, cho phép các hệ thống đưa ra dự đoán hoặc quyết định dựa trên các ví dụ lịch sử được tìm thấy trong các tập dữ liệu chuẩn hoặc các tập dữ liệu tùy chỉnh.

Học có giám sát hoạt động như thế nào

Quá trình bắt đầu với một tập dữ liệu được chuẩn bị cẩn thận, trong đó mỗi điểm dữ liệu bao gồm các tính năng đầu vào và nhãn đầu ra chính xác tương ứng. Điều này thường liên quan đến nỗ lực đáng kể trong việc thu thập dữ liệu và chú thích . Ví dụ, trong tác vụ phân loại hình ảnh , đầu vào sẽ là hình ảnh (có thể được xử lý trước bằng các kỹ thuật từ các thư viện như OpenCV ) và nhãn sẽ là các danh mục mà chúng thuộc về (ví dụ: 'mèo', 'chó'). Thuật toán lặp đi lặp lại đưa ra dự đoán trên dữ liệu đào tạo và điều chỉnh các tham số nội bộ (hoặc trọng số mô hình ) của nó bằng thuật toán tối ưu hóa như Stochastic Gradient Descent (SGD) hoặc Adam để giảm thiểu sự khác biệt giữa các dự đoán của nó và các nhãn thực tế. Sự khác biệt này được đo bằng hàm mất mát . Quá trình đào tạo này tiếp tục, thường là qua nhiều kỷ nguyên , cho đến khi mô hình đạt được mức độ chính xác thỏa đáng hoặc các số liệu hiệu suất có liên quan khác trên dữ liệu xác thực riêng biệt, đảm bảo rằng nó tổng quát hóa tốt với dữ liệu mới và tránh quá khớp .

Sự liên quan và ứng dụng

Học có giám sát cực kỳ linh hoạt và hỗ trợ một loạt các ứng dụng trong đó dữ liệu lịch sử có thể dự đoán các sự kiện trong tương lai hoặc phân loại thông tin mới. Khả năng học trực tiếp từ các ví dụ được gắn nhãn của nó khiến nó phù hợp với các tác vụ đòi hỏi độ chính xác cao. Nhiều tác vụ thị giác máy tính (CV) phụ thuộc rất nhiều vào học có giám sát, bao gồm cả những tác vụ được thực hiện bởi các mô hình tiên tiến như Ultralytics YOLO .

Sau đây là hai ví dụ cụ thể:

  • Phân tích hình ảnh y tế: Các mô hình học có giám sát có thể được đào tạo trên các bản quét y tế (như MRI hoặc CT) được các bác sĩ X quang dán nhãn để phát hiện khối u trong hình ảnh y tế . Điều này hỗ trợ các chuyên gia chăm sóc sức khỏe trong việc chẩn đoán, tạo thành một phần cốt lõi của nhiều giải pháp AI trong chăm sóc sức khỏe . Xem nghiên cứu liên quan từ các nguồn như Radiology: Artificial Intelligence .
  • Phân tích tình cảm: Thuật toán học từ dữ liệu văn bản được gắn nhãn với các loại tình cảm (ví dụ: tích cực, tiêu cực, trung lập) để tự động xác định tình cảm được thể hiện trong văn bản mới, chẳng hạn như đánh giá của khách hàng hoặc bài đăng trên phương tiện truyền thông xã hội. Điều này có giá trị cho nghiên cứu thị trường và giám sát thương hiệu. Tìm hiểu thêm về phân tích tình cảm .

Các ứng dụng phổ biến khác bao gồm phát hiện đối tượng trong hình ảnh và video (được sử dụng trong xe tự hànhhệ thống an ninh ), lọc email rác, dự đoán giá nhà (một tác vụ hồi quy ) và nhận dạng khuôn mặt . Nó cũng được áp dụng trong AI để quản lý hàng tồn kho bán lẻ thông minh hơnAI trong các giải pháp nông nghiệp .

Các khái niệm chính

Một số khái niệm đóng vai trò trung tâm trong việc hiểu và áp dụng hiệu quả phương pháp học có giám sát:

So sánh với các mô hình học tập khác

Học có giám sát khác biệt với các mô hình học máy cơ bản khác:

  • Học không giám sát : Phương pháp này sử dụng dữ liệu không có nhãn, trong đó thuật toán cố gắng tự tìm các mẫu hoặc cấu trúc, chẳng hạn như nhóm các điểm dữ liệu tương tự ( phân cụm ) hoặc giảm kích thước dữ liệu. Nó không học ánh xạ đầu vào-đầu ra trực tiếp từ các câu trả lời đã biết. Đọc Tổng quan về Học không giám sát .
  • Học tăng cường : Trong mô hình này, một tác nhân học cách đưa ra chuỗi quyết định bằng cách tương tác với môi trường và nhận phần thưởng hoặc hình phạt dựa trên hành động của mình. Nó học các hành vi tối ưu thông qua thử nghiệm và sai sót, thay vì từ các ví dụ được gắn nhãn. Khám phá Tổng quan về Học tăng cường .

Tóm lại, học có giám sát là một kỹ thuật mạnh mẽ và được sử dụng rộng rãi, tận dụng dữ liệu được gắn nhãn để đào tạo các mô hình cho các nhiệm vụ dự đoán. Nó tạo thành xương sống của nhiều ứng dụng AI thành công, bao gồm cả những ứng dụng được phát triển và hỗ trợ bởi Ultralytics và là một kỹ năng quan trọng đối với bất kỳ ai làm việc trong lĩnh vực khoa học dữ liệu hoặc AI.

Đọc tất cả