Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Học có giám sát

Khám phá cách học có giám sát cung cấp năng lượng cho AI bằng dữ liệu được gắn nhãn, cho phép dự đoán chính xác và các ứng dụng như object detection và phân tích сентимент.

Học có giám sát là một mô hình cơ bản trong Học máy (ML), trong đó thuật toán học cách ánh xạ dữ liệu đầu vào đến các mục tiêu đầu ra cụ thể bằng cách sử dụng tập dữ liệu được gắn nhãn. Trong khuôn khổ giáo dục này, "người giám sát" là tập hợp dữ liệu được gắn nhãn cung cấp các câu trả lời chính xác, hướng dẫn quá trình huấn luyện của mô hình. Mục tiêu chính là huấn luyện hệ thống đủ tốt để nó có thể dự đoán chính xác đầu ra cho dữ liệu thử nghiệm mới, chưa từng thấy. Phương pháp này là nền tảng của nhiều ứng dụng Trí tuệ nhân tạo (AI) thương mại thành công nhất hiện nay, từ bộ lọc thư rác đến các công cụ chẩn đoán tinh vi.

Cơ chế của học có giám sát

Quá trình bắt đầu với một tập dữ liệu chứa các cặp đầu vào (đặc trưng) và đầu ra mong muốn (nhãn). Trong giai đoạn huấn luyện mô hình , thuật toán xử lý các đầu vào và đưa ra dự đoán. Một công thức toán học được gọi là hàm mất mát sẽ tính toán sai số—sự khác biệt giữa dự đoán của mô hình và nhãn thực tế.

Để giảm thiểu lỗi này, một thuật toán tối ưu hóa , chẳng hạn như Thuật toán Giảm Độ Phức Ngẫu Nhiên ( SGD ) , sẽ điều chỉnh lặp đi lặp lại các trọng số nội bộ của mô hình . Chu kỳ này lặp lại qua nhiều epoch cho đến khi mô hình đạt được độ chính xác cao mà không bị quá khớp với các ví dụ huấn luyện. Để hiểu sâu hơn về mặt kỹ thuật, hướng dẫn về học có giám sát của Scikit-learn cung cấp tài liệu tuyệt vời về các thuật toán khác nhau.

Các danh mục chính

Các nhiệm vụ học có giám sát thường được chia thành hai loại chính dựa trên bản chất của biến đầu ra:

  • Phân loại hình ảnh : Kết quả đầu ra là một danh mục riêng biệt. Mục tiêu là dự đoán nhãn lớp, chẳng hạn như xác định xem hình ảnh có chứa "ô tô" hay "người". Các mô hình hiện đại như Ultralytics YOLO26 được thiết kế để xử lý các tác vụ này với hiệu quả cao.
  • Phân tích hồi quy : Kết quả đầu ra là một giá trị số liên tục. Ví dụ bao gồm dự đoán giá nhà dựa trên diện tích hoặc ước tính thời gian giao hàng. Bạn có thể tìm hiểu cơ sở thống kê của các phương pháp này trong tổng quan về hồi quy tuyến tính của IBM .

Các Ứng dụng Thực tế

Học có giám sát là động lực thúc đẩy nhiều công nghệ mang tính đột phá:

  1. Phân tích hình ảnh y tế : Trong lĩnh vực chăm sóc sức khỏe, các mô hình AI được huấn luyện trên hàng ngàn ảnh chụp X-quang hoặc MRI đã được chú thích giúp các bác sĩ phát hiện các bất thường. Ví dụ, sử dụng bộ dữ liệu Phát hiện khối u não , một hệ thống có thể học cách định vị khối u với độ chính xác cao, đóng vai trò như một "đôi mắt thứ hai" cho các bác sĩ X-quang.
  2. Xe tự hành : Xe tự lái dựa vào các hệ thống Thị giác máy tính (CV) được huấn luyện thông qua học có giám sát để điều hướng an toàn. Bằng cách xử lý lượng dữ liệu khổng lồ được gắn nhãn với người đi bộ, biển báo giao thông và vạch kẻ làn đường, những chiếc xe này học cách đưa ra quyết định trong thời gian thực. Các công ty hàng đầu trong ngành như Waymo tận dụng học sâu để diễn giải dữ liệu cảm biến phức tạp.

Phân biệt các khái niệm liên quan

Để hiểu rõ hơn về lĩnh vực trí tuệ nhân tạo, việc phân biệt học có giám sát với các mô hình khác là rất hữu ích:

  • Học không giám sát : Phương pháp này xử lý dữ liệu không được gắn nhãn. Thuật toán cố gắng tự tìm ra các cấu trúc hoặc mô hình ẩn, thường sử dụng các kỹ thuật như phân cụm K-Means để nhóm các điểm dữ liệu tương tự.
  • Học tăng cường : Thay vì các cặp dữ liệu tĩnh, tác nhân học hỏi bằng cách tương tác với môi trường. Nó cải thiện hành vi của mình dựa trên phản hồi dưới dạng phần thưởng hoặc hình phạt, một khái niệm cốt lõi trong robot học .
  • Học bán giám sát : Một phương pháp lai kết hợp một lượng nhỏ dữ liệu được gắn nhãn với một lượng lớn dữ liệu chưa được gắn nhãn để cải thiện độ chính xác của quá trình học khi việc gắn nhãn dữ liệu tốn kém.

Ví dụ mã: Huấn luyện bộ phân loại

Các thư viện hiện đại giúp việc triển khai học có giám sát trở nên dễ dàng hơn. Sau đây là một số điểm nổi bật: Python Đoạn mã này minh họa cách huấn luyện mô hình phân loại YOLO11 trên tập dữ liệu MNIST , một bộ dữ liệu chuẩn để nhận dạng chữ số viết tay.

from ultralytics import YOLO

# Load a pretrained model (YOLO11n-cls) to start transfer learning
model = YOLO("yolo11n-cls.pt")

# Train the model using the MNIST dataset for 5 epochs
# The 'mnist160' dataset is automatically downloaded by Ultralytics
results = model.train(data="mnist160", epochs=5, imgsz=64)

# Run inference on a sample image to verify the learned behavior
print(model("https://ultralytics.com/images/bus.jpg"))

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay