Học máy (ML)
Khám phá Máy học (Machine Learning): Tìm hiểu các khái niệm cốt lõi, các loại và ứng dụng thực tế trong AI, thị giác máy tính và học sâu. Tìm hiểu thêm ngay bây giờ!
Học máy (ML) là một lĩnh vực con của trí tuệ nhân tạo (AI) cho phép máy tính có khả năng học hỏi mà không cần được lập trình một cách rõ ràng. Được định nghĩa lần đầu bởi những người tiên phong như Arthur Samuel, các thuật toán ML sử dụng dữ liệu lịch sử để xác định các mẫu, đưa ra dự đoán và cải thiện hiệu suất của chúng theo thời gian khi chúng tiếp xúc với nhiều thông tin hơn. Thay vì dựa vào nhà phát triển để viết mã tĩnh cho một tác vụ, một mô hình ML tự học logic của riêng nó trực tiếp từ dữ liệu mà nó được huấn luyện. Khả năng thích ứng này làm cho ML trở thành động lực thúc đẩy nhiều công nghệ tinh vi nhất hiện nay.
Phân biệt ML với các thuật ngữ liên quan
Hiểu về ML cũng có nghĩa là biết nó liên quan đến các khái niệm quan trọng khác trong lĩnh vực này như thế nào:
- Trí tuệ nhân tạo (AI): AI là khái niệm rộng về việc tạo ra các máy móc có khả năng hành vi thông minh. ML là cách tiếp cận nổi bật và thành công nhất để đạt được AI. Trong khi AI là mục tiêu bao trùm, ML là phương pháp luận thực tế cho phép các hệ thống học hỏi và thích ứng.
- Học sâu (Deep Learning - DL): Học sâu là một lĩnh vực con chuyên biệt của ML, sử dụng các mạng nơ-ron (neural networks - NNs) phức tạp, nhiều lớp, thường được gọi là mạng nơ-ron sâu. DL chịu trách nhiệm cho những đột phá lớn trong việc xử lý dữ liệu phức tạp như hình ảnh, âm thanh và văn bản, đồng thời cung cấp sức mạnh cho hầu hết các mô hình thị giác hiện đại.
- Khai thác dữ liệu (Data Mining): Mặc dù cả hai lĩnh vực đều phân tích dữ liệu, nhưng mục tiêu của chúng khác nhau. Khai thác dữ liệu, như được định nghĩa bởi các nhà lãnh đạo ngành như SAS, tập trung vào việc khám phá các mẫu chưa được biết đến trước đây trong các tập dữ liệu lớn để tạo ra thông tin chi tiết cho con người sử dụng. Ngược lại, ML sử dụng các mẫu để xây dựng các mô hình dự đoán có thể đưa ra quyết định tự động trên dữ liệu mới, chưa từng thấy.
Các loại Machine Learning
Các mô hình ML thường được phân loại dựa trên cách chúng học từ dữ liệu:
- Học có giám sát (Supervised Learning): Loại phổ biến nhất, trong đó mô hình học từ dữ liệu được gắn nhãn (labeled data) bao gồm các cặp đầu vào-đầu ra. Mục tiêu là học một hàm ánh xạ có thể dự đoán đầu ra cho các đầu vào mới. Phân loại hình ảnh (Image classification) và phát hiện thư rác là những ví dụ điển hình.
- Học không giám sát: Mô hình được cung cấp dữ liệu không được gắn nhãn và phải tự tìm các mẫu hoặc cấu trúc nội tại, chẳng hạn như nhóm các điểm dữ liệu thành các cụm. Phát hiện bất thường và phân khúc khách hàng là những trường hợp sử dụng phổ biến.
- Học tăng cường (Reinforcement Learning): Một tác nhân học bằng cách tương tác với một môi trường. Nó nhận được phần thưởng cho các hành động mong muốn và hình phạt cho những hành động không mong muốn, với mục tiêu tối đa hóa phần thưởng tích lũy của nó. Phương pháp này được sử dụng rộng rãi trong robotics và chơi trò chơi chiến lược.
Tầm quan trọng trong AI và Thị giác máy tính
Học máy là một trụ cột nền tảng của AI hiện đại và đặc biệt mang tính chuyển đổi trong lĩnh vực Thị giác máy tính (CV). Các tác vụ như Phát hiện đối tượng, Phân vùng ảnh và ước tính tư thế phụ thuộc rất nhiều vào các mô hình ML để diễn giải và hiểu thông tin trực quan. Các mô hình hiện đại như Ultralytics YOLO tận dụng các kỹ thuật ML, đặc biệt là Học sâu, để đạt được độ chính xác và tốc độ cao trong các ứng dụng thời gian thực.
Dưới đây là hai ví dụ về ứng dụng của ML:
- Phân tích hình ảnh y tế: Trong AI cho chăm sóc sức khỏe, các mô hình ML được huấn luyện trên các tập dữ liệu như tập dữ liệu Brain Tumor có thể phân tích ảnh chụp MRI hoặc CT để phát hiện và phác thảo các bất thường tiềm ẩn. Điều này hỗ trợ các bác sĩ радиолог bằng cách làm nổi bật các khu vực đáng lo ngại, dẫn đến chẩn đoán nhanh hơn và chính xác hơn. Các tổ chức như Viện Quốc gia về Hình ảnh Y sinh và Kỹ thuật Sinh học (NIBIB) đang tích cực khám phá các ứng dụng này.
- Xe tự hành: Xe tự lái sử dụng một bộ mô hình ML để xử lý dữ liệu từ camera, LiDAR và radar trong thời gian thực. Trong AI cho ô tô, các mô hình này được sử dụng để phát hiện và phân loại các đối tượng như các phương tiện khác, người đi bộ và biển báo giao thông, cho phép xe điều hướng môi trường của nó một cách an toàn. Các nền tảng công nghệ như DRIVE của NVIDIA được xây dựng dựa trên các khả năng ML mạnh mẽ.
Công Cụ và Framework
Việc phát triển và triển khai các mô hình ML được hỗ trợ bởi một hệ sinh thái công cụ phong phú. Các framework như PyTorch (truy cập trang web chính thức của PyTorch) và TensorFlow (truy cập trang chủ của TensorFlow) cung cấp các khối xây dựng thiết yếu để tạo ra các mạng neural.
Các nền tảng như Ultralytics HUB cung cấp các môi trường tích hợp giúp hợp lý hóa toàn bộ quy trình làm việc, từ quản lý bộ dữ liệu và huấn luyện các mô hình tùy chỉnh đến triển khai mô hình và giám sát thông qua MLOps. Tạo một mô hình hiệu quả thường liên quan đến điều chỉnh siêu tham số cẩn thận và hiểu sâu về các chỉ số hiệu suất.