Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024
Bảng chú giải thuật ngữ

Học Sâu (DL)

Khám phá sức mạnh của học sâu: khám phá mạng nơ-ron (neural networks), các kỹ thuật huấn luyện và các ứng dụng thực tế trong AI, chăm sóc sức khỏe, v.v.

Học sâu (DL) là một lĩnh vực con chuyên biệt của Học máy (ML), sử dụng các mạng nơ-ron nhiều lớp để học từ lượng lớn dữ liệu. Lấy cảm hứng từ cấu trúc của bộ não con người, các mô hình DL, thường được gọi là mạng nơ-ron sâu, được thiết kế để tự động học các biểu diễn phân cấp của dữ liệu. Điều này có nghĩa là các lớp ban đầu học các đặc trưng đơn giản và các lớp tiếp theo kết hợp chúng để học các mẫu ngày càng phức tạp. Khả năng này đã biến DL trở thành động lực thúc đẩy những tiến bộ lớn trong Trí tuệ nhân tạo (AI), đặc biệt là trong các lĩnh vực phức tạp như Thị giác máy tính (CV)Xử lý ngôn ngữ tự nhiên (NLP).

Cách học sâu hoạt động

Cốt lõi của Deep Learning là các mạng nơ-ron sâu, là các mạng nơ-ron có nhiều lớp ẩn giữa các lớp đầu vào và đầu ra. "Sâu" trong Deep Learning đề cập đến độ sâu này. Mỗi lớp chứa các đơn vị xử lý (nơ-ron) áp dụng một phép toán, được điều chỉnh bởi một hàm kích hoạt, cho đầu vào của chúng. Trong quá trình đào tạo, mạng được cung cấp tập dữ liệu lớn và một thuật toán gọi là backpropagation được sử dụng để điều chỉnh các tham số bên trong của mạng, hoặc trọng số. Quá trình điều chỉnh này, thường được hướng dẫn bởi một thuật toán tối ưu hóa như gradient descent, giảm thiểu sự khác biệt giữa các dự đoán của mô hình và ground truth thực tế, như được xác định bởi một hàm mất mát. Điều này cho phép mạng tự động khám phá các mẫu phức tạp mà không cần được lập trình rõ ràng để làm như vậy. Một bài báo lịch sử quan trọng đã giúp phổ biến DL hiện đại là bài báo AlexNet từ năm 2012, đã đạt được kết quả hiện đại trên tập dữ liệu ImageNet.

Học sâu so với Học máy

Mặc dù Học Sâu (Deep Learning) là một nhánh của Học Máy (Machine Learning), sự khác biệt chính nằm ở cách tiếp cận biểu diễn dữ liệu. Các phương pháp Học Máy truyền thống thường dựa nhiều vào kỹ thuật trích xuất đặc trưng (feature engineering) thủ công, trong đó các chuyên gia về lĩnh vực tỉ mỉ tạo ra các đặc trưng từ dữ liệu thô để giúp mô hình đưa ra các dự đoán chính xác. Ngược lại, các mô hình Học Sâu thực hiện trích xuất đặc trưng tự động. Cấu trúc phân cấp của mạng sâu cho phép chúng học các đặc trưng liên quan trực tiếp từ dữ liệu. Điều này làm cho Học Sâu đặc biệt mạnh mẽ trong việc xử lý dữ liệu phi cấu trúc như hình ảnh, văn bản và âm thanh, nơi mà kỹ thuật trích xuất đặc trưng thủ công thường không khả thi. Ví dụ: trong nhận dạng hình ảnh, một mô hình Học Sâu có thể học cách xác định các cạnh và kết cấu ở các lớp đầu tiên, sau đó là các bộ phận của đối tượng như mắt và mũi ở các lớp giữa, và cuối cùng là toàn bộ đối tượng như khuôn mặt ở các lớp sâu hơn.

Các ứng dụng và ví dụ

Khả năng xử lý dữ liệu phức tạp của Deep Learning đã dẫn đến việc nó được ứng dụng rộng rãi trong nhiều ngành và lĩnh vực. Hai ví dụ nổi bật bao gồm:

  1. Xe tự hành: Xe tự lái dựa nhiều vào DL để nhận thức theo thời gian thực. Các mô hình Ultralytics YOLO, một họ các mô hình DL hiện đại, được sử dụng để phát hiện đối tượng để xác định người đi bộ, các phương tiện khác và biển báo giao thông. Tương tự, DL được sử dụng để phân đoạn hình ảnh để phân biệt bề mặt đường có thể lái xe với môi trường xung quanh, điều này rất quan trọng để điều hướng an toàn. Đọc thêm về việc sử dụng nó trong AI trong xe tự lái.
  2. Phân tích ảnh y tế: Trong chăm sóc sức khỏe, các mô hình DL hỗ trợ các bác sĩ радиologist bằng cách phân tích ảnh chụp y tế. Mạng nơ-ron tích chập (CNN), một kiến trúc DL phổ biến cho thị giác, có thể được đào tạo để phát hiện các bất thường như khối u trong MRI não hoặc các dấu hiệu bệnh trong tia X với độ chính xác cao. Điều này có thể dẫn đến chẩn đoán sớm hơn và cải thiện kết quả cho bệnh nhân, như đã thấy trong các ứng dụng như phát hiện khối u não.

Công Cụ và Framework

Việc phát triển các mô hình DL được hỗ trợ bởi nhiều thư viện và nền tảng phần mềm khác nhau. Các framework mã nguồn mở phổ biến bao gồm:

Các nền tảng như Ultralytics HUB cung cấp các môi trường tích hợp để huấn luyện các mô hình tùy chỉnh, triển khai và quản lý các mô hình DL, đặc biệt cho các tác vụ thị giác máy tính bằng cách sử dụng các mô hình như YOLO11. Phát triển hiệu quả thường liên quan đến các phương pháp như điều chỉnh siêu tham số nghiêm ngặt, hiểu các chỉ số hiệu suất và sử dụng tăng tốc GPU để huấn luyện mô hình hiệu quả. Việc phát triển và triển khai các hệ thống phức tạp này thường được quản lý thông qua các phương pháp MLOps.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay
Đã sao chép liên kết vào clipboard