Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Học Sâu (DL)

Khám phá sức mạnh của học sâu: khám phá mạng nơ-ron (neural networks), các kỹ thuật huấn luyện và các ứng dụng thực tế trong AI, chăm sóc sức khỏe, v.v.

Học sâu (DL) là một tập hợp con mang tính chuyển đổi của Học máy (ML) , cho phép máy tính học hỏi từ kinh nghiệm và hiểu thế giới theo hệ thống phân cấp các khái niệm. Lấy cảm hứng từ cấu trúc sinh học của bộ não con người, DL sử dụng các kiến trúc phức tạp, nhiều lớp được gọi là mạng nơ-ron (NN) để xử lý lượng dữ liệu khổng lồ. Không giống như các thuật toán truyền thống thường yêu cầu sự can thiệp của con người để xác định các quy tắc, các mô hình DL tự động thực hiện trích xuất đặc điểm , xác định các mẫu phức tạp, từ các cạnh đơn giản trong hình ảnh đến các ý nghĩa ngữ nghĩa phức tạp trong văn bản. Khả năng này khiến DL trở thành động lực đằng sau nhiều đột phá hiện đại trong Trí tuệ nhân tạo (AI) , đặc biệt là trong các lĩnh vực như Thị giác máy tính (CV)Xử lý ngôn ngữ tự nhiên (NLP) .

Cách học sâu hoạt động

"Deep" (sâu) trong Học sâu đề cập đến số lượng lớp ẩn trong mạng nơ-ron. Trong khi một mạng đơn giản có thể có một hoặc hai lớp, các mô hình sâu có thể có hàng chục hoặc thậm chí hàng trăm lớp. Mỗi lớp bao gồm các nút, hay nơ-ron, xử lý dữ liệu đầu vào bằng cách sử dụng trọng số mô hình và một hàm kích hoạt , chẳng hạn như ReLU hoặc Sigmoid. Trong giai đoạn huấn luyện, mô hình được tiếp xúc với các tập dữ liệu đã được gán nhãn và nó sẽ điều chỉnh các tham số nội bộ để giảm thiểu lỗi.

Việc điều chỉnh này được thực hiện thông qua một quá trình gọi là lan truyền ngược (backpropagation) , tính toán độ dốc của hàm mất mát . Một thuật toán tối ưu hóa , thường là giảm độ dốc (gradient descent ), sau đó cập nhật các trọng số để cải thiện độ chính xác. Qua nhiều lần lặp, hay kỷ nguyên (epoch) , mạng sẽ học cách ánh xạ đầu vào thành đầu ra với độ chính xác cao, thực chất là "học" từ dữ liệu huấn luyện .

Học sâu so với Học máy

Mặc dù DL là một phần của ML, nhưng hai phương pháp này có sự khác biệt đáng kể về cách tiếp cận dữ liệu. Các phương pháp ML truyền thống thường dựa vào kỹ thuật đặc trưng thủ công, trong đó các chuyên gia trong lĩnh vực phải lựa chọn và định dạng rõ ràng các đặc trưng mà mô hình cần phân tích. Ví dụ, trong nhận dạng hình ảnh , một chuyên gia có thể viết mã để detect các cạnh hoặc góc.

Ngược lại, các mô hình Học sâu học các tính năng này một cách tự động. Mạng nơ-ron tích chập (CNN) , một kiến trúc Học sâu phổ biến, có thể học cách detect các cạnh ở lớp đầu tiên, hình dạng ở lớp thứ hai, và các đối tượng dễ nhận biết như ô tô hoặc khuôn mặt ở các lớp sâu hơn. Điều này loại bỏ nhu cầu trích xuất đặc điểm thủ công và cho phép DL mở rộng hiệu quả với Dữ liệu lớn .

Các Ứng dụng Thực tế

Tính linh hoạt của Học sâu đã khiến nó được áp dụng trong nhiều ngành công nghiệp.

  1. Xe tự hành : Xe tự lái dựa vào DL để nhận thức theo thời gian thực. Các mô hình như Ultralytics YOLO11 được sử dụng để phát hiện vật thể , từ đó xác định người đi bộ, phương tiện và tín hiệu giao thông ngay lập tức. Ứng dụng này hỗ trợ đưa ra các quyết định quan trọng cho việc điều hướng an toàn, một thành phần cốt lõi của AI trong ô tô .
  2. Phân tích Hình ảnh Y tế : Trong lĩnh vực chăm sóc sức khỏe, DL hỗ trợ bác sĩ bằng cách phân tích các hình ảnh chụp quét y tế với độ nhạy cao. Các thuật toán có thể hỗ trợ phát hiện khối u trong chụp MRI hoặc xác định bệnh võng mạc tiểu đường trong chụp quét mắt, thường ngang bằng hoặc vượt trội hơn hiệu suất của con người. Để biết thêm chi tiết, hãy xem cách DL chuyển đổi AI trong chăm sóc sức khỏe .

Thực hiện với Ultralytics

Việc triển khai mô hình Học sâu để suy luận rất đơn giản với các thư viện hiện đại. Dưới đây là một ví dụ về việc sử dụng một mô hình được đào tạo trước. YOLO11 mô hình để detect các đối tượng trong một hình ảnh.

from ultralytics import YOLO

# Load a pretrained YOLO11 model (a deep learning architecture)
model = YOLO("yolo11n.pt")

# Run inference on a source image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the detection results
results[0].show()

Công cụ và Hệ sinh thái

Việc phát triển các mô hình DL đòi hỏi phải có phần mềm và phần cứng mạnh mẽ.

  • Khung : Các thư viện nguồn mở phổ biến nhất là PyTorch , được phát triển bởi Meta và TensorFlow , được tạo bởi Google . Các nền tảng này cung cấp các khối xây dựng để thiết kế và đào tạo mạng lưới nơ-ron.
  • Phần cứng : Việc đào tạo mạng sâu liên quan đến các phép tính ma trận phức tạp, được tăng tốc bằng GPU . Phần cứng từ các nhà sản xuất như NVIDIA là tiêu chuẩn cho việc xử lý hiệu quả.
  • Nền tảng : Sắp ra mắt Ultralytics Nền tảng sẽ cung cấp một môi trường toàn diện để quản lý toàn bộ vòng đời DL, từ chú thích tập dữ liệu đến triển khai mô hình , hợp lý hóa quy trình làm việc cho các nhà phát triển và doanh nghiệp.

Để hiểu sâu hơn về lĩnh vực này, các nguồn tài liệu như tài liệu Deep Learning của MIThướng dẫn về AI của IBM sẽ là nguồn tài liệu tham khảo tuyệt vời.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay