Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024
Bảng chú giải thuật ngữ

Tìm kiếm kiến trúc mạng nơ-ron (Neural Architecture Search - NAS)

Khám phá cách Tìm kiếm kiến trúc mạng nơ-ron (NAS) tự động hóa thiết kế mạng nơ-ron để tối ưu hóa hiệu suất trong phát hiện đối tượng, AI và hơn thế nữa.

Tìm kiếm Kiến trúc Mạng nơ-ron (NAS) là một kỹ thuật tự động hóa việc thiết kế mạng nơ-ron nhân tạo (NN). Theo truyền thống, việc thiết kế một kiến trúc mô hình hiệu suất cao đòi hỏi chuyên môn đáng kể và thử nghiệm nhiều lần. NAS tự động hóa quy trình phức tạp này bằng cách sử dụng các thuật toán để khám phá một loạt các thiết kế mạng có thể và xác định kiến trúc tối ưu nhất cho một nhiệm vụ và bộ dữ liệu nhất định. Sự tự động hóa này đẩy nhanh sự phát triển của các mô hình học sâu hiệu quả và mạnh mẽ, giúp AI tiên tiến trở nên dễ tiếp cận hơn.

Tìm kiếm kiến trúc thần kinh hoạt động như thế nào

Quy trình NAS có thể được chia thành ba thành phần chính:

  1. Không gian Tìm kiếm: Điều này xác định tập hợp tất cả các kiến trúc có thể được thiết kế. Một không gian tìm kiếm có thể đơn giản, chỉ định các lựa chọn cho các loại lớp (ví dụ: tích chập, gộp) và các kết nối của chúng, hoặc nó có thể rất phức tạp, cho phép các họa tiết kiến trúc mới lạ. Một không gian tìm kiếm được xác định rõ ràng là rất quan trọng để cân bằng tính linh hoạt và tính khả thi về mặt tính toán.
  2. Chiến lược Tìm kiếm: Đây là thuật toán được sử dụng để khám phá không gian tìm kiếm. Các phương pháp ban đầu sử dụng tìm kiếm ngẫu nhiên, nhưng các chiến lược phức tạp hơn đã xuất hiện kể từ đó. Các phương pháp phổ biến bao gồm học tăng cường, trong đó một tác nhân học cách chọn các kiến trúc tối ưu và thuật toán tiến hóa, bắt chước chọn lọc tự nhiên để "phát triển" các kiến trúc tốt hơn qua các thế hệ. Các phương pháp dựa trên gradient, như trong Tìm kiếm Kiến trúc Khả vi (DARTS), cũng đã trở nên phổ biến vì hiệu quả của chúng.
  3. Chiến lược ước tính hiệu suất: Thành phần này đánh giá chất lượng của từng kiến trúc được đề xuất. Phương pháp đơn giản nhất là huấn luyện mô hình đầy đủ trên một bộ dữ liệu và đo lường hiệu suất của nó, nhưng điều này cực kỳ tốn thời gian. Để tăng tốc quá trình, các nhà nghiên cứu đã phát triển các kỹ thuật hiệu quả hơn như sử dụng bộ dữ liệu nhỏ hơn, huấn luyện trong ít epochs hơn hoặc sử dụng chia sẻ trọng số để tránh huấn luyện từng kiến trúc từ đầu.

Các ứng dụng và ví dụ

NAS đã được chứng minh là rất hiệu quả trong việc tạo ra các mô hình hiện đại cho các tác vụ khác nhau, thường vượt qua các kiến trúc do con người thiết kế về hiệu suất và hiệu quả.

  • Thị giác máy tính (Computer Vision): NAS được sử dụng rộng rãi để thiết kế các kiến trúc hiệu quả cho nhận diện đối tượng (object detection)phân loại ảnh (image classification). Ví dụ, họ mô hình EfficientNet được phát triển bằng NAS để cân bằng một cách có hệ thống độ sâu, chiều rộng và độ phân giải của mạng. Tương tự, các mô hình như DAMO-YOLO tận dụng backbone được tạo bằng NAS để đạt được sự cân bằng tốt giữa tốc độ và độ chính xác cho việc nhận diện đối tượng.
  • Phân tích ảnh y tế: Trong lĩnh vực chăm sóc sức khỏe, NAS có thể tạo ra các mô hình chuyên dụng cho các tác vụ như phát hiện khối u trong ảnh chụp hoặc phân đoạn cấu trúc tế bào. NAS có thể tối ưu hóa kiến trúc để chạy hiệu quả trên phần cứng chuyên dụng được tìm thấy trong các thiết bị y tế, dẫn đến chẩn đoán nhanh hơn và chính xác hơn. Điều này có tiềm năng đáng kể để cải thiện AI trong chăm sóc sức khỏe.

NAS và các khái niệm liên quan

NAS là một thành phần cụ thể trong lĩnh vực rộng lớn hơn của Học Máy Tự Động (AutoML). Trong khi NAS chỉ tập trung vào việc tìm kiếm kiến trúc mạng nơ-ron tốt nhất, AutoML hướng đến tự động hóa toàn bộ quy trình ML, bao gồm các bước như tiền xử lý dữ liệu, thiết kế đặc trưng (feature engineering), lựa chọn mô hình và điều chỉnh siêu tham số.

Điều quan trọng là phải phân biệt NAS với việc điều chỉnh siêu tham số: điều chỉnh siêu tham số tối ưu hóa các cài đặt cấu hình (như tốc độ học hoặc kích thước lô) cho một kiến trúc mô hình đã cho, cố định, trong khi NAS tìm kiếm chính kiến trúc đó. Cả hai kỹ thuật thường được sử dụng cùng nhau để đạt được hiệu suất mô hình tối ưu. Các công cụ như Optuna hoặc Ray Tune, tích hợp với các mô hình Ultralytics YOLO, rất phổ biến để tối ưu hóa siêu tham số. Hiểu rõ những điểm khác biệt này giúp áp dụng các kỹ thuật tự động hóa phù hợp để xây dựng các hệ thống AI hiệu quả. Bạn có thể tìm hiểu thêm về điều chỉnh siêu tham số trong tài liệu Ultralytics.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay
Đã sao chép liên kết vào clipboard