Thuật ngữ

Trọng lượng mô hình

Khám phá tầm quan trọng của trọng số mô hình trong học máy, vai trò của chúng trong dự đoán và cách Ultralytics YOLO đơn giản hóa việc sử dụng chúng cho các nhiệm vụ AI.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Trọng số mô hình là các tham số cốt lõi mà mô hình học máy (ML) học được trong quá trình đào tạo của nó. Các giá trị số này biểu thị kiến thức thu được từ dữ liệu đào tạo và là nền tảng cho cách mô hình đưa ra dự đoán hoặc quyết định về dữ liệu mới, chưa từng thấy. Về cơ bản, trọng số xác định cường độ và tầm quan trọng của các kết nối trong mô hình, chẳng hạn như giữa các nơ-ron trong mạng nơ-ron (NN) . Chúng là các 'nút' có thể điều chỉnh để nắm bắt các mẫu mà mô hình học được.

Hiểu trọng số mô hình

Hãy tưởng tượng một cỗ máy phức tạp với nhiều núm điều chỉnh; trọng số mô hình hoạt động giống như những núm này. Trong quá trình đào tạo mô hình , mô hình được hiển thị các ví dụ từ một tập dữ liệu và đưa ra các dự đoán ban đầu. Sự khác biệt giữa các dự đoán này và các câu trả lời đúng thực tế (sự thật cơ bản) được đo bằng hàm mất mát . Một thuật toán tối ưu hóa , chẳng hạn như Stochastic Gradient Descent (SGD) hoặc Adam , sau đó điều chỉnh một cách có hệ thống các trọng số này bằng các kỹ thuật như truyền ngược để giảm thiểu tổn thất này. Quá trình này được lặp lại qua nhiều lần lặp lại hoặc kỷ nguyên , dần dần tinh chỉnh các trọng số.

Ban đầu, trọng số thường được đặt thành các giá trị ngẫu nhiên nhỏ, nhưng thông qua quá trình đào tạo, chúng hội tụ thành các giá trị nắm bắt được các mẫu cơ bản trong dữ liệu. Điều quan trọng là phải phân biệt trọng số với siêu tham số , chẳng hạn như tốc độ học hoặc kích thước lô . Siêu tham số là các thiết lập cấu hình được đặt trước khi bắt đầu đào tạo và hướng dẫn chính quá trình học, trong khi trọng số là các tham số được học trong quá trình đào tạo. Độ lệch, một loại tham số được học khác thường được tìm thấy cùng với trọng số trong NN, biểu thị mức kích hoạt cơ sở của một nơ-ron, độc lập với các đầu vào của nó. Trong khi trọng số mở rộng ảnh hưởng của các đầu vào, độ lệch dịch chuyển đầu ra của hàm kích hoạt.

Tầm quan trọng của trọng số mô hình

Trọng số mô hình rất quan trọng vì chúng mã hóa trực tiếp các mẫu và mối quan hệ đã học được từ dữ liệu đào tạo. Trọng số được tối ưu hóa tốt cho phép mô hình đạt được khả năng khái quát hóa tốt, đưa ra dự đoán chính xác về dữ liệu mà nó chưa từng gặp trước đây. Chất lượng của trọng số ảnh hưởng trực tiếp đến các số liệu hiệu suất của mô hình, chẳng hạn như độ chính xác , độ chính xác , khả năng thu hồi và độ mạnh mẽ, thường được tóm tắt trong các số liệu như mAP . Trọng số được đào tạo kém, thường là kết quả của các vấn đề như dữ liệu không đủ, thời gian đào tạo không đủ hoặc quá khớp (khi mô hình học dữ liệu đào tạo quá tốt, bao gồm cả nhiễu), dẫn đến các dự đoán không đáng tin cậy trên dữ liệu mới.

Trong nhiều ứng dụng AI hiện đại, đặc biệt là trong thị giác máy tính (CV) , các mô hình thường được đào tạo trước trên các tập dữ liệu chung, lớn như ImageNet hoặc COCO . Các trọng số kết quả nắm bắt các tính năng trực quan rộng áp dụng cho nhiều tác vụ. Các trọng số được đào tạo trước này, chẳng hạn như các trọng số có sẵn cho các mô hình Ultralytics YOLO , sau đó có thể được sử dụng trực tiếp để suy luận hoặc làm điểm khởi đầu để tinh chỉnh một tác vụ cụ thể hoặc tập dữ liệu tùy chỉnh . Kỹ thuật này, được gọi là học chuyển giao , tăng tốc đáng kể quá trình đào tạo và thường dẫn đến hiệu suất tốt hơn, đặc biệt là khi dữ liệu tùy chỉnh bị hạn chế. Các nền tảng như Ultralytics HUB cho phép người dùng quản lý tập dữ liệu, đào tạo mô hình và xử lý các trọng số mô hình kết quả một cách hiệu quả.

Ứng dụng trong thế giới thực

Trọng số mô hình là động cơ đằng sau vô số ứng dụng AI:

  • Phát hiện đối tượng trong xe tự hành : Các mô hình như Ultralytics YOLOv8 sử dụng trọng số đã học để xác định người đi bộ, các phương tiện khác và biển báo giao thông theo thời gian thực, cho phép đưa ra quyết định về điều hướng và an toàn. Các trọng số mã hóa các đặc điểm trực quan cần thiết để phân biệt các đối tượng này trong các điều kiện khác nhau. Công nghệ của Waymo phụ thuộc rất nhiều vào các mô hình tinh vi như vậy.
  • Phân tích hình ảnh y tế để phát hiện bệnh : Trong chăm sóc sức khỏe, trọng số mô hình được đào tạo trên các tập dữ liệu như tập dữ liệu Khối u não cho phép các hệ thống AI phát hiện các bất thường như khối u hoặc tổn thương trong các lần quét (X-quang, CT, MRI) với độ chính xác cao, hỗ trợ các bác sĩ X quang trong chẩn đoán. Các tổ chức như Hiệp hội X quang Bắc Mỹ (RSNA) khám phá sâu rộng vai trò của AI.

Quản lý và theo dõi trọng lượng

Khi các mô hình trở nên phức tạp hơn, việc quản lý trọng số của chúng và các thí nghiệm tạo ra chúng trở nên quan trọng đối với khả năng tái tạo và cộng tác. Các công cụ như Weights & Biases (W&B) cung cấp một nền tảng dành riêng cho MLOps , cho phép các nhóm theo dõi các siêu tham số, số liệu, phiên bản mã và trọng số mô hình kết quả cho mỗi thí nghiệm. Điều quan trọng cần lưu ý là " Weights & Biases "nền tảng này khác biệt với các khái niệm "trọng số" và "độ lệch" như các tham số trong mạng nơ-ron; nền tảng này giúp quản lý quá trình tìm kiếm tối ưu weights and biases . Bạn có thể tìm hiểu thêm về việc tích hợp Ultralytics với W&B trong tài liệu . Quản lý hiệu quả là chìa khóa cho các tác vụ từ điều chỉnh siêu tham số đến triển khai mô hình bằng các khuôn khổ như PyTorch hoặc TensorFlow .

Đọc tất cả