Khám phá tầm quan trọng của trọng số mô hình trong học máy, vai trò của chúng trong dự đoán và cách Ultralytics YOLO đơn giản hóa việc sử dụng chúng cho các tác vụ AI.
Trọng số mô hình là các tham số số trong mạng nơ-ron được điều chỉnh trong quá trình huấn luyện . Các giá trị này về cơ bản thể hiện kiến thức đã học của một mô hình. Hãy coi chúng như các hệ số trong một phương trình rất phức tạp; bằng cách điều chỉnh các hệ số này, mô hình học cách ánh xạ dữ liệu đầu vào, chẳng hạn như hình ảnh, thành đầu ra mong muốn, chẳng hạn như hộp giới hạn xung quanh một vật thể. Chất lượng trọng số của mô hình quyết định trực tiếp hiệu suất của nó trong một tác vụ nhất định, chẳng hạn như phân loại hình ảnh hoặc phát hiện vật thể .
Trọng số mô hình không được thiết lập thủ công mà được "học" từ dữ liệu. Quá trình bắt đầu bằng việc khởi tạo các trọng số thành các số ngẫu nhiên nhỏ. Trong quá trình huấn luyện, mô hình đưa ra dự đoán dựa trên dữ liệu huấn luyện , và một hàm mất mát sẽ tính toán mức độ sai lệch của những dự đoán này. Tín hiệu lỗi này sau đó được sử dụng trong một quá trình gọi là lan truyền ngược để tính toán độ dốc của độ mất mát theo từng trọng số. Một thuật toán tối ưu hóa , chẳng hạn như Stochastic Gradient Descent (SGD) , sau đó điều chỉnh các trọng số theo hướng ngược lại với độ dốc để giảm thiểu lỗi. Chu kỳ này được lặp lại trong nhiều kỷ nguyên cho đến khi hiệu suất của mô hình trên một tập dữ liệu xác thực riêng biệt không còn được cải thiện, một dấu hiệu cho thấy nó đã học được các mẫu trong dữ liệu.
Việc huấn luyện một mô hình tiên tiến từ đầu đòi hỏi nguồn lực tính toán khổng lồ và bộ dữ liệu khổng lồ. Để khắc phục điều này, cộng đồng thị giác máy tính sử dụng rộng rãi các trọng số được huấn luyện trước . Điều này liên quan đến việc sử dụng một mô hình, chẳng hạn như mô hình Ultralytics YOLO , đã được huấn luyện trên một bộ dữ liệu lớn, đa năng như COCO . Các trọng số này đóng vai trò là điểm khởi đầu tuyệt vời cho một tác vụ mới, cụ thể thông qua một quy trình gọi là học chuyển giao . Bằng cách bắt đầu với các trọng số được huấn luyện trước, bạn có thể đạt được độ chính xác cao hơn với ít dữ liệu hơn và thời gian huấn luyện ngắn hơn thông qua một quy trình được gọi là tinh chỉnh .
Điều quan trọng là phải phân biệt trọng số mô hình với các thuật ngữ liên quan khác trong học máy :
Khi các mô hình trở nên phức tạp hơn, việc quản lý trọng số của chúng và các thí nghiệm tạo ra chúng trở nên rất quan trọng đối với khả năng tái tạo và cộng tác. Các công cụ như Weights & Biases (W&B) cung cấp một nền tảng dành riêng cho MLOps , cho phép các nhóm theo dõi siêu tham số, số liệu, phiên bản mã và trọng số mô hình kết quả cho mỗi thí nghiệm. Điều quan trọng cần lưu ý là nền tảng "Weights & Biases" khác với các khái niệm "trọng số" và "bias" dưới dạng tham số trong mạng nơ-ron; nền tảng này giúp quản lý quá trình tìm trọng số và độ lệch tối ưu. Bạn có thể tìm hiểu thêm về việc tích hợp Ultralytics với W&B trong tài liệu . Quản lý hiệu quả là chìa khóa cho các tác vụ từ tinh chỉnh siêu tham số đến triển khai mô hình bằng các nền tảng như PyTorch hoặc TensorFlow . Các nền tảng như Ultralytics HUB cũng cung cấp các giải pháp tích hợp để quản lý toàn bộ vòng đời mô hình.