Khám phá tầm quan trọng của trọng số mô hình trong học máy, vai trò của chúng trong dự đoán và cách Ultralytics YOLO đơn giản hóa việc sử dụng chúng cho các nhiệm vụ AI.
Trọng số mô hình là các tham số cơ bản, có thể học được trong mạng nơ-ron, giúp chuyển đổi dữ liệu đầu vào thành các dự đoán có ý nghĩa. Hoạt động tương tự như cường độ của các khớp thần kinh trong não bộ sinh học, các giá trị số này xác định mức độ ảnh hưởng của một đặc điểm đầu vào cụ thể đến đầu ra của mạng. Khi một mô hình xử lý thông tin, chẳng hạn như hình ảnh hoặc văn bản, dữ liệu đầu vào được nhân với các trọng số này theo từng lớp. Sự kết hợp cuối cùng của các tín hiệu có trọng số này sẽ tạo ra kết quả, có thể là phân loại hình ảnh , dịch ngôn ngữ hoặc nhận dạng đối tượng trong luồng video.
Trọng số không tĩnh; chúng là các giá trị động được tinh chỉnh trong quá trình huấn luyện . Ban đầu, một mô hình bắt đầu với các trọng số ngẫu nhiên, nghĩa là các dự đoán của nó về cơ bản là những phỏng đoán. Thông qua một chu trình được gọi là học có giám sát , mô hình so sánh các dự đoán của mình với một tập dữ liệu huấn luyện được gắn nhãn. Một công thức toán học gọi là hàm mất mát sẽ tính toán sai số - sự khác biệt giữa dự đoán và giá trị thực tế.
Để giảm thiểu lỗi này, mô hình sử dụng thuật toán tối ưu hóa , chẳng hạn như Stochastic Gradient Descent ( SGD ) hoặc Adam Thuật toán này tính toán gradient thông qua lan truyền ngược để xác định chính xác cách điều chỉnh từng trọng số - tăng hoặc giảm - nhằm giảm sai số trong lần lặp tiếp theo. Chu trình này lặp lại qua nhiều kỷ nguyên cho đến khi các trọng số hội tụ đến trạng thái tối ưu, tại đó mô hình đạt được độ chính xác cao.
Để hiểu đầy đủ về trọng số mô hình, cần phân biệt chúng với các thuật ngữ liên quan trong học máy :
Việc huấn luyện một mô hình từ đầu đòi hỏi bộ dữ liệu khổng lồ và tài nguyên tính toán đáng kể. Để giải quyết vấn đề này, các nhà phát triển thường sử dụng các trọng số được huấn luyện trước . Điều này bao gồm việc sử dụng một mô hình như YOLO11 , vốn đã học được các biểu diễn đặc trưng phong phú từ một bộ dữ liệu lớn như COCO , và áp dụng nó vào một bài toán mới.
Kỹ thuật này, được gọi là học chuyển giao (transfer learning ), cho phép người dùng tinh chỉnh mô hình trên một tập dữ liệu tùy chỉnh nhỏ hơn. Các trọng số được đào tạo trước cung cấp một "khởi đầu thuận lợi", cho phép mô hình nhận dạng các cạnh, kết cấu và hình dạng ngay lập tức, giúp đào tạo nhanh hơn và hiệu suất tốt hơn.
Sau đây là Python đoạn trích minh họa cách tải các trọng số được đào tạo trước cụ thể vào YOLO11 mô hình phát hiện vật thể ngay lập tức.
from ultralytics import YOLO
# Load the YOLO11 model with pre-trained weights (learned on COCO)
model = YOLO("yolo11n.pt")
# Run inference on an image using the loaded weights
# The weights determine the model's ability to recognize the bus
results = model("https://ultralytics.com/images/bus.jpg")
# Display the resulting bounding boxes and classes
results[0].show()
Tính hữu ích thực tế của trọng số mô hình được tối ưu hóa thể hiện rõ trong nhiều ngành công nghiệp nơi các giải pháp AI được triển khai:
Khi nghiên cứu tiến triển, cách thức xử lý trọng số tiếp tục phát triển. Các kỹ thuật như lượng tử hóa mô hình làm giảm độ chính xác của trọng số (ví dụ: từ số thực 32 bit xuống số nguyên 8 bit) để giảm kích thước tệp và tăng tốc độ suy luận trên các thiết bị biên mà không làm giảm đáng kể độ chính xác. Hơn nữa, các kiến trúc sắp ra mắt như YOLO26 hướng đến việc tạo ra các mô hình hiệu quả hơn ngay từ đầu, đảm bảo rằng các trọng số đã học mang lại hiệu suất cao nhất có thể trên mỗi tham số.
Việc quản lý hiệu quả các tệp này cũng rất quan trọng. Các nền tảng như Nền tảng Ultralytics cho phép các nhóm quản lý phiên bản, track và triển khai trọng số mô hình của họ một cách liền mạch, đảm bảo rằng phiên bản có hiệu suất tốt nhất của một mô hình luôn là phiên bản đang được sản xuất.