Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Trọng số Mô hình

Khám phá tầm quan trọng của trọng số mô hình trong học máy, vai trò của chúng trong dự đoán và cách Ultralytics YOLO đơn giản hóa việc sử dụng chúng cho các nhiệm vụ AI.

Trọng số mô hình là các tham số cơ bản, có thể học được trong mạng nơ-ron, giúp chuyển đổi dữ liệu đầu vào thành các dự đoán có ý nghĩa. Hoạt động tương tự như cường độ của các khớp thần kinh trong não bộ sinh học, các giá trị số này xác định mức độ ảnh hưởng của một đặc điểm đầu vào cụ thể đến đầu ra của mạng. Khi một mô hình xử lý thông tin, chẳng hạn như hình ảnh hoặc văn bản, dữ liệu đầu vào được nhân với các trọng số này theo từng lớp. Sự kết hợp cuối cùng của các tín hiệu có trọng số này sẽ tạo ra kết quả, có thể là phân loại hình ảnh , dịch ngôn ngữ hoặc nhận dạng đối tượng trong luồng video.

Cách học trọng số mô hình

Trọng số không tĩnh; chúng là các giá trị động được tinh chỉnh trong quá trình huấn luyện . Ban đầu, một mô hình bắt đầu với các trọng số ngẫu nhiên, nghĩa là các dự đoán của nó về cơ bản là những phỏng đoán. Thông qua một chu trình được gọi là học có giám sát , mô hình so sánh các dự đoán của mình với một tập dữ liệu huấn luyện được gắn nhãn. Một công thức toán học gọi là hàm mất mát sẽ tính toán sai số - sự khác biệt giữa dự đoán và giá trị thực tế.

Để giảm thiểu lỗi này, mô hình sử dụng thuật toán tối ưu hóa , chẳng hạn như Stochastic Gradient Descent ( SGD ) hoặc Adam Thuật toán này tính toán gradient thông qua lan truyền ngược để xác định chính xác cách điều chỉnh từng trọng số - tăng hoặc giảm - nhằm giảm sai số trong lần lặp tiếp theo. Chu trình này lặp lại qua nhiều kỷ nguyên cho đến khi các trọng số hội tụ đến trạng thái tối ưu, tại đó mô hình đạt được độ chính xác cao.

Phân biệt các khái niệm chính

Để hiểu đầy đủ về trọng số mô hình, cần phân biệt chúng với các thuật ngữ liên quan trong học máy :

  • Độ lệch : Trong khi trọng số kiểm soát độ dốc hoặc quy mô của phép biến đổi, độ lệch cho phép dịch chuyển hàm kích hoạt sang trái hoặc phải. Cùng nhau, weights and biases cho phép mạng phù hợp với các mẫu dữ liệu phức tạp, phi tuyến tính.
  • Siêu tham số : Trọng số được học từ dữ liệu, trong khi siêu tham số là các thiết lập cấu trúc được cấu hình trước khi bắt đầu huấn luyện. Ví dụ bao gồm tốc độ học , kích thước lô và số lớp trong mạng.
  • Kiến trúc Mô hình : Kiến trúc đóng vai trò như bản thiết kế hoặc bộ khung của mạng (ví dụ: ResNet hoặc Transformer), xác định cách các nơ-ron kết nối với nhau. Trọng số là các giá trị cụ thể được lưu trữ trong cấu trúc đó.

Sức mạnh của việc học chuyển giao

Việc huấn luyện một mô hình từ đầu đòi hỏi bộ dữ liệu khổng lồ và tài nguyên tính toán đáng kể. Để giải quyết vấn đề này, các nhà phát triển thường sử dụng các trọng số được huấn luyện trước . Điều này bao gồm việc sử dụng một mô hình như YOLO11 , vốn đã học được các biểu diễn đặc trưng phong phú từ một bộ dữ liệu lớn như COCO , và áp dụng nó vào một bài toán mới.

Kỹ thuật này, được gọi là học chuyển giao (transfer learning ), cho phép người dùng tinh chỉnh mô hình trên một tập dữ liệu tùy chỉnh nhỏ hơn. Các trọng số được đào tạo trước cung cấp một "khởi đầu thuận lợi", cho phép mô hình nhận dạng các cạnh, kết cấu và hình dạng ngay lập tức, giúp đào tạo nhanh hơn và hiệu suất tốt hơn.

Sau đây là Python đoạn trích minh họa cách tải các trọng số được đào tạo trước cụ thể vào YOLO11 mô hình phát hiện vật thể ngay lập tức.

from ultralytics import YOLO

# Load the YOLO11 model with pre-trained weights (learned on COCO)
model = YOLO("yolo11n.pt")

# Run inference on an image using the loaded weights
# The weights determine the model's ability to recognize the bus
results = model("https://ultralytics.com/images/bus.jpg")

# Display the resulting bounding boxes and classes
results[0].show()

Các Ứng dụng Thực tế

Tính hữu ích thực tế của trọng số mô hình được tối ưu hóa thể hiện rõ trong nhiều ngành công nghiệp nơi các giải pháp AI được triển khai:

  • AI trong Chăm sóc Sức khỏe : Các bác sĩ X quang sử dụng các mô hình với trọng số được tinh chỉnh dựa trên hình ảnh y tế để hỗ trợ chẩn đoán. Ví dụ, một mô hình có thể xác định khối u não trong ảnh chụp MRI. Các trọng số trong mô hình cụ thể này đã học cách phân biệt những khác biệt tinh tế về kết cấu giữa mô khỏe mạnh và các bất thường, cung cấp ý kiến thứ hai giúp tăng độ tin cậy chẩn đoán.
  • Hệ thống Bán lẻ Thông minh : Các nhà bán lẻ sử dụng công nghệ thị giác máy tính để tự động hóa quy trình thanh toán. Một hệ thống camera được trang bị mô hình cân đo được huấn luyện trên bao bì sản phẩm có thể nhận dạng ngay lập tức các mặt hàng được đặt trên quầy. Ứng dụng này dựa trên khả năng của mô hình cân đo để ánh xạ các thông tin đầu vào trực quan - chẳng hạn như màu sắc và logo của hộp ngũ cốc - với đúng SKU sản phẩm để quản lý hàng tồn kho .

Tương lai của trọng lượng mô hình

Khi nghiên cứu tiến triển, cách thức xử lý trọng số tiếp tục phát triển. Các kỹ thuật như lượng tử hóa mô hình làm giảm độ chính xác của trọng số (ví dụ: từ số thực 32 bit xuống số nguyên 8 bit) để giảm kích thước tệp và tăng tốc độ suy luận trên các thiết bị biên mà không làm giảm đáng kể độ chính xác. Hơn nữa, các kiến trúc sắp ra mắt như YOLO26 hướng đến việc tạo ra các mô hình hiệu quả hơn ngay từ đầu, đảm bảo rằng các trọng số đã học mang lại hiệu suất cao nhất có thể trên mỗi tham số.

Việc quản lý hiệu quả các tệp này cũng rất quan trọng. Các nền tảng như Nền tảng Ultralytics cho phép các nhóm quản lý phiên bản, track và triển khai trọng số mô hình của họ một cách liền mạch, đảm bảo rằng phiên bản có hiệu suất tốt nhất của một mô hình luôn là phiên bản đang được sản xuất.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay