Khám phá cách các thuật toán tối ưu hóa như... SGD Và AdamW Thúc đẩy quá trình huấn luyện ML. Học cách giảm thiểu tổn thất và cải thiện. Ultralytics Hiệu năng của YOLO26 cho các ứng dụng trí tuệ nhân tạo.
Thuật toán tối ưu hóa đóng vai trò là công cụ tính toán cốt lõi thúc đẩy quá trình huấn luyện các mô hình học máy (ML) và học sâu (DL) . Trách nhiệm chính của nó là điều chỉnh lặp đi lặp lại các trọng số và độ lệch nội bộ của mô hình để giảm thiểu sai số giữa kết quả dự đoán và mục tiêu thực tế. Bạn có thể hình dung quá trình này như một người leo núi đang cố gắng tìm đường xuống một ngọn núi đầy sương mù để đến điểm thấp nhất trong thung lũng. Thuật toán tối ưu hóa đóng vai trò là người dẫn đường, xác định hướng đi và độ dài bước chân mà người leo núi nên thực hiện để đến được đáy, tương ứng với trạng thái mà hàm mất mát được giảm thiểu và độ chính xác dự đoán của mô hình được tối đa hóa.
Quá trình huấn luyện mạng nơ-ron bao gồm một chu kỳ lặp đi lặp lại gồm dự đoán, tính toán lỗi và cập nhật tham số. Thuật toán tối ưu hóa kiểm soát giai đoạn "cập nhật" của vòng lặp này. Sau khi xử lý một tập dữ liệu huấn luyện , hệ thống sẽ tính toán độ dốc—một vectơ chỉ hướng tăng lỗi mạnh nhất—sử dụng phương pháp gọi là lan truyền ngược .
Sau đó, trình tối ưu hóa sẽ cập nhật các tham số của mô hình theo hướng ngược lại với độ dốc để giảm lỗi. Độ lớn của bản cập nhật này được điều chỉnh bởi một siêu tham số quan trọng được gọi là tốc độ học . Nếu bước nhảy quá lớn, mô hình có thể vượt quá điểm cực tiểu toàn cục ; nếu quá nhỏ, quá trình huấn luyện có thể trở nên chậm chạp hoặc bị kẹt ở điểm cực tiểu cục bộ . Các tài liệu nâng cao như ghi chú tối ưu hóa của Stanford CS231n cung cấp những hiểu biết kỹ thuật sâu sắc hơn về các động lực này.
Các vấn đề khác nhau đòi hỏi các chiến lược khác nhau. Mặc dù có nhiều biến thể, nhưng một vài thuật toán chính chi phối sự phát triển trí tuệ nhân tạo hiện đại:
Các thuật toán tối ưu hóa hoạt động âm thầm phía sau hậu trường của hầu hết mọi giải pháp AI thành công, chuyển đổi dữ liệu thành thông tin hữu ích có thể hành động được.
Để hiểu rõ quy trình làm việc, điều quan trọng là phải phân biệt thuật toán tối ưu hóa với các thành phần khác của quá trình học tập.
Trong các khung phần mềm hiện đại, việc lựa chọn thuật toán tối ưu hóa thường được thực hiện thông qua một tham số duy nhất. Ví dụ sau đây minh họa cách huấn luyện một thuật toán. YOLO26 mô hình sử dụng
AdamW trình tối ưu hóa bên trong ultralytics gói phần mềm. Người dùng cũng có thể tận dụng
Ultralytics Nền tảng để áp dụng phương pháp không cần lập trình để quản lý các buổi đào tạo này.
from ultralytics import YOLO
# Load the latest YOLO26 model (recommended for new projects)
model = YOLO("yolo26n.pt")
# Train the model using the 'AdamW' optimization algorithm
# The optimizer iteratively updates weights to minimize loss on the dataset
results = model.train(data="coco8.yaml", epochs=5, optimizer="AdamW")
Đối với những ai quan tâm đến cơ chế hoạt động ở cấp độ thấp hơn, các framework như PyTorch Optimizers và TensorFlow Keras Optimizers cung cấp tài liệu hướng dẫn chi tiết về cách triển khai và tùy chỉnh các thuật toán này cho các kiến trúc nghiên cứu riêng biệt.