Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Thuật toán tối ưu hóa

Khám phá cách các thuật toán tối ưu hóa như... SGD Và AdamW Thúc đẩy quá trình huấn luyện ML. Học cách giảm thiểu tổn thất và cải thiện. Ultralytics Hiệu năng của YOLO26 cho các ứng dụng trí tuệ nhân tạo.

Thuật toán tối ưu hóa đóng vai trò là công cụ tính toán cốt lõi thúc đẩy quá trình huấn luyện các mô hình học máy (ML)học sâu (DL) . Trách nhiệm chính của nó là điều chỉnh lặp đi lặp lại các trọng số và độ lệch nội bộ của mô hình để giảm thiểu sai số giữa kết quả dự đoán và mục tiêu thực tế. Bạn có thể hình dung quá trình này như một người leo núi đang cố gắng tìm đường xuống một ngọn núi đầy sương mù để đến điểm thấp nhất trong thung lũng. Thuật toán tối ưu hóa đóng vai trò là người dẫn đường, xác định hướng đi và độ dài bước chân mà người leo núi nên thực hiện để đến được đáy, tương ứng với trạng thái mà hàm mất mát được giảm thiểu và độ chính xác dự đoán của mô hình được tối đa hóa.

Cách thức hoạt động của các thuật toán tối ưu hóa (Optimization Algorithms)

Quá trình huấn luyện mạng nơ-ron bao gồm một chu kỳ lặp đi lặp lại gồm dự đoán, tính toán lỗi và cập nhật tham số. Thuật toán tối ưu hóa kiểm soát giai đoạn "cập nhật" của vòng lặp này. Sau khi xử lý một tập dữ liệu huấn luyện , hệ thống sẽ tính toán độ dốc—một vectơ chỉ hướng tăng lỗi mạnh nhất—sử dụng phương pháp gọi là lan truyền ngược .

Sau đó, trình tối ưu hóa sẽ cập nhật các tham số của mô hình theo hướng ngược lại với độ dốc để giảm lỗi. Độ lớn của bản cập nhật này được điều chỉnh bởi một siêu tham số quan trọng được gọi là tốc độ học . Nếu bước nhảy quá lớn, mô hình có thể vượt quá điểm cực tiểu toàn cục ; nếu quá nhỏ, quá trình huấn luyện có thể trở nên chậm chạp hoặc bị kẹt ở điểm cực tiểu cục bộ . Các tài liệu nâng cao như ghi chú tối ưu hóa của Stanford CS231n cung cấp những hiểu biết kỹ thuật sâu sắc hơn về các động lực này.

Các Loại Thuật Toán Tối Ưu Hóa Phổ Biến

Các vấn đề khác nhau đòi hỏi các chiến lược khác nhau. Mặc dù có nhiều biến thể, nhưng một vài thuật toán chính chi phối sự phát triển trí tuệ nhân tạo hiện đại:

  • Thuật toán Gradient Descent ngẫu nhiên ( SGD ) : Một phương pháp kinh điển cập nhật các tham số bằng cách sử dụng một ví dụ duy nhất hoặc một nhỏ dữ liệu thay vì toàn bộ tập dữ liệu. Phương pháp này hiệu quả về mặt tính toán và được sử dụng rộng rãi trong các thư viện như Scikit-learn .
  • Adam Optimizer : Viết tắt của Adaptive Moment Estimation (Ước lượng mômen thích ứng). Adam Phương pháp này điều chỉnh tốc độ học cho từng tham số riêng lẻ. Nó được mô tả chi tiết trong bài nghiên cứu kinh điển về Adam của Kingma và Ba và thường là lựa chọn mặc định cho việc huấn luyện đa năng do tốc độ và khả năng hội tụ của nó.
  • AdamW : Một biến thể của Adam Phương pháp này tách biệt việc giảm trọng số khỏi việc cập nhật độ dốc, dẫn đến khả năng khái quát hóa tốt hơn. Đây thường là thuật toán tối ưu hóa được ưa chuộng để huấn luyện các kiến trúc hiện đại như Transformer và các mô hình hiệu năng cao Ultralytics YOLO26 .

Các Ứng dụng Thực tế

Các thuật toán tối ưu hóa hoạt động âm thầm phía sau hậu trường của hầu hết mọi giải pháp AI thành công, chuyển đổi dữ liệu thành thông tin hữu ích có thể hành động được.

  1. Xe tự lái : Trong công nghệ xe tự lái, hệ thống phát hiện vật thể phải nhận diện ngay lập tức người đi bộ, đèn giao thông và các phương tiện khác. Trong quá trình huấn luyện các hệ thống này cho Trí tuệ nhân tạo trong ngành ô tô , thuật toán tối ưu hóa sẽ xử lý hàng triệu hình ảnh đường phố, tinh chỉnh mạng lưới để giảm thiểu lỗi phát hiện. Điều này đảm bảo xe dừng lại một cách đáng tin cậy khi nhìn thấy người, ngăn ngừa tai nạn.
  2. Phân tích hình ảnh y tế : Đối với các ứng dụng AI trong chăm sóc sức khỏe , chẳng hạn như xác định khối u trong ảnh chụp MRI, độ chính xác là điều không thể thiếu. Các thuật toán tối ưu hóa hướng dẫn quá trình huấn luyện Mạng nơ-ron tích chập (CNN) để phân biệt mô ác tính với mô khỏe mạnh với độ nhạy cao, giảm nguy cơ âm tính giả trong các chẩn đoán quan trọng.

Phân biệt các khái niệm liên quan

Để hiểu rõ quy trình làm việc, điều quan trọng là phải phân biệt thuật toán tối ưu hóa với các thành phần khác của quá trình học tập.

  • Thuật toán tối ưu hóa so với hàm mất mát : Hàm mất mát đóng vai trò như "bảng điểm", tính toán một giá trị số (chẳng hạn như sai số bình phương trung bình ) thể hiện mức độ sai lệch của các dự đoán của mô hình. Thuật toán tối ưu hóa là "chiến lược gia" sử dụng điểm số này để điều chỉnh trọng số và cải thiện hiệu suất trong vòng tiếp theo.
  • Thuật toán tối ưu hóa so với điều chỉnh siêu tham số : Thuật toán tối ưu hóa học các tham số nội bộ (trọng số) trong các vòng lặp huấn luyện. Điều chỉnh siêu tham số liên quan đến việc lựa chọn các thiết lập bên ngoài tốt nhất—chẳng hạn như lựa chọn thuật toán tối ưu hóa, kích thước lô hoặc tốc độ học ban đầu— trước khi quá trình huấn luyện bắt đầu. Các công cụ tự động như Ray Tune thường được sử dụng để tìm ra sự kết hợp tối ưu của các thiết lập bên ngoài này.

Triển khai tối ưu hóa trong Python

Trong các khung phần mềm hiện đại, việc lựa chọn thuật toán tối ưu hóa thường được thực hiện thông qua một tham số duy nhất. Ví dụ sau đây minh họa cách huấn luyện một thuật toán. YOLO26 mô hình sử dụng AdamW trình tối ưu hóa bên trong ultralytics gói phần mềm. Người dùng cũng có thể tận dụng Ultralytics Nền tảng để áp dụng phương pháp không cần lập trình để quản lý các buổi đào tạo này.

from ultralytics import YOLO

# Load the latest YOLO26 model (recommended for new projects)
model = YOLO("yolo26n.pt")

# Train the model using the 'AdamW' optimization algorithm
# The optimizer iteratively updates weights to minimize loss on the dataset
results = model.train(data="coco8.yaml", epochs=5, optimizer="AdamW")

Đối với những ai quan tâm đến cơ chế hoạt động ở cấp độ thấp hơn, các framework như PyTorch OptimizersTensorFlow Keras Optimizers cung cấp tài liệu hướng dẫn chi tiết về cách triển khai và tùy chỉnh các thuật toán này cho các kiến trúc nghiên cứu riêng biệt.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay