Theo dõi các thí nghiệm ML: ghi lại các siêu tham số, tập dữ liệu, số liệu và hiện vật để đào tạo mô hình có thể tái tạo. Học cách tổ chức các lần chạy với Ultralytics YOLO11 .
Theo dõi thử nghiệm là quy trình ghi lại một cách có hệ thống tất cả dữ liệu, siêu dữ liệu và kết quả liên quan đến các lần chạy huấn luyện mô hình học máy. Hoạt động như một sổ tay thí nghiệm kỹ thuật số cho các nhà khoa học dữ liệu và kỹ sư AI, quy trình này đảm bảo mọi bước của giai đoạn nghiên cứu và phát triển đều được ghi chép, tái tạo và phân tích. Bằng cách thu thập các dữ liệu đầu vào như siêu tham số và phiên bản tập dữ liệu, cùng với các dữ liệu đầu ra như số liệu hiệu suất và hiện vật mô hình, theo dõi thử nghiệm biến bản chất thử nghiệm và sai sót thường hỗn loạn của quá trình huấn luyện mô hình thành một quy trình làm việc có cấu trúc và khoa học. Việc tổ chức này rất quan trọng đối với các nhóm muốn xây dựng các hệ thống trí tuệ nhân tạo (AI) mạnh mẽ một cách hiệu quả.
Để quản lý hiệu quả vòng đời của một dự án thị giác máy tính , một hệ thống theo dõi thử nghiệm thường ghi lại ba loại thông tin riêng biệt. Việc sắp xếp các thành phần này cho phép các nhà phát triển so sánh các lần lặp khác nhau và xác định cấu hình tối ưu cho trường hợp sử dụng cụ thể của họ.
Việc áp dụng nghiêm ngặt phương pháp theo dõi thử nghiệm là điều cần thiết trong các ngành công nghiệp đòi hỏi độ chính xác và an toàn cao. Nó cho phép các nhóm kỹ thuật xem lại dữ liệu lịch sử để hiểu lý do tại sao một mô hình lại hoạt động theo một cách nhất định.
Trong lĩnh vực chăm sóc sức khỏe, các nhà nghiên cứu sử dụng phân tích hình ảnh y tế để hỗ trợ bác sĩ chẩn đoán bệnh. Ví dụ, khi đào tạo một mô hình phát hiện khối u não , các kỹ sư có thể chạy hàng trăm thí nghiệm, thay đổi các kỹ thuật tăng cường dữ liệu và kiến trúc mô hình. Việc theo dõi thí nghiệm cho phép họ xác định tổ hợp các bước tiền xử lý cụ thể nào mang lại độ nhạy cao nhất, đảm bảo rằng AI được triển khai giảm thiểu kết quả âm tính giả trong các tình huống chẩn đoán quan trọng.
Việc phát triển xe tự hành đòi hỏi phải xử lý một lượng lớn dữ liệu cảm biến để detect Người đi bộ, biển báo và chướng ngại vật. Các nhóm nghiên cứu phát hiện vật thể cho xe tự lái phải tối ưu hóa cả độ chính xác và độ trễ suy luận . Bằng cách theo dõi các thử nghiệm, họ có thể phân tích sự đánh đổi giữa kích thước mô hình và tốc độ, đảm bảo hệ thống cuối cùng phản ứng theo thời gian thực mà không ảnh hưởng đến các tiêu chuẩn an toàn do các tổ chức như Cục Quản lý An toàn Giao thông Đường bộ Quốc gia (NHTSA) thiết lập.
Mặc dù theo dõi thử nghiệm là một phần cơ bản của MLOps (Hoạt động Học máy) , nó thường bị nhầm lẫn với các thuật ngữ tương tự khác. Việc hiểu rõ sự khác biệt này rất quan trọng để triển khai quy trình làm việc chính xác.
Các khuôn khổ AI hiện đại đơn giản hóa việc theo dõi thử nghiệm bằng cách tích hợp với các công cụ ghi nhật ký phổ biến. Khi sử dụng thư viện Ultralytics , việc theo dõi có thể được tổ chức hiệu quả bằng cách xác định tên dự án và tên lần chạy. Cấu trúc này tạo ra một hệ thống phân cấp thư mục phân tách các giả thuyết thử nghiệm khác nhau.
Ví dụ sau đây minh họa cách đào tạo mô hình YOLO11 trong khi đặt tên rõ ràng cho dự án và lần chạy thử nghiệm để đảm bảo các số liệu và trọng số được lưu theo cách có tổ chức.
from ultralytics import YOLO
# Load the latest YOLO11 nano model
model = YOLO("yolo11n.pt")
# Train the model, specifying 'project' and 'name' for organized tracking
# Results, logs, and weights will be saved to 'runs/detect/experiment_tracking_demo'
results = model.train(data="coco8.yaml", epochs=5, project="runs/detect", name="experiment_tracking_demo")
Để trực quan hóa và quản lý dữ liệu đã ghi, các nhà phát triển dựa vào phần mềm chuyên dụng. Các công cụ này thường có bảng điều khiển cho phép so sánh song song các đường cong đào tạo và bảng số liệu.
Bằng cách tận dụng các công cụ và phương pháp luận này, các chuyên gia AI có thể vượt ra ngoài sự phát triển dựa trên trực giác, đảm bảo rằng mọi cải tiến đối với mạng nơ-ron của họ đều dựa trên dữ liệu, được ghi chép lại và có thể tái tạo.