Tìm hiểu cách xác định và giải quyết hiện tượng thiếu khớp (underfitting) trong học máy. Khám phá các nguyên nhân, chỉ báo và cách tối ưu hóa. Ultralytics Mô hình YOLO26 cho độ chính xác tốt hơn.
Hiện tượng thiếu khớp (underfitting) xảy ra khi mô hình học máy quá đơn giản hoặc thiếu khả năng nắm bắt các xu hướng và mô hình tiềm ẩn trong dữ liệu huấn luyện . Về mặt khái niệm, nó tương tự như việc cố gắng khớp một đường thẳng qua các điểm dữ liệu tạo thành một đường cong rõ ràng; mô hình không nắm bắt được sự phức tạp của mối quan hệ giữa đầu vào và đầu ra. Bởi vì mô hình không học được dữ liệu một cách hiệu quả, nó thể hiện hiệu suất kém không chỉ trên tập dữ liệu huấn luyện mà còn trên dữ liệu xác thực chưa được thấy, dẫn đến độ chính xác dự đoán thấp. Hiện tượng này thường là kết quả của sự thiên vị cao trong AI , nơi thuật toán đưa ra các giả định quá đơn giản về hàm mục tiêu.
Có nhiều yếu tố có thể dẫn đến mô hình chưa phù hợp. Nguyên nhân phổ biến nhất là sử dụng kiến trúc mô hình không đủ phức tạp cho nhiệm vụ đặt ra, chẳng hạn như áp dụng hồi quy tuyến tính cho dữ liệu phi tuyến tính. Thời gian huấn luyện không đủ, khi mô hình không được cung cấp đủ số epoch để hội tụ, cũng ngăn cản quá trình học tập hiệu quả. Hơn nữa, việc điều chỉnh quá mức — một kỹ thuật thường được sử dụng để ngăn chặn vấn đề ngược lại — có thể hạn chế mô hình quá mức, ngăn cản nó nắm bắt các đặc điểm quan trọng.
Các kỹ sư có thể xác định hiện tượng underfitting bằng cách theo dõi các hàm mất mát trong quá trình huấn luyện. Nếu cả lỗi huấn luyện và lỗi kiểm định đều cao và không giảm đáng kể, mô hình có khả năng bị underfitting. Trái ngược với kỹ thuật tạo đặc trưng hiệu quả, giúp mô hình hiểu dữ liệu, việc cung cấp quá ít đặc trưng cũng có thể khiến mô hình thiếu thông tin cần thiết.
Điều quan trọng là phải phân biệt giữa hiện tượng thiếu khớp (underfitting) và hiện tượng quá khớp (overfitting ). Hai khái niệm này đại diện cho hai thái cực đối lập của sự đánh đổi giữa độ lệch và phương sai .
Việc tìm ra "điểm cân bằng" giữa hai thái cực này là mục tiêu chính của tối ưu hóa mô hình .
Hiểu rõ về hiện tượng "underfitting" (hiện tượng khớp dữ liệu không đầy đủ) là điều vô cùng quan trọng để phát triển các hệ thống AI đáng tin cậy trong nhiều ngành công nghiệp khác nhau.
TRONG tầm nhìn máy tínhHiện tượng thiếu khớp (underfitting) thường xảy ra khi sử dụng một biến thể mô hình quá nhỏ so với độ khó của nhiệm vụ (ví dụ: phát hiện các vật thể nhỏ trong ảnh chụp từ máy bay không người lái độ phân giải cao). Tiếp theo là... Python Ví dụ này minh họa cách chuyển đổi từ mô hình nhỏ hơn sang mô hình lớn hơn, có khả năng hơn bằng cách sử dụng... ultralytics thư viện để giải quyết vấn đề thiếu khớp dữ liệu tiềm ẩn.
from ultralytics import YOLO
# If 'yolo26n.pt' (Nano) is underfitting and yielding low accuracy,
# upgrade to a model with higher capacity like 'yolo26l.pt' (Large).
model = YOLO("yolo26l.pt")
# Train the larger model.
# Increasing epochs also helps the model converge if it was previously underfitting.
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
Bằng cách chuyển sang mô hình Ultralytics YOLO26 lớn hơn và đảm bảo thời gian huấn luyện đầy đủ, hệ thống sẽ có được các tham số cần thiết để học các mẫu phức tạp, từ đó giảm thiểu hiệu quả hiện tượng thiếu khớp (underfitting). Để xác minh mô hình của bạn không còn bị thiếu khớp, hãy luôn đánh giá nó dựa trên một tập dữ liệu kiểm thử mạnh mẽ. Để quản lý tập dữ liệu và theo dõi các thử nghiệm nhằm phát hiện sớm hiện tượng thiếu khớp, Nền tảng Ultralytics cung cấp các công cụ toàn diện để trực quan hóa và phân tích.