Underfitting
Tìm hiểu cách xác định và giải quyết tình trạng underfitting trong machine learning. Khám phá các nguyên nhân, chỉ số và cách tối ưu hóa các mô hình Ultralytics YOLO26 để có độ chính xác tốt hơn.
Underfitting xảy ra khi một model machine learning quá đơn giản hoặc không đủ khả năng nắm bắt các xu hướng và mô hình ẩn bên trong training data. Về mặt khái niệm, nó tương tự như việc cố gắng khớp một đường thẳng qua các điểm dữ liệu tạo thành một đường cong rõ rệt; model không nắm bắt được sự phức tạp của mối quan hệ giữa đầu vào và đầu ra. Do model không học dữ liệu một cách hiệu quả, nó thể hiện hiệu suất kém không chỉ trên tập huấn luyện mà còn trên cả validation data chưa từng thấy, dẫn đến accuracy dự đoán thấp. Hiện tượng này thường là kết quả của bias in AI cao, nơi thuật toán đưa ra các giả định quá đơn giản về hàm mục tiêu.
Link to this sectionNguyên nhân và Chỉ số#
Một vài yếu tố có thể dẫn đến một model bị underfitting. Nguyên nhân phổ biến nhất là sử dụng kiến trúc model không đủ phức tạp cho tác vụ đang thực hiện, chẳng hạn như áp dụng linear regression cho dữ liệu phi tuyến tính. Thời gian huấn luyện không đủ, nơi model không được cung cấp đủ epochs để hội tụ, cũng ngăn cản việc học tập đầy đủ. Hơn nữa, việc regularization quá mức—một kỹ thuật thường được sử dụng để ngăn chặn vấn đề ngược lại—có thể hạn chế model quá mức, khiến nó không thể nắm bắt được các đặc trưng quan trọng.
Các kỹ sư có thể xác định underfitting bằng cách theo dõi loss functions trong quá trình huấn luyện. Nếu cả sai số huấn luyện và sai số xác thực vẫn cao và không giảm đáng kể, model có khả năng đang bị underfitting. Trái ngược với feature engineering hiệu quả, giúp các model hiểu dữ liệu, việc cung cấp quá ít đặc trưng cũng có thể khiến model thiếu thông tin cần thiết.
Link to this sectionUnderfitting so với Overfitting#
Việc phân biệt underfitting với đối trọng của nó, overfitting, là rất quan trọng. Hai khái niệm này đại diện cho các đầu đối diện của bias-variance tradeoff.
- Underfitting (High Bias): Model quá cứng nhắc. Nó hoạt động kém trên cả tập huấn luyện và test data vì nó chưa học được tín hiệu cơ bản.
- Overfitting (High Variance): Model quá linh hoạt. Nó ghi nhớ dữ liệu huấn luyện, bao gồm cả nhiễu, hoạt động cực kỳ tốt trong quá trình huấn luyện nhưng không thể generalize sang các ví dụ mới.
Tìm ra "điểm cân bằng" giữa hai thái cực này là mục tiêu chính của model optimization.
Link to this sectionCác ứng dụng trong thực tế#
Hiểu về underfitting là rất quan trọng để phát triển các hệ thống AI đáng tin cậy trên nhiều ngành công nghiệp khác nhau.
- Xe tự lái (Autonomous Driving): Trong bối cảnh autonomous vehicles, một model phát hiện đối tượng bị underfitting có thể không phân biệt được giữa người đi bộ và cột đèn trong môi trường đô thị phức tạp. Vì model thiếu các tham số để học các khác biệt trực quan tinh tế, nó gây nguy hiểm cho AI safety.
- Chẩn đoán y khoa (Medical Diagnostics): Khi áp dụng medical image analysis để phát hiện các bất thường như khối u, một model quá đơn giản có thể bỏ lỡ các khối u nhỏ hoặc không đều. Nếu neural network quá nông, nó không thể học được các cấu trúc phức tạp cần thiết cho sensitivity and specificity cao, dẫn đến chẩn đoán sai.
Link to this sectionGiải quyết Underfitting bằng Code#
Trong computer vision, underfitting thường xảy ra khi sử dụng biến thể model quá nhỏ so với độ khó của tác vụ (ví dụ: phát hiện các vật thể nhỏ trong hình ảnh drone có độ phân giải cao). Ví dụ Python sau đây minh họa cách chuyển từ model nhỏ hơn sang model lớn hơn, có khả năng tốt hơn bằng cách sử dụng thư viện ultralytics để giải quyết tình trạng underfitting tiềm ẩn.
from ultralytics import YOLO
# If 'yolo26n.pt' (Nano) is underfitting and yielding low accuracy,
# upgrade to a model with higher capacity like 'yolo26l.pt' (Large).
model = YOLO("yolo26l.pt")
# Train the larger model.
# Increasing epochs also helps the model converge if it was previously underfitting.
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)Bằng cách chuyển sang model Ultralytics YOLO26 lớn hơn và đảm bảo thời gian huấn luyện đầy đủ, hệ thống có được các tham số cần thiết để học các mô hình phức tạp, giúp giảm thiểu underfitting một cách hiệu quả. Để xác minh model của bạn không còn bị underfitting, hãy luôn đánh giá nó dựa trên một test dataset mạnh mẽ. Để quản lý tập dữ liệu và theo dõi các thí nghiệm nhằm phát hiện sớm underfitting, Ultralytics Platform cung cấp các công cụ toàn diện để trực quan hóa và phân tích.






