Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Underfitting

Tìm hiểu cách xác định và giải quyết hiện tượng thiếu khớp (underfitting) trong học máy. Khám phá các nguyên nhân, chỉ báo và cách tối ưu hóa. Ultralytics Mô hình YOLO26 cho độ chính xác tốt hơn.

Hiện tượng thiếu khớp (underfitting) xảy ra khi mô hình học máy quá đơn giản hoặc thiếu khả năng nắm bắt các xu hướng và mô hình tiềm ẩn trong dữ liệu huấn luyện . Về mặt khái niệm, nó tương tự như việc cố gắng khớp một đường thẳng qua các điểm dữ liệu tạo thành một đường cong rõ ràng; mô hình không nắm bắt được sự phức tạp của mối quan hệ giữa đầu vào và đầu ra. Bởi vì mô hình không học được dữ liệu một cách hiệu quả, nó thể hiện hiệu suất kém không chỉ trên tập dữ liệu huấn luyện mà còn trên dữ liệu xác thực chưa được thấy, dẫn đến độ chính xác dự đoán thấp. Hiện tượng này thường là kết quả của sự thiên vị cao trong AI , nơi thuật toán đưa ra các giả định quá đơn giản về hàm mục tiêu.

Nguyên nhân và dấu hiệu

Có nhiều yếu tố có thể dẫn đến mô hình chưa phù hợp. Nguyên nhân phổ biến nhất là sử dụng kiến ​​trúc mô hình không đủ phức tạp cho nhiệm vụ đặt ra, chẳng hạn như áp dụng hồi quy tuyến tính cho dữ liệu phi tuyến tính. Thời gian huấn luyện không đủ, khi mô hình không được cung cấp đủ số epoch để hội tụ, cũng ngăn cản quá trình học tập hiệu quả. Hơn nữa, việc điều chỉnh quá mức — một kỹ thuật thường được sử dụng để ngăn chặn vấn đề ngược lại — có thể hạn chế mô hình quá mức, ngăn cản nó nắm bắt các đặc điểm quan trọng.

Các kỹ sư có thể xác định hiện tượng underfitting bằng cách theo dõi các hàm mất mát trong quá trình huấn luyện. Nếu cả lỗi huấn luyện và lỗi kiểm định đều cao và không giảm đáng kể, mô hình có khả năng bị underfitting. Trái ngược với kỹ thuật tạo đặc trưng hiệu quả, giúp mô hình hiểu dữ liệu, việc cung cấp quá ít đặc trưng cũng có thể khiến mô hình thiếu thông tin cần thiết.

Phù hợp quá mức so với phù hợp quá mức

Điều quan trọng là phải phân biệt giữa hiện tượng thiếu khớp (underfitting) và hiện tượng quá khớp (overfitting ). Hai khái niệm này đại diện cho hai thái cực đối lập của sự đánh đổi giữa độ lệch và phương sai .

  • Hiện tượng thiếu khớp (Độ lệch cao): Mô hình quá cứng nhắc. Nó hoạt động kém hiệu quả trên cả dữ liệu huấn luyện và kiểm tra vì chưa học được tín hiệu cơ bản.
  • Hiện tượng quá khớp (Độ biến thiên cao): Mô hình quá linh hoạt. Nó ghi nhớ dữ liệu huấn luyện, bao gồm cả nhiễu, hoạt động cực kỳ tốt trong quá trình huấn luyện nhưng không thể khái quát hóa sang các ví dụ mới.

Việc tìm ra "điểm cân bằng" giữa hai thái cực này là mục tiêu chính của tối ưu hóa mô hình .

Các Ứng dụng Thực tế

Hiểu rõ về hiện tượng "underfitting" (hiện tượng khớp dữ liệu không đầy đủ) là điều vô cùng quan trọng để phát triển các hệ thống AI đáng tin cậy trong nhiều ngành công nghiệp khác nhau.

  • Lái xe tự hành: Trong bối cảnh xe tự hành , một mô hình phát hiện đối tượng chưa được huấn luyện đầy đủ có thể không phân biệt được giữa người đi bộ và cột đèn trong môi trường đô thị phức tạp. Vì mô hình thiếu các tham số để học những khác biệt thị giác tinh tế, điều này gây nguy hiểm cho sự an toàn của trí tuệ nhân tạo .
  • Chẩn đoán y khoa: Khi áp dụng phân tích hình ảnh y khoa vào... detect Đối với những dị thường như khối u, một mô hình quá đơn giản có thể bỏ sót những khối u nhỏ hoặc bất thường. Nếu mạng nơ-ron quá nông, nó không thể học được những kết cấu phức tạp cần thiết để đạt độ nhạy và độ đặc hiệu cao, dẫn đến chẩn đoán sai.

Giải quyết vấn đề trang bị không phù hợp bằng mã lập trình

TRONG tầm nhìn máy tínhHiện tượng thiếu khớp (underfitting) thường xảy ra khi sử dụng một biến thể mô hình quá nhỏ so với độ khó của nhiệm vụ (ví dụ: phát hiện các vật thể nhỏ trong ảnh chụp từ máy bay không người lái độ phân giải cao). Tiếp theo là... Python Ví dụ này minh họa cách chuyển đổi từ mô hình nhỏ hơn sang mô hình lớn hơn, có khả năng hơn bằng cách sử dụng... ultralytics thư viện để giải quyết vấn đề thiếu khớp dữ liệu tiềm ẩn.

from ultralytics import YOLO

# If 'yolo26n.pt' (Nano) is underfitting and yielding low accuracy,
# upgrade to a model with higher capacity like 'yolo26l.pt' (Large).
model = YOLO("yolo26l.pt")

# Train the larger model.
# Increasing epochs also helps the model converge if it was previously underfitting.
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Bằng cách chuyển sang mô hình Ultralytics YOLO26 lớn hơn và đảm bảo thời gian huấn luyện đầy đủ, hệ thống sẽ có được các tham số cần thiết để học các mẫu phức tạp, từ đó giảm thiểu hiệu quả hiện tượng thiếu khớp (underfitting). Để xác minh mô hình của bạn không còn bị thiếu khớp, hãy luôn đánh giá nó dựa trên một tập dữ liệu kiểm thử mạnh mẽ. Để quản lý tập dữ liệu và theo dõi các thử nghiệm nhằm phát hiện sớm hiện tượng thiếu khớp, Nền tảng Ultralytics cung cấp các công cụ toàn diện để trực quan hóa và phân tích.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay