Overfitting trong computer vision là gì và làm thế nào để ngăn chặn nó?
Tìm hiểu overfitting là gì trong computer vision và cách ngăn chặn nó bằng cách sử dụng tăng cường dữ liệu (data augmentation), chuẩn hóa (regularization) và các model được huấn luyện trước (pre-trained models).

Các mô hình thị giác máy tính được thiết kế để nhận diện mô hình, phát hiện đối tượng và phân tích hình ảnh. Tuy nhiên, hiệu suất của chúng phụ thuộc vào khả năng tổng quát hóa đối với dữ liệu chưa từng thấy. Tổng quát hóa là khả năng mô hình hoạt động tốt trên các hình ảnh mới, không chỉ các hình ảnh được dùng để huấn luyện. Một vấn đề phổ biến khi huấn luyện các mô hình này là overfitting, trong đó mô hình học quá nhiều từ dữ liệu huấn luyện, bao gồm cả những nhiễu không cần thiết, thay vì xác định các mô hình có ý nghĩa.
Khi hiện tượng này xảy ra, mô hình hoạt động tốt trên dữ liệu huấn luyện nhưng lại gặp khó khăn với hình ảnh mới. Ví dụ, một mô hình phát hiện đối tượng chỉ được huấn luyện trên các hình ảnh độ phân giải cao, đủ sáng có thể thất bại khi gặp hình ảnh mờ hoặc bị che khuất trong điều kiện thực tế. Overfitting hạn chế khả năng thích ứng của mô hình, làm giảm hiệu quả trong các ứng dụng thực tế như xe tự lái, hình ảnh y tế và hệ thống an ninh.
Trong bài viết này, chúng ta sẽ khám phá overfitting là gì, tại sao nó xảy ra và cách ngăn chặn. Chúng ta cũng sẽ xem xét cách các mô hình thị giác máy tính như Ultralytics YOLO11 giúp giảm overfitting và cải thiện khả năng tổng quát hóa.
Link to this sectionOverfitting là gì?#
Overfitting xảy ra khi một mô hình ghi nhớ dữ liệu huấn luyện thay vì học các mô hình áp dụng rộng rãi cho các đầu vào mới. Mô hình trở nên quá tập trung vào dữ liệu huấn luyện, khiến nó gặp khó khăn với các hình ảnh hoặc tình huống mới mà nó chưa từng gặp trước đó.
Trong thị giác máy tính, overfitting có thể ảnh hưởng đến các tác vụ khác nhau. Một mô hình phân loại chỉ được huấn luyện trên hình ảnh sáng, rõ nét có thể gặp khó khăn trong điều kiện thiếu sáng. Một mô hình phát hiện đối tượng học từ các hình ảnh hoàn hảo có thể thất bại trong các cảnh đông đúc hoặc lộn xộn. Tương tự, một mô hình phân đoạn cá thể có thể hoạt động tốt trong môi trường được kiểm soát nhưng lại gặp sự cố với bóng đổ hoặc các đối tượng chồng lấn.
Đây trở thành một vấn đề trong các ứng dụng AI thực tế, nơi các mô hình phải có khả năng tổng quát hóa ngoài các điều kiện huấn luyện được kiểm soát. Ví dụ, xe tự lái phải có khả năng phát hiện người đi bộ trong các điều kiện ánh sáng, thời tiết và môi trường khác nhau. Một mô hình bị overfitting trên tập dữ liệu huấn luyện sẽ không hoạt động ổn định trong những tình huống khó lường như vậy.
Link to this sectionKhi nào và tại sao overfitting xảy ra?#
Overfitting thường xảy ra do tập dữ liệu không cân bằng, độ phức tạp của mô hình quá cao và quá trình huấn luyện quá mức. Dưới đây là các nguyên nhân chính:
- Dữ liệu huấn luyện hạn chế: Các tập dữ liệu nhỏ khiến mô hình ghi nhớ thay vì tổng quát hóa các mô hình. Một mô hình chỉ được huấn luyện trên 50 hình ảnh chim có thể gặp khó khăn khi phát hiện các loài chim bên ngoài tập dữ liệu đó.
- Mô hình phức tạp với quá nhiều tham số: Các mạng sâu với quá nhiều lớp và neuron có xu hướng ghi nhớ các chi tiết nhỏ thay vì tập trung vào các tính năng cần thiết.
- Thiếu tăng cường dữ liệu: Nếu không có các phép biến đổi như cắt, lật hoặc xoay, mô hình có thể chỉ học từ chính xác các hình ảnh huấn luyện của nó.
- Huấn luyện kéo dài: Nếu một mô hình trải qua dữ liệu huấn luyện quá nhiều lần, hay còn gọi là epochs, nó sẽ ghi nhớ các chi tiết thay vì học các mô hình tổng quát, khiến nó trở nên kém thích ứng hơn.
- Nhãn không nhất quán hoặc nhiễu: Dữ liệu bị gắn nhãn sai khiến mô hình học nhầm các mô hình. Điều này thường xảy ra trong các tập dữ liệu được gắn nhãn thủ công.
Một phương pháp cân bằng giữa độ phức tạp của mô hình, chất lượng tập dữ liệu và các kỹ thuật huấn luyện sẽ đảm bảo khả năng tổng quát hóa tốt hơn.
Link to this sectionOverfitting so với underfitting#
Overfitting và underfitting là hai vấn đề hoàn toàn trái ngược nhau trong học sâu.

Hình 1. So sánh underfitting, học tối ưu và overfitting trong các mô hình thị giác máy tính.
Overfitting xảy ra khi mô hình quá phức tạp, khiến nó tập trung quá mức vào dữ liệu huấn luyện. Thay vì học các mô hình tổng quát, nó ghi nhớ các chi tiết nhỏ, ngay cả những chi tiết không liên quan như nhiễu nền. Điều này khiến mô hình hoạt động tốt trên dữ liệu huấn luyện nhưng lại gặp khó khăn với hình ảnh mới, nghĩa là nó chưa thực sự học cách nhận diện các mô hình áp dụng trong các tình huống khác nhau.
Underfitting xảy ra khi mô hình quá đơn giản, khiến nó bỏ lỡ các mô hình quan trọng trong dữ liệu. Điều này có thể xảy ra khi mô hình có quá ít lớp, thời gian huấn luyện không đủ hoặc dữ liệu hạn chế. Kết quả là, nó không nhận diện được các mô hình quan trọng và đưa ra dự đoán thiếu chính xác. Điều này dẫn đến hiệu suất kém trên cả dữ liệu huấn luyện và kiểm tra vì mô hình chưa học đủ để hiểu rõ tác vụ.
Một mô hình được huấn luyện tốt sẽ tìm thấy sự cân bằng giữa độ phức tạp và khả năng tổng quát hóa. Nó nên đủ phức tạp để học các mô hình liên quan nhưng không quá phức tạp đến mức chỉ ghi nhớ dữ liệu thay vì nhận diện các mối quan hệ cơ bản.
Link to this sectionCách xác định overfitting#
Dưới đây là một số dấu hiệu cho thấy mô hình đang bị overfitting:
- Nếu độ chính xác huấn luyện cao hơn đáng kể so với độ chính xác kiểm chứng, mô hình có khả năng bị overfitting.
- Khoảng cách ngày càng tăng giữa mất mát huấn luyện và mất mát kiểm chứng là một chỉ báo mạnh mẽ khác.
- Mô hình quá tự tin vào các câu trả lời sai, cho thấy nó đã ghi nhớ các chi tiết thay vì hiểu các mô hình.
Để đảm bảo mô hình tổng quát hóa tốt, nó cần được kiểm tra trên các tập dữ liệu đa dạng phản ánh điều kiện thực tế.
Link to this sectionCách ngăn ngừa overfitting trong thị giác máy tính#
Overfitting không phải là điều không thể tránh khỏi và có thể ngăn chặn được. Với các kỹ thuật phù hợp, các mô hình thị giác máy tính có thể học các mô hình tổng quát thay vì ghi nhớ dữ liệu huấn luyện, giúp chúng đáng tin cậy hơn trong các ứng dụng thực tế.
Dưới đây là năm chiến lược chính để ngăn ngừa overfitting trong thị giác máy tính.
Link to this sectionTăng cường sự đa dạng dữ liệu với tăng cường dữ liệu và dữ liệu tổng hợp#
Cách tốt nhất để giúp mô hình hoạt động tốt trên dữ liệu mới là mở rộng tập dữ liệu bằng cách sử dụng tăng cường dữ liệu và dữ liệu tổng hợp. Dữ liệu tổng hợp được máy tính tạo ra thay vì thu thập từ hình ảnh thực tế. Nó giúp lấp đầy khoảng trống khi không có đủ dữ liệu thực.

Hình 2. Kết hợp dữ liệu thực tế và dữ liệu tổng hợp giúp giảm overfitting và cải thiện độ chính xác phát hiện đối tượng.
Tăng cường dữ liệu làm thay đổi nhẹ các hình ảnh hiện có bằng cách lật, xoay, cắt hoặc điều chỉnh độ sáng, để mô hình không chỉ ghi nhớ chi tiết mà học cách nhận diện đối tượng trong các tình huống khác nhau.
Dữ liệu tổng hợp rất hữu ích khi khó thu thập hình ảnh thực. Ví dụ, các mô hình xe tự lái có thể huấn luyện trên các cảnh đường phố do máy tính tạo ra để học cách phát hiện đối tượng trong các điều kiện thời tiết và ánh sáng khác nhau. Điều này giúp mô hình linh hoạt và đáng tin cậy hơn mà không cần hàng ngàn hình ảnh thực tế.
Link to this sectionTối ưu hóa độ phức tạp và kiến trúc mô hình#
Một mạng thần kinh sâu, loại mô hình học máy có nhiều lớp xử lý dữ liệu thay vì một lớp duy nhất, không phải lúc nào cũng tốt hơn. Khi một mô hình có quá nhiều lớp hoặc tham số, nó sẽ ghi nhớ dữ liệu huấn luyện thay vì nhận diện các mô hình rộng hơn. Giảm bớt độ phức tạp không cần thiết có thể giúp ngăn ngừa overfitting.
Để đạt được điều này, một cách tiếp cận là cắt tỉa, loại bỏ các neuron và kết nối dư thừa, làm cho mô hình trở nên tinh gọn và hiệu quả hơn.
Một cách khác là đơn giản hóa kiến trúc bằng cách giảm số lượng lớp hoặc neuron. Các mô hình đã được huấn luyện trước như YOLO11 được thiết kế để tổng quát hóa tốt giữa các tác vụ với ít tham số hơn, giúp chúng chống lại overfitting tốt hơn so với việc huấn luyện một mô hình sâu từ đầu.
Tìm kiếm sự cân bằng phù hợp giữa độ sâu và hiệu quả của mô hình giúp nó học các mô hình hữu ích mà không chỉ ghi nhớ dữ liệu huấn luyện.
Link to this sectionÁp dụng các kỹ thuật chính quy hóa#
Các kỹ thuật chính quy hóa ngăn chặn các mô hình trở nên quá phụ thuộc vào các tính năng cụ thể trong dữ liệu huấn luyện. Dưới đây là một vài kỹ thuật thường được sử dụng:
- Dropout tắt các phần ngẫu nhiên của mô hình trong quá trình huấn luyện để nó học cách nhận diện các mô hình khác nhau thay vì dựa quá nhiều vào một vài tính năng.
- Phân rã trọng số (L2 regularization) ngăn cản các giá trị trọng số cực đoan, giữ cho độ phức tạp của mô hình được kiểm soát.
- Chuẩn hóa lô (Batch normalization) giúp ổn định quá trình huấn luyện bằng cách đảm bảo mô hình ít nhạy cảm hơn với các biến thể trong tập dữ liệu.
Các kỹ thuật này giúp duy trì sự linh hoạt và khả năng thích ứng của mô hình, giảm nguy cơ overfitting trong khi vẫn bảo toàn độ chính xác.
Link to this sectionTheo dõi quá trình huấn luyện với kiểm chứng và dừng sớm#
Để ngăn ngừa overfitting, điều quan trọng là theo dõi cách mô hình học và đảm bảo nó tổng quát hóa tốt với dữ liệu mới. Dưới đây là một vài kỹ thuật giúp thực hiện việc này:
- Dừng sớm (Early stopping): Tự động kết thúc quá trình huấn luyện khi mô hình không còn cải thiện, giúp nó không tiếp tục học các chi tiết không cần thiết.
- Kiểm chứng chéo (Cross-validation): Chia dữ liệu thành các phần và huấn luyện mô hình trên từng phần. Điều này giúp nó học các mô hình thay vì ghi nhớ các hình ảnh cụ thể.
Các kỹ thuật này giúp mô hình duy trì sự cân bằng để nó học đủ để chính xác mà không trở nên quá tập trung vào chỉ dữ liệu huấn luyện.
Link to this sectionSử dụng các mô hình đã được huấn luyện trước và cải thiện việc gắn nhãn dữ liệu#
Thay vì huấn luyện từ đầu, việc sử dụng các mô hình đã được huấn luyện trước như YOLO11 có thể giảm overfitting. YOLO11 được huấn luyện trên các tập dữ liệu quy mô lớn, cho phép nó tổng quát hóa tốt giữa các điều kiện khác nhau.

Hình 3. Các mô hình thị giác máy tính đã được huấn luyện trước nâng cao độ chính xác và ngăn ngừa overfitting.
Tinh chỉnh một mô hình đã được huấn luyện trước giúp nó giữ lại những gì đã biết trong khi học các tác vụ mới, để nó không chỉ ghi nhớ dữ liệu huấn luyện.
Ngoài ra, việc đảm bảo gắn nhãn dữ liệu chất lượng cao là rất cần thiết. Dữ liệu bị gắn nhãn sai hoặc mất cân bằng có thể khiến các mô hình học sai các mô hình. Làm sạch tập dữ liệu, sửa lỗi gắn nhãn hình ảnh và cân bằng các lớp giúp cải thiện độ chính xác và giảm nguy cơ overfitting. Một phương pháp hiệu quả khác là huấn luyện đối nghịch, nơi mô hình được tiếp xúc với các ví dụ được thay đổi nhẹ hoặc thử thách hơn để kiểm tra giới hạn của nó.
Link to this sectionCác điểm chính cần lưu ý#
Overfitting là một vấn đề phổ biến trong thị giác máy tính. Một mô hình có thể hoạt động tốt trên dữ liệu huấn luyện nhưng gặp khó khăn với hình ảnh thực tế. Để tránh điều này, các kỹ thuật như tăng cường dữ liệu, chính quy hóa và sử dụng các mô hình đã được huấn luyện trước như YOLO11 giúp cải thiện độ chính xác và khả năng thích ứng.
Bằng cách áp dụng các phương pháp này, các mô hình AI có thể duy trì độ tin cậy và hoạt động tốt trong các môi trường khác nhau. Khi học sâu phát triển, việc đảm bảo các mô hình tổng quát hóa đúng cách sẽ là chìa khóa cho sự thành công của AI trong thực tế.
Hãy tham gia cộng đồng đang phát triển của chúng tôi! Khám phá kho lưu trữ GitHub để tìm hiểu thêm về AI. Sẵn sàng bắt đầu các dự án thị giác máy tính của riêng bạn? Hãy xem các tùy chọn cấp phép của chúng tôi. Khám phá AI thị giác trong xe tự lái và AI trong chăm sóc sức khỏe bằng cách truy cập các trang giải pháp của chúng tôi!






