Tăng cường dữ liệu
Cải thiện mô hình học máy của bạn bằng cách tăng cường dữ liệu. Khám phá các kỹ thuật để tăng độ chính xác, giảm tình trạng quá khớp và cải thiện độ mạnh mẽ.
Tăng cường dữ liệu là một kỹ thuật quan trọng trong học máy (ML) được sử dụng để tăng kích thước và tính đa dạng của tập dữ liệu huấn luyện một cách nhân tạo. Điều này đạt được bằng cách tạo ra các phiên bản đã được sửa đổi nhưng vẫn chân thực của các mẫu dữ liệu hiện có. Mục tiêu chính là cải thiện hiệu suất và độ bền vững của các mô hình AI , đặc biệt là trong thị giác máy tính (CV) , bằng cách cho chúng tiếp xúc với nhiều điều kiện khác nhau hơn trong quá trình huấn luyện. Điều này giúp ngăn ngừa hiện tượng quá khớp (overfitting ), khi một mô hình học dữ liệu huấn luyện quá tốt nhưng không thể khái quát hóa sang dữ liệu mới, chưa được biết đến, cuối cùng dẫn đến độ chính xác của mô hình cao hơn.
Tăng cường dữ liệu hoạt động như thế nào
Trong thị giác máy tính, việc tăng cường dữ liệu bao gồm việc áp dụng một loạt các phép biến đổi cho hình ảnh. Các phép biến đổi này được thiết kế để mô phỏng các biến đổi trong thế giới thực mà một mô hình có thể gặp phải sau khi triển khai . Các kỹ thuật phổ biến bao gồm:
- Biến đổi hình học : Những phép biến đổi này thay đổi hướng không gian của hình ảnh. Ví dụ bao gồm xoay ngẫu nhiên, tỷ lệ, tịnh tiến (dịch chuyển), cắt xén và lật (ngang hoặc dọc). Những phép biến đổi này dạy cho mô hình tính bất biến theo vị trí và hướng của vật thể.
- Biến đổi Không gian Màu : Các biến đổi này sửa đổi các thuộc tính màu của hình ảnh. Việc điều chỉnh độ sáng, độ tương phản, độ bão hòa và sắc độ giúp mô hình thích ứng tốt hơn với những thay đổi về điều kiện ánh sáng.
- Kỹ thuật Nâng cao : Các phương pháp phức tạp hơn liên quan đến việc thay đổi nội dung hình ảnh đáng kể hơn. Các phương pháp này có thể bao gồm thêm nhiễu ngẫu nhiên (như nhiễu Gauss), áp dụng hiệu ứng làm mờ, hoặc sử dụng các phương pháp như Mixup, tạo ảnh mới bằng cách kết hợp tuyến tính hai ảnh hiện có, và Cutout, loại bỏ ngẫu nhiên các vùng của ảnh. Bạn có thể tìm hiểu thêm về các phương pháp này trong Hướng dẫn Tối ưu về Tăng cường Dữ liệu .
Nhiều nền tảng học sâu, như PyTorch và TensorFlow , cung cấp các công cụ để tăng cường dữ liệu. Các thư viện chuyên biệt như Albumentations cung cấp một bộ sưu tập lớn các kỹ thuật tăng cường hiệu suất cao và được tích hợp với các mô hình như Ultralytics YOLO11 để đa dạng hóa dữ liệu đào tạo một cách liền mạch .
Ứng dụng trong thế giới thực
Tăng cường dữ liệu là một hoạt động tiêu chuẩn trong nhiều lĩnh vực để xây dựng các hệ thống AI đáng tin cậy hơn.
- AI trong Chăm sóc Sức khỏe : Trong phân tích hình ảnh y tế , các tập dữ liệu thường nhỏ do quy định về quyền riêng tư của bệnh nhân và tính hiếm gặp của một số bệnh. Để huấn luyện một mô hình phát hiện khối u trong ảnh chụp , các kỹ thuật tăng cường như xoay, thay đổi tỷ lệ và thay đổi độ sáng tạo ra một tập hợp các ví dụ huấn luyện đa dạng hơn. Điều này giúp mô hình xác định chính xác các bất thường bất kể sự thay đổi của thiết bị hình ảnh hoặc vị trí bệnh nhân, từ đó cải thiện độ tin cậy của chẩn đoán.
- AI cho Ô tô : Việc phát triển các hệ thống phát hiện vật thể mạnh mẽ cho xe tự hành đòi hỏi dữ liệu từ vô số tình huống lái xe. Thay vì thu thập dữ liệu cho mọi điều kiện có thể xảy ra, công nghệ tăng cường có thể mô phỏng các điều kiện thời tiết khác nhau (ví dụ: thêm mưa hoặc tuyết nhân tạo), ánh sáng (ban ngày, hoàng hôn, ban đêm) và các vật cản (ví dụ: người đi bộ bị che khuất một phần bởi một chiếc xe khác). Điều này giúp hệ thống nhận diện của xe đáng tin cậy hơn trong các môi trường thực tế khó lường.
Các ứng dụng quan trọng khác bao gồm AI trong sản xuất để kiểm soát chất lượng và AI trong nông nghiệp để phát hiện bệnh cây trồng trong các điều kiện đồng ruộng khác nhau.
Tăng cường dữ liệu so với các khái niệm liên quan
Điều quan trọng là phải phân biệt việc tăng cường dữ liệu với các kỹ thuật liên quan đến dữ liệu khác.
- Dữ liệu Tổng hợp : Mặc dù cả hai phương pháp đều cải thiện bộ dữ liệu, nhưng chúng hoạt động khác nhau. Tăng cường dữ liệu sửa đổi dữ liệu thực hiện có . Ngược lại, tạo dữ liệu tổng hợp tạo ra dữ liệu nhân tạo hoàn toàn mới từ đầu bằng cách sử dụng mô phỏng hoặc mô hình sinh như GAN . Trong khi tăng cường mở rộng phương sai xung quanh dữ liệu quan sát được, dữ liệu tổng hợp có thể tạo ra các kịch bản mới không có trong bộ dữ liệu gốc, một khái niệm được khám phá trong phần tổng quan về dữ liệu tổng hợp trong thị giác máy tính này .
- Làm sạch dữ liệu : Làm sạch dữ liệu là một phần của quy trình tiền xử lý dữ liệu rộng hơn, tập trung vào việc xác định và sửa lỗi, sự không nhất quán và thiếu chính xác trong một tập dữ liệu. Mục tiêu của nó là cải thiện chất lượng dữ liệu. Mặt khác, tăng cường dữ liệu là về việc tăng số lượng và tính đa dạng của dữ liệu. Một tập dữ liệu sạch là điểm khởi đầu lý tưởng trước khi áp dụng tăng cường.
- Học chuyển giao : Kỹ thuật này bao gồm việc sử dụng một mô hình được đào tạo trước trên một tập dữ liệu chuẩn lớn như ImageNet , sau đó tinh chỉnh nó trên một tập dữ liệu nhỏ hơn, dành riêng cho từng tác vụ. Việc tăng cường dữ liệu thường được sử dụng trong giai đoạn tinh chỉnh để cải thiện hiệu suất hơn nữa và ngăn ngừa hiện tượng quá khớp trên dữ liệu mới.
Các nền tảng như Ultralytics HUB hợp lý hóa toàn bộ quá trình đào tạo mô hình , kết hợp tăng cường dữ liệu như một bước quan trọng để giúp người dùng xây dựng các mô hình AI thị giác mạnh mẽ và hiện đại.