Data Augmentation
Khám phá cách tăng cường dữ liệu (data augmentation) cải thiện tính bền vững của model và giảm overfitting. Tìm hiểu các kỹ thuật chính để nâng cao hiệu suất Ultralytics YOLO26 cho computer vision.
Tăng cường dữ liệu là một kỹ thuật quan trọng trong machine learning và computer vision được sử dụng để tăng kích thước và tính đa dạng của tập dữ liệu huấn luyện một cách nhân tạo bằng cách tạo ra các phiên bản đã sửa đổi từ dữ liệu hiện có. Thay vì thu thập và gán nhãn dữ liệu hoàn toàn mới—vốn có thể tốn kém và mất thời gian—phương pháp tăng cường áp dụng nhiều phép biến đổi khác nhau cho các mẫu gốc. Những sửa đổi này giúp machine learning models học cách nhận diện các mô hình (patterns) một cách mạnh mẽ hơn, đảm bảo chúng hoạt động tốt ngay cả khi gặp phải các biến thể trong môi trường thực tế. Bằng cách cho các model tiếp xúc với phạm vi kịch bản rộng hơn trong quá trình huấn luyện, các nhà phát triển có thể giảm thiểu hiệu quả overfitting và cải thiện khả năng tổng quát hóa.
Link to this sectionSự liên quan trong AI hiện đại#
Trong lĩnh vực computer vision, các model thường gặp khó khăn khi xử lý các hình ảnh hơi khác so với dữ liệu huấn luyện của chúng. Các biến thể về ánh sáng, hướng, hoặc nhiễu nền có thể gây nhầm lẫn cho một model chưa được tiếp xúc với đủ tính đa dạng. Tăng cường dữ liệu giải quyết vấn đề này bằng cách mô phỏng các biến thể đó thông qua lập trình. Ví dụ, hình ảnh một con mèo có thể được xoay, lật, hoặc làm mờ nhẹ để dạy cho model biết rằng chủ thể vẫn là một "con mèo" bất kể những thay đổi này.
Quá trình này là một phần không thể thiếu đối với sự thành công của các kiến trúc hiện đại như Ultralytics YOLO26, vốn dựa vào các tập dữ liệu phong phú và đa dạng để đạt được độ chính xác cao trong các tác vụ như object detection và image segmentation. Bằng cách tổng hợp các ví dụ huấn luyện mới, tăng cường dữ liệu cho phép các model học được các đặc trưng bất biến—những đặc điểm không thay đổi dù đầu vào có bị biến đổi.
Link to this sectionCác kỹ thuật và phương pháp phổ biến#
Tăng cường dữ liệu bao gồm một loạt các kỹ thuật biến đổi, từ các điều chỉnh hình học đơn giản đến các phương pháp tạo lập phức tạp:
- Biến đổi hình học: Bao gồm các thao tác như xoay, thay đổi tỷ lệ, lật, cắt, và dịch chuyển (shifting) hình ảnh. Những thao tác này đại diện cho những thay đổi trong góc nhìn của camera hoặc vị trí của đối tượng.
- Điều chỉnh không gian màu: Thay đổi độ sáng, độ tương phản, độ bão hòa, và sắc độ giúp các model xử lý các điều kiện ánh sáng hoặc cảm biến camera khác nhau.
- Chèn nhiễu: Thêm nhiễu ngẫu nhiên (như nhiễu Gaussian) có thể giúp các model có khả năng chống chịu tốt hơn với dữ liệu đầu vào bị hạt hoặc chất lượng thấp.
- Trộn hình ảnh: Các kỹ thuật như MixUp hoặc Mosaic (phổ biến trong huấn luyện YOLO) kết hợp nhiều hình ảnh thành một mẫu huấn luyện duy nhất, buộc model phải học bối cảnh và mối quan hệ giữa các đối tượng hiệu quả hơn.
- Phương pháp tạo lập: Các phương pháp tiên tiến sử dụng Generative AI hoặc diffusion models để tạo ra các mẫu huấn luyện tổng hợp hoàn toàn mới, bắt chước các đặc điểm của tập dữ liệu gốc.
Link to this sectionCác ứng dụng trong thực tế#
Tác động thực tiễn của tăng cường dữ liệu trải rộng trên nhiều ngành công nghiệp nơi sự khan hiếm dữ liệu hoặc tính biến thiên cao là một thách thức.
Link to this sectionXe tự hành#
Trong quá trình phát triển autonomous vehicles, việc thu thập dữ liệu cho mọi điều kiện thời tiết hoặc tình huống ánh sáng có thể xảy ra là gần như không thể. Các kỹ sư sử dụng tăng cường dữ liệu để mô phỏng mưa, sương mù, tuyết, hoặc ánh sáng chói trên các hình ảnh thời tiết rõ ràng. Điều này đảm bảo rằng hệ thống nhận diện có thể phát hiện đáng tin cậy người đi bộ, biển báo giao thông, và các phương tiện khác bất kể yếu tố môi trường, từ đó nâng cao tính an toàn và độ tin cậy.
Link to this sectionChẩn đoán hình ảnh y tế#
Medical image analysis thường gặp khó khăn do tập dữ liệu hạn chế vì các vấn đề về quyền riêng tư và sự khan hiếm của một số tình trạng bệnh lý. Tăng cường dữ liệu cho phép các nhà nghiên cứu mở rộng các tập dữ liệu nhỏ gồm phim X-quang hoặc bản quét MRI bằng cách áp dụng các phép biến dạng đàn hồi, xoay, hoặc thay đổi cường độ. Điều này giúp huấn luyện các model chẩn đoán mạnh mẽ có khả năng xác định khối u hoặc vết gãy với độ nhạy cao, ngay cả khi vị trí của bệnh nhân hoặc chất lượng quét thay đổi.
Link to this sectionPhân biệt các khái niệm liên quan#
Việc phân biệt giữa tăng cường dữ liệu và Synthetic Data là rất quan trọng. Mặc dù cả hai đều nhằm mục đích tăng kích thước tập dữ liệu, synthetic data được tạo ra nhân tạo từ đầu (thường sử dụng các công cụ kết xuất 3D hoặc mô phỏng), trong khi tăng cường dữ liệu sửa đổi dữ liệu thực tế đã có. Ngoài ra, Data Preprocessing bao gồm làm sạch và định dạng dữ liệu (ví dụ: thay đổi kích thước, chuẩn hóa) để làm cho nó phù hợp với một model, nhưng không giống như tăng cường dữ liệu, nó không nhất thiết làm tăng số lượng mẫu huấn luyện.
Link to this sectionTriển khai tăng cường dữ liệu với Ultralytics#
Các framework hiện đại tích hợp khả năng tăng cường trực tiếp vào quy trình huấn luyện. Ví dụ dưới đây minh họa cách áp dụng các phép tăng cường như lật và thay đổi tỷ lệ trong quá trình huấn luyện model YOLO26 sử dụng gói ultralytics.
from ultralytics import YOLO
# Load the YOLO26 model
model = YOLO("yolo26n.pt")
# Train with custom data augmentation hyperparameters
# fliplr: 50% chance of horizontal flip, scale: image scaling gain
results = model.train(data="coco8.yaml", epochs=10, fliplr=0.5, scale=0.5)Bằng cách điều chỉnh các siêu tham số này, các nhà phát triển có thể tùy chỉnh chiến lược tăng cường phù hợp với nhu cầu cụ thể của tập dữ liệu và ứng dụng của họ, tận dụng sự linh hoạt của Ultralytics Platform để phát triển model hiệu quả.






