Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Tăng Cường Dữ Liệu

Nâng cao mô hình máy học của bạn bằng cách tăng cường dữ liệu. Khám phá các kỹ thuật để tăng độ chính xác, giảm tình trạng overfitting và cải thiện độ mạnh mẽ.

Tăng cường dữ liệu là một kỹ thuật quan trọng trong học máy và thị giác máy tính, được sử dụng để tăng kích thước và sự đa dạng của tập dữ liệu huấn luyện bằng cách tạo ra các phiên bản đã được chỉnh sửa của dữ liệu hiện có. Thay vì thu thập và gắn nhãn dữ liệu hoàn toàn mới—điều này có thể tốn thời gian và chi phí—tăng cường dữ liệu áp dụng nhiều phép biến đổi khác nhau cho các mẫu gốc. Những sửa đổi này giúp các mô hình học máy học cách nhận dạng các mẫu một cách mạnh mẽ hơn, đảm bảo chúng hoạt động tốt ngay cả khi gặp phải sự biến đổi trong môi trường thực tế. Bằng cách cho các mô hình tiếp xúc với nhiều kịch bản hơn trong quá trình huấn luyện, các nhà phát triển có thể giảm thiểu hiệu quả hiện tượng quá khớp và cải thiện khả năng khái quát hóa.

Tính phù hợp trong Trí tuệ nhân tạo hiện đại

Trong lĩnh vực thị giác máy tính , các mô hình thường gặp khó khăn khi được cung cấp các hình ảnh hơi khác so với dữ liệu huấn luyện của chúng. Sự khác biệt về ánh sáng, hướng hoặc các chi tiết nền có thể gây nhầm lẫn cho một mô hình chưa được tiếp xúc đủ với sự đa dạng. Kỹ thuật tăng cường dữ liệu giải quyết vấn đề này bằng cách mô phỏng các biến thể này một cách lập trình. Ví dụ, hình ảnh một con mèo có thể được xoay, lật hoặc làm mờ nhẹ để dạy cho mô hình rằng đối tượng vẫn là "một con mèo" bất kể những thay đổi này.

Quá trình này là yếu tố không thể thiếu đối với sự thành công của các kiến ​​trúc hiện đại như Ultralytics YOLO26 , dựa trên các tập dữ liệu phong phú và đa dạng để đạt được độ chính xác cao trong các tác vụ như phát hiện đối tượngphân đoạn hình ảnh . Bằng cách tổng hợp các ví dụ huấn luyện mới, việc tăng cường dữ liệu cho phép các mô hình học được các đặc trưng bất biến—những đặc trưng không thay đổi bất chấp sự thay đổi trong dữ liệu đầu vào.

Các kỹ thuật và phương pháp phổ biến

Tăng cường dữ liệu bao gồm một loạt các kỹ thuật biến đổi, từ những điều chỉnh hình học đơn giản đến các phương pháp tạo sinh phức tạp:

  • Các phép biến đổi hình học: Bao gồm các thao tác như xoay, thu phóng, lật, cắt xén và dịch chuyển hình ảnh. Chúng thể hiện sự thay đổi về góc nhìn của máy ảnh hoặc vị trí của đối tượng.
  • Điều chỉnh không gian màu: Việc điều chỉnh độ sáng, độ tương phản, độ bão hòa và sắc độ giúp các mô hình xử lý các điều kiện ánh sáng khác nhau hoặc cảm biến máy ảnh khác nhau.
  • Thêm nhiễu ngẫu nhiên: Việc thêm nhiễu ngẫu nhiên (như nhiễu Gaussian) có thể giúp các mô hình hoạt động tốt hơn với dữ liệu đầu vào thô hoặc chất lượng thấp.
  • Phối trộn hình ảnh: Các kỹ thuật như MixUp hoặc Mosaic (phổ biến trong YOLO (trong quá trình huấn luyện) kết hợp nhiều hình ảnh thành một mẫu huấn luyện duy nhất, buộc mô hình phải học ngữ cảnh và mối quan hệ giữa các đối tượng một cách hiệu quả hơn.
  • Các phương pháp tạo sinh: Các phương pháp tiên tiến sử dụng Trí tuệ nhân tạo tạo sinh (Generative AI) hoặc mô hình khuếch tán để tạo ra các mẫu huấn luyện tổng hợp hoàn toàn mới, mô phỏng các đặc điểm của tập dữ liệu gốc.

Các Ứng dụng Thực tế

Tác động thực tiễn của việc tăng cường dữ liệu trải rộng trên nhiều ngành công nghiệp, nơi mà sự khan hiếm dữ liệu hoặc tính biến động cao là một thách thức.

Lái xe tự động

Trong quá trình phát triển xe tự hành , việc thu thập dữ liệu cho mọi điều kiện thời tiết hoặc kịch bản ánh sáng có thể xảy ra là gần như bất khả thi. Các kỹ sư sử dụng kỹ thuật tăng cường dữ liệu để mô phỏng mưa, sương mù, tuyết hoặc chói sáng trên hình ảnh thời tiết trong lành. Điều này đảm bảo rằng hệ thống nhận thức có thể hoạt động một cách đáng tin cậy. detect Người đi bộ, biển báo giao thông và các phương tiện khác, bất kể các yếu tố môi trường, đều góp phần nâng cao an toàn và độ tin cậy.

Chụp ảnh y tế

Phân tích hình ảnh y tế thường gặp khó khăn do dữ liệu hạn chế vì lý do bảo mật và sự hiếm gặp của một số bệnh lý. Kỹ thuật tăng cường dữ liệu cho phép các nhà nghiên cứu mở rộng các tập dữ liệu nhỏ từ ảnh chụp X-quang hoặc MRI bằng cách áp dụng các biến dạng đàn hồi, xoay hoặc thay đổi cường độ. Điều này giúp huấn luyện các mô hình chẩn đoán mạnh mẽ có khả năng xác định khối u hoặc gãy xương với độ nhạy cao, ngay cả khi tư thế bệnh nhân hoặc chất lượng ảnh quét thay đổi.

Phân biệt các khái niệm liên quan

Điều quan trọng là phải phân biệt giữa tăng cường dữ liệu (data augmentation) và dữ liệu tổng hợp (synthetic data ). Mặc dù cả hai đều nhằm mục đích tăng kích thước tập dữ liệu, nhưng dữ liệu tổng hợp được tạo ra một cách nhân tạo từ đầu (thường sử dụng công cụ dựng hình 3D hoặc mô phỏng), trong khi tăng cường dữ liệu sửa đổi dữ liệu thực tế hiện có . Ngoài ra, tiền xử lý dữ liệu (data preprocessing ) bao gồm việc làm sạch và định dạng dữ liệu (ví dụ: thay đổi kích thước, chuẩn hóa) để làm cho dữ liệu phù hợp với mô hình, nhưng không giống như tăng cường dữ liệu, nó không nhất thiết làm tăng số lượng mẫu huấn luyện.

Triển khai Tăng cường với Ultralytics

Các framework hiện đại tích hợp trực tiếp kỹ thuật tăng cường dữ liệu vào quy trình huấn luyện. Ví dụ dưới đây minh họa cách áp dụng các kỹ thuật tăng cường dữ liệu như lật và thu phóng trong quá trình huấn luyện mô hình YOLO26. ultralytics bưu kiện.

from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Train with custom data augmentation hyperparameters
# fliplr: 50% chance of horizontal flip, scale: image scaling gain
results = model.train(data="coco8.yaml", epochs=10, fliplr=0.5, scale=0.5)

Bằng cách điều chỉnh các siêu tham số này, các nhà phát triển có thể tùy chỉnh chiến lược tăng cường dữ liệu cho phù hợp với nhu cầu cụ thể của tập dữ liệu và ứng dụng của họ, tận dụng tính linh hoạt của Nền tảng Ultralytics để phát triển mô hình hiệu quả.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay