Normalization
Khám phá cách chuẩn hóa cải thiện quy trình huấn luyện và độ chính xác của model. Tìm hiểu về Min-Max scaling, Z-score standardization và vai trò của nó trong các dự án Ultralytics YOLO26.
Chuẩn hóa là một kỹ thuật cơ bản trong tiền xử lý dữ liệu liên quan đến việc thay đổi quy mô các thuộc tính số về một phạm vi tiêu chuẩn. Trong bối cảnh học máy (ML), các tập dữ liệu thường chứa các đặc trưng với quy mô khác nhau—ví dụ như khoảng tuổi (0–100) so với mức thu nhập (0–100.000). Nếu không được xử lý, những chênh lệch này có thể khiến thuật toán tối ưu hóa bị thiên lệch về phía các giá trị lớn hơn, dẫn đến sự hội tụ chậm hơn và hiệu suất không tối ưu. Bằng cách chuẩn hóa dữ liệu, các kỹ sư đảm bảo rằng mọi đặc trưng đều đóng góp tương xứng vào kết quả cuối cùng, cho phép các mạng thần kinh học tập hiệu quả hơn.
Link to this sectionCác kỹ thuật chuẩn hóa phổ biến#
Có một số phương pháp tiêu chuẩn để chuyển đổi dữ liệu, mỗi phương pháp phù hợp với các phân phối và yêu cầu thuật toán khác nhau.
- Min-Max Scaling: Đây là hình thức chuẩn hóa trực quan nhất. Nó thay đổi quy mô dữ liệu về một phạm vi cố định, thường là [0, 1]. Phép chuyển đổi này được thực hiện bằng cách trừ đi giá trị tối thiểu và chia cho phạm vi (giá trị tối đa trừ đi giá trị tối thiểu). Phương pháp này được sử dụng rộng rãi trong xử lý ảnh nơi các cường độ pixel được biết là bị giới hạn trong khoảng từ 0 đến 255.
- Z-Score Standardization: Mặc dù thường được sử dụng thay thế cho chuẩn hóa, nhưng chuẩn hóa (standardization) cụ thể chuyển đổi dữ liệu để có giá trị trung bình bằng 0 và độ lệch chuẩn bằng 1. Điều này đặc biệt hữu ích khi dữ liệu tuân theo phân phối Gaussian và là yếu tố cần thiết cho các thuật toán như Support Vector Machines (SVM) giả định dữ liệu có phân phối chuẩn.
- Log Scaling: Đối với dữ liệu chứa các giá trị ngoại lệ cực đoan hoặc tuân theo quy luật lũy thừa, việc áp dụng phép chuyển đổi logarit có thể nén phạm vi giá trị. Điều này giúp công cụ suy luận dễ dàng diễn giải phân phối một cách hiệu quả hơn mà không bị sai lệch bởi các giá trị tăng đột biến.
Link to this sectionCác ứng dụng trong thực tế#
Chuẩn hóa là một bước tiêu chuẩn trong các quy trình của các hệ thống AI hiệu suất cao trên nhiều ngành công nghiệp khác nhau.
-
Thị giác máy tính (CV): Trong các tác vụ như phát hiện đối tượng và phân loại ảnh, hình ảnh kỹ thuật số được tạo thành từ các giá trị pixel nằm trong khoảng từ 0 đến 255. Việc đưa trực tiếp các số nguyên lớn này vào một mạng có thể làm chậm quá trình hạ gradient. Một bước tiền xử lý tiêu chuẩn bao gồm chia giá trị pixel cho 255.0 để chuẩn hóa chúng về phạm vi [0, 1]. Thực tiễn này đảm bảo đầu vào nhất quán cho các model nâng cao như YOLO26, giúp cải thiện độ ổn định khi huấn luyện trên Ultralytics Platform.
-
Phân tích ảnh y tế: Các bản quét y tế, chẳng hạn như những bản quét được sử dụng trong AI trong chăm sóc sức khỏe, thường đến từ các máy khác nhau với các thang cường độ thay đổi. Chuẩn hóa đảm bảo rằng cường độ pixel từ một bản quét MRI hoặc CT có thể so sánh được giữa các bệnh nhân và thiết bị khác nhau. Sự nhất quán này rất quan trọng đối với việc phát hiện khối u chính xác, cho phép model tập trung vào các bất thường về cấu trúc thay vì các biến thể về độ sáng.
Link to this sectionPhân biệt các khái niệm liên quan#
Điều quan trọng là phải phân biệt chuẩn hóa với các thuật ngữ tiền xử lý và kiến trúc tương tự được tìm thấy trong học sâu (deep learning).
- so với Batch Normalization: Chuẩn hóa dữ liệu là một bước tiền xử lý được áp dụng cho tập dữ liệu đầu vào thô trước khi nó đi vào mạng. Ngược lại, Batch Normalization hoạt động bên trong giữa các lớp xuyên suốt mạng trong quá trình huấn luyện model. Nó chuẩn hóa đầu ra của một lớp kích hoạt trước đó để ổn định quá trình học.
- so với Image Augmentation: Trong khi chuẩn hóa thay đổi quy mô của các giá trị pixel, tăng cường dữ liệu (augmentation) thay đổi nội dung hoặc hình học của ảnh (ví dụ: lật, xoay hoặc thay đổi màu sắc) để tăng sự đa dạng của tập dữ liệu. Các công cụ như Albumentations được sử dụng để tăng cường dữ liệu, trong khi chuẩn hóa là một thao tác thay đổi quy mô toán học.
Link to this sectionVí dụ về triển khai#
Trong thị giác máy tính, chuẩn hóa thường là bước đầu tiên trong quy trình. Ví dụ Python dưới đây minh họa cách chuẩn hóa dữ liệu ảnh theo cách thủ công bằng cách sử dụng thư viện NumPy, một quá trình diễn ra tự động bên trong trình tải dữ liệu Ultralytics YOLO26 trong quá trình huấn luyện.
import numpy as np
# Simulate a 2x2 pixel image with values ranging from 0 to 255
raw_image = np.array([[0, 255], [127, 64]], dtype=np.float32)
# Apply Min-Max normalization to scale values to [0, 1]
# This standardizes the input for the neural network
normalized_image = raw_image / 255.0
print(f"Original Range: {raw_image.min()} - {raw_image.max()}")
print(f"Normalized Range: {normalized_image.min()} - {normalized_image.max()}")





