深圳Yolo 视觉
深圳
立即加入
词汇表

归一化

探索归一化如何提高模型训练和准确性。了解最小-最大缩放、Z-分数标准化及其在 Ultralytics YOLO26 项目中的作用。

归一化是 数据预处理 中的一项基本技术,它涉及将数值属性重新缩放到标准范围。在 机器学习 (ML) 的背景下,数据集通常包含具有不同尺度的特征——例如年龄范围 (0–100) 与收入水平 (0–100,000)。如果不对这些差异进行处理,可能会导致 优化算法 偏向较大的值,从而导致收敛速度变慢和性能不佳。通过数据归一化,工程师可以确保每个特征对最终结果的贡献是成比例的,从而使 神经网络 能够更有效地学习。

常见的标准化技术

有几种标准的数据转换方法,每种都适用于不同的数据分布和算法要求。

  • 最小-最大缩放: 这是最直观的归一化形式。它将数据重新缩放到固定范围,通常是 [0, 1]。此变换通过减去最小值并除以范围(最大值减去最小值)来执行。它广泛用于 图像处理 中,其中像素强度已知在 0 到 255 之间。
  • Z-分数标准化: 尽管经常与归一化互换使用,但标准化特指将数据转换为均值为 0、标准差为 1 的形式。当数据服从高斯分布时,这尤其有用,并且对于假设数据呈正态分布的支持向量机 (SVM)等算法至关重要。
  • 对数缩放: 对于包含极端异常值或遵循幂律的数据,应用对数变换可以压缩数值范围。这使得分布更易于 推理引擎有效解释, 而不会因巨大的值峰值而偏斜。

实际应用

归一化是各行业高性能AI系统流程中的标准步骤。

  1. 计算机视觉 (CV):object detection图像classify等任务中,数字图像由0到255的像素值组成。将这些大整数直接输入网络会减慢gradient descent的速度。一个标准的预处理步骤是将像素值除以255.0,将其归一化到[0, 1]范围。这种做法确保了YOLO26等高级模型的一致输入,提高了Ultralytics Platform上的训练稳定性。
  2. 医学图像分析:医学扫描,例如医疗AI中使用的扫描,通常来自具有不同强度标度的不同机器。归一化确保MRI或CT扫描的像素强度在不同患者和设备之间具有可比性。这种一致性对于准确的肿瘤detect至关重要,使模型能够专注于结构异常而非亮度变化。

区分相关概念

区分归一化与深度学习中发现的类似预处理和架构术语至关重要。

  • vs. 批量归一化数据归一化是在原始输入数据集进入网络之前应用的预处理步骤。相反,批量归一化在模型训练期间在网络内部层之间运行。它对前一个激活层的输出进行归一化,以稳定学习过程。
  • vs. 图像增强归一化改变像素值的尺度,而增强改变图像的内容或几何形状(例如,翻转、旋转或改变颜色)以增加数据集多样性。像Albumentations这样的工具用于增强,而归一化是一种数学缩放操作。

实施实例

在计算机视觉中,归一化通常是管道中的第一步。以下python示例演示了如何使用NumPy 库手动归一化图像数据,此过程在训练期间会在Ultralytics YOLO26数据加载器中自动发生。

import numpy as np

# Simulate a 2x2 pixel image with values ranging from 0 to 255
raw_image = np.array([[0, 255], [127, 64]], dtype=np.float32)

# Apply Min-Max normalization to scale values to [0, 1]
# This standardizes the input for the neural network
normalized_image = raw_image / 255.0

print(f"Original Range: {raw_image.min()} - {raw_image.max()}")
print(f"Normalized Range: {normalized_image.min()} - {normalized_image.max()}")

让我们一起共建AI的未来!

开启您的机器学习未来之旅