Glosario

Normalización

¡Descubra el poder de la normalización en el aprendizaje automático! Aprenda cómo mejora el entrenamiento de modelos, aumenta el rendimiento y garantiza soluciones de IA robustas.

La normalización es una técnica técnica fundamental de preprocesamiento de datos características numéricas dentro de un conjunto de datos a una escala común, normalmente sin distorsionar las diferencias en los rangos de valores o perder información. En el contexto del aprendizaje automático (AM) y aprendizaje profundo (AD), este proceso es fundamental para garantizar que los datos de entrada estén en un formato que los algoritmos puedan procesar de forma eficiente. Al ajustar los valores -a menudo en un rango entre 0 y 1, la normalización impide que las características con escalas numéricas más grandes dominen el proceso de aprendizaje del modelo, garantizando así una contribución coherente de todas las características. de aprendizaje del modelo, garantizando así una contribución coherente de todos los del modelo.

Por qué es importante la normalización en la IA

El objetivo principal de la normalización es facilitar la estabilidad y la velocidad del algoritmo de optimización. Muchos algoritmos como el Descenso Gradiente Estocástico (SGD), se basan en el cálculo de distancias o gradientes entre puntos de datos. Si una característica oscila entre 0 y 100.000 (por ejemplo, el precios de la vivienda) y otra va de 0 a 10 (por ejemplo, el número de habitaciones), el optimizador tendrá dificultades para navegar por la función de pérdida de forma eficaz. función de pérdida.

Una normalización adecuada ofrece varias ventajas clave:

Convergencia más rápida: Permite que el algoritmo de descenso de gradiente converja rápidamente hacia la solución óptima, reduciendo los recursos computacionales necesarios.
Estabilidad numérica: Mantener valores pequeños evita problemas numéricos, como un gradiente explosivo, en el que se acumulan gradientes de error se acumulan y dan lugar a actualizaciones inestables de la red.
Igual importancia de las características: Garantiza que el modelo trate todas las características como igualmente importantes inicialmente, evitando el sesgo hacia las variables de mayor magnitud. Se trata de un aspecto esencial de la ingeniería de características.

Técnicas habituales de normalización

Existen varios métodos para normalizar los datos, cada uno adecuado para distribuciones y algoritmos diferentes.

Escala Mín-Máx: Esta es la forma más común de normalización. Reescala los datos a un rango fijo, normalmente [0, 1]. Se realiza restando el valor mínimo y dividiendo por el rango (máximo menos mínimo). Puede explorar la implementación matemática en el archivo Scikit-Learn MinMaxScaler.
Normalización de la puntuación Z: A menudo se confunde con la normalización, estandarización (o normalización de puntuación Z) transforma los datos para que tengan una media de 0 y una desviación estándar de 1. Esto es útil cuando los datos siguen una distribución gaussiana.
Escala logarítmica: Para los datos con una cola pesada o valores extremos, la aplicación de una transformación logarítmica puede comprimir el rango de valores, haciendo que la distribución sea más manejable para la red neuronal (NN).

Normalización frente a normalización por lotes

Es importante distinguir entre normalización de los datos de entrada y Normalización por lotes.

Normalización de datos: Se produce durante la preprocesamiento de datos anotados. Se aplica a los datos en bruto (por ejemplo, imágenes o datos tabulares) antes de que entren en el modelo.
Normalización por lotes: Es una técnica de capa específica utilizada dentro de las redes neuronales profundas. Se normaliza las activaciones de una capa para cada minilote durante el entrenamiento. Mientras que la normalización de datos prepara la entrada, la normalización por lotes estabiliza el proceso de aprendizaje interno, ayudando a arquitecturas profundas como las redes neuronales profundas. YOLO11 entrenan más rápido y a mayor profundidad.

Aplicaciones en el mundo real

La normalización es omnipresente en varios ámbitos de la Inteligencia Artificial.

Visión por ordenador (CV): En tareas como detección de objetos y clasificación de imágenes, las imágenes se componen de valores de píxeles que van de 0 a 255. Introducir estos números enteros directamente en una red puede ralentizar el aprendizaje. A Un paso estándar de preprocesamiento consiste en dividir los valores de los píxeles por 255,0 para normalizarlos en el rango [0, 1]. Este estandariza las entradas para modelos como YOLO11 y el YOLO26.
Análisis de imágenes médicas: Las exploraciones médicas, como las utilizadas en AI en sanidad, suelen proceder de diferentes con diferentes escalas de intensidad. La normalización garantiza que las intensidades de los píxeles de una resonancia magnética o una tomografía computarizada sean comparables entre distintos pacientes. comparables en distintos pacientes, lo que es fundamental para detección de tumores.

Ejemplo de aplicación

Mientras que las bibliotecas avanzadas como ultralytics normalización de imágenes de forma automática dentro de sus es útil comprender la lógica subyacente. He aquí un ejemplo Python ejemplo con numpy para demostrar cómo normalizar manualmente los datos de píxeles de la imagen del rango 0-255 a 0-1.

import numpy as np

# Simulate a 2x2 pixel image with 3 color channels (RGB)
# Values range from 0 to 255
raw_image = np.array([[[10, 255, 128], [0, 50, 200]], [[255, 255, 255], [100, 100, 100]]], dtype=np.float32)

# Apply Min-Max normalization to scale values to [0, 1]
# Since the known min is 0 and max is 255, we simply divide by 255.0
normalized_image = raw_image / 255.0

print(f"Original Max: {raw_image.max()}")
print(f"Normalized Max: {normalized_image.max()}")
print(f"Normalized Data Sample:\n{normalized_image[0][0]}")

Esta sencilla operación prepara los datos de entrenamiento para por una red neuronal, garantizando que las operaciones matemáticas dentro de las capas funcionen de forma óptima.

Normalización

Entrene los modelosYOLO Ultralytics para agilizar los flujos de trabajo en todos los sectores

Solución de licencias empresariales flexible para impulsar su innovación

Entrene modelos de IA en segundos con Ultralytics YOLO

Por qué es importante la normalización en la IA

Técnicas habituales de normalización

Normalización frente a normalización por lotes

Aplicaciones en el mundo real

Ejemplo de aplicación

Leer más en esta categoría

Comprender por qué la anotación con intervención humana es clave

¿Qué es la destilación de conjuntos de datos? Una breve descripción general

Las gafas Oakley Meta AI están redefiniendo el concepto de gafas con Vision AI.

Únase a la comunidad Ultralytics