¡Sintonice YOLO Vision 2025!
25 de septiembre de 2025
10:00 — 18:00 BST
Evento híbrido
Yolo Vision 2024
Glosario

Ingeniería de características

Aumenta la precisión del aprendizaje automático con la ingeniería de características experta. Aprende técnicas para crear, transformar y seleccionar características impactantes.

La ingeniería de características es el proceso de utilizar el conocimiento del dominio para seleccionar, crear y transformar datos brutos en características que representen mejor el problema subyacente para los modelos predictivos. Es un paso crítico y, a menudo, lento en el pipeline de aprendizaje automático (ML), ya que la calidad de las características impacta directamente en el rendimiento y la precisión del modelo resultante. Una ingeniería de características eficaz puede marcar la diferencia entre un modelo mediocre y uno muy preciso, lo que a menudo produce ganancias de rendimiento más significativas que la elección de un algoritmo diferente o el ajuste exhaustivo de hiperparámetros.

## El Proceso de Ingeniería de Características

La ingeniería de características es tanto un arte como una ciencia, que combina el conocimiento del dominio con técnicas matemáticas. El proceso se puede dividir en varias actividades comunes, a menudo gestionadas utilizando bibliotecas como el módulo de preprocesamiento de scikit-learn o herramientas especializadas para la ingeniería automatizada de características.

  • Creación de características: Esto implica crear nuevas características a partir de las existentes. Por ejemplo, en un conjunto de datos de venta minorista, podría restar una "fecha de compra" de una fecha de "cliente desde" para crear una característica de "duración de la lealtad del cliente". En el análisis de series temporales, podría derivar características como medias móviles o estacionalidad a partir de una marca de tiempo.
  • Transformaciones: Los datos brutos a menudo necesitan ser transformados para cumplir con los supuestos de un algoritmo de aprendizaje automático. Esto incluye escalar características numéricas, aplicar transformaciones logarítmicas para manejar datos sesgados o utilizar técnicas como el binning para agrupar números en categorías.
  • Codificación: Muchos modelos de ML no pueden manejar datos categóricos directamente. La codificación implica convertir categorías basadas en texto en representaciones numéricas. Los métodos comunes incluyen la codificación one-hot, donde cada valor de categoría se convierte en una nueva columna binaria, y la codificación de etiquetas.
  • Selección de características: No todas las características son útiles. Algunas podrían ser redundantes o irrelevantes, introduciendo ruido que puede conducir al sobreajuste (overfitting). La selección de características tiene como objetivo elegir un subconjunto de las características más relevantes para mejorar el rendimiento del modelo y reducir el costo computacional.

## Aplicaciones en el Mundo Real

El impacto de la ingeniería de características es evidente en muchas industrias. Su eficacia a menudo depende de un profundo conocimiento del dominio para crear características que realmente capturen señales predictivas.

  1. Calificación crediticia: En finanzas, los datos brutos de los clientes pueden incluir ingresos, edad e historial de préstamos. Un ingeniero de características podría crear nuevas variables como "relación deuda-ingresos" (dividiendo la deuda total por los ingresos brutos) o "utilización del crédito" (dividiendo el saldo de la tarjeta de crédito por el límite de crédito). Estas características diseñadas proporcionan una señal mucho más clara de la salud financiera de una persona que los números brutos por sí solos, lo que conduce a modelos de riesgo crediticio más precisos.
  2. Mantenimiento predictivo: En la fabricación, los sensores de la maquinaria producen vastas corrientes de datos brutos como la vibración, la temperatura y la velocidad de rotación. Para predecir fallos, un ingeniero podría crear características como el "promedio móvil de la temperatura en las últimas 24 horas" o la "desviación estándar de la vibración". Estas características pueden revelar patrones sutiles de degradación que preceden a un fallo mecánico, lo que permite un mantenimiento proactivo y evita costosos tiempos de inactividad.

## Ingeniería de Características vs. Conceptos Relacionados

Es importante distinguir la ingeniería de características de términos relacionados en la IA y la ciencia de datos.

  • Ingeniería de características vs. Extracción de características: La ingeniería de características es un proceso en gran medida manual de creación de nuevas características basado en la intuición y la experiencia. La extracción de características es típicamente un proceso automatizado de transformación de datos en un conjunto reducido de características. En el aprendizaje profundo, modelos como las Redes Neuronales Convolucionales (CNNs) realizan automáticamente la extracción de características, aprendiendo características jerárquicas (bordes, texturas, formas) a partir de datos de píxeles sin intervención humana.
  • Ingeniería de características vs. Incrustaciones (Embeddings): Las incrustaciones son una forma sofisticada y aprendida de representación de características común en el PNL (Procesamiento del Lenguaje Natural) y la visión artificial. En lugar de crear características manualmente, un modelo aprende un vector denso que captura el significado semántico de un elemento (como una palabra o una imagen). Por lo tanto, las incrustaciones son el resultado del aprendizaje automatizado de características, no de la ingeniería manual.
  • Ingeniería de características vs. Preprocesamiento de datos: El preprocesamiento de datos es una categoría más amplia que incluye la ingeniería de características como uno de sus pasos clave. También abarca otras tareas esenciales como la limpieza de datos (manejo de valores faltantes y valores atípicos) y la preparación de conjuntos de datos para el entrenamiento.

Si bien las arquitecturas modernas como las de los modelos Ultralytics YOLO automatizan la extracción de características para tareas basadas en imágenes como la detección de objetos y la segmentación de instancias, los principios de la ingeniería de características siguen siendo fundamentales. Comprender cómo representar los datos de manera efectiva es crucial para depurar modelos, mejorar la calidad de los datos y abordar problemas complejos que involucran la combinación de datos visuales con datos estructurados. Plataformas como Ultralytics HUB proporcionan herramientas para gestionar todo este ciclo de vida, desde la preparación del conjunto de datos hasta la implementación del modelo.

Únete a la comunidad de Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora
Enlace copiado al portapapeles