Glosario

Regresión lineal

Descubra el poder de la regresión lineal en el aprendizaje automático. Aprenda sus aplicaciones, ventajas y conceptos clave para el éxito del modelado predictivo.

La regresión lineal es un algoritmo fundamental de la estadística y el aprendizaje automático (AM) utilizado para el modelado predictivo. Su objetivo es establecer una relación lineal entre una variable dependiente (la que se predice) y una o más variables independientes (predictores o características). Al ser una de las técnicas de regresión más sencillas e interpretables, constituye la base para entender modelos más complejos y sirve de referencia crucial en muchas tareas analíticas. Pertenece a la categoría de aprendizaje supervisado, ya que aprende a partir de datos de entrenamiento etiquetados.

Cómo funciona la regresión lineal

La idea central es encontrar la línea recta que mejor se ajuste a los puntos de datos y que minimice la diferencia entre los valores previstos y los reales. Esta línea representa la relación lineal entre las variables. Cuando sólo hay una variable independiente, se denomina regresión lineal simple; con múltiples variables independientes, se trata de regresión lineal múltiple. El proceso implica la estimación de coeficientes (o pesos del modelo) para cada variable independiente, que cuantifican el cambio en la variable dependiente para un cambio de una unidad en el predictor. Para encontrar los coeficientes óptimos se suelen utilizar técnicas como el descenso gradual, que minimizan una función de pérdida, normalmente la suma de errores al cuadrado. Un preprocesamiento cuidadoso de los datos, que incluya la normalización y la ingeniería de características, puede mejorar significativamente el rendimiento del modelo. La recogida y anotación eficaces de los datos son requisitos previos para construir un modelo fiable.

Aplicaciones reales

La regresión lineal se aplica ampliamente en diversos campos debido a su simplicidad e interpretabilidad:

  • Predicción financiera: Predicción del precio de las acciones, el valor de los activos o el crecimiento económico a partir de datos históricos e indicadores económicos. Por ejemplo, predecir los ingresos de una empresa basándose en el gasto en marketing y el tamaño del mercado es un caso de uso habitual de la IA en finanzas.
  • Predicción de ventas: Estimación de las ventas futuras en función de factores como el presupuesto publicitario, las actividades promocionales y los precios de la competencia, lo que ayuda en la gestión del inventario y a lograr la eficiencia minorista con IA.
  • Valoración inmobiliaria: Predecir los precios de las casas basándose en características como los metros cuadrados, el número de dormitorios, la ubicación y la antigüedad. Se trata de un ejemplo clásico utilizado a menudo en los cursos de introducción al ML.
  • Evaluación del riesgo: Evaluación del riesgo de crédito mediante la modelización de la relación entre las tasas de impago de los préstamos y las características de los prestatarios en el sector bancario.
  • Análisis de la atención sanitaria: Estudio de la relación entre factores como el estilo de vida (por ejemplo, el tabaquismo o la dieta) y los resultados en materia de salud (por ejemplo, la presión arterial), lo que contribuye al conocimiento de la IA en la atención sanitaria.

Regresión lineal frente a otros modelos

Es importante distinguir la regresión lineal de otros modelos de ML:

Pertinencia y limitaciones

La regresión lineal presupone una relación lineal entre las variables, la independencia de los errores y una varianza constante de los errores (homocedasticidad). El incumplimiento de estos supuestos puede dar lugar a un rendimiento deficiente del modelo. También es sensible a los valores atípicos, que pueden afectar desproporcionadamente a la línea ajustada. A pesar de estas limitaciones, su sencillez, rapidez y alta interpretabilidad lo convierten en un excelente punto de partida para muchos problemas de regresión y en una valiosa herramienta para comprender las relaciones básicas entre datos. A menudo sirve como punto de referencia para evaluar modelos más complejos. Bibliotecas como Scikit-learn proporcionan implementaciones sólidas para el uso práctico, y comprender sus principios es crucial antes de explorar técnicas avanzadas o utilizar plataformas para la formación y el despliegue de modelos. La evaluación de modelos mediante métricas como el error cuadrático medio (MSE) o R-cuadrado, junto con métricas como la precisión o la puntuación F1 en contextos relacionados, ayuda a evaluar la eficacia en los datos de validación. Seguir las mejores prácticas para el despliegue de modelos garantiza una aplicación fiable en el mundo real, y aplicar consejos para el entrenamiento de modelos puede mejorar los resultados.

Únase a la comunidad Ultralytics

Únase al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo.

Únete ahora
Enlace copiado en el portapapeles