Glosario

Árbol de decisión

Descubra el poder de los árboles de decisión en el aprendizaje automático para la clasificación, la regresión y las aplicaciones del mundo real como la sanidad y las finanzas.

Un árbol de decisión es un algoritmo de aprendizaje automático (AM) versátil y ampliamente utilizado que pertenece a la categoría del aprendizaje supervisado. Utiliza una estructura en forma de árbol para modelar las decisiones y sus posibles consecuencias, de forma similar a un diagrama de flujo. Cada nodo interno representa una prueba sobre un atributo (o característica), cada rama representa el resultado de la prueba y cada nodo hoja representa una etiqueta de clase (en tareas de clasificación) o un valor continuo (en tareas de regresión). Debido a su estructura intuitiva, los árboles de decisión son conocidos por ser relativamente fáciles de entender e interpretar, lo que los hace valiosos para la IA explicable (XAI).

Cómo funcionan los árboles de decisión

La idea central es dividir el conjunto de datos en subconjuntos cada vez más pequeños en función de los valores de las características de entrada, creando una estructura de árbol. El proceso comienza en el nodo raíz, que representa todo el conjunto de datos. En cada nodo, el algoritmo selecciona la mejor característica y el mejor umbral para dividir los datos de forma que aumente la pureza u homogeneidad de los subconjuntos resultantes con respecto a la variable objetivo. Los criterios más comunes para encontrar la mejor división son la impureza de Gini y la ganancia de información (basada en la entropía), que miden el desorden o la aleatoriedad de un conjunto. Este proceso de división continúa de forma recursiva hasta que se cumple un criterio de parada, como alcanzar una profundidad máxima, tener un número mínimo de muestras en un nodo o lograr nodos hoja puros (nodos que contienen muestras de una sola clase). Para hacer una predicción de un nuevo punto de datos, se recorre el árbol desde la raíz hasta un nodo hoja basándose en los resultados de las pruebas de características, y la predicción es la clase mayoritaria o el valor medio en esa hoja. El preprocesamiento cuidadoso de los datos y la ingeniería de las características pueden influir significativamente en el rendimiento de un árbol de decisión.

Tipos de árboles de decisión

Los árboles de decisión pueden clasificarse en dos tipos principales:

  • Árboles de clasificación: Se utilizan cuando la variable objetivo es categórica (por ejemplo, predecir "spam" o "no spam"). Los nodos de las hojas representan etiquetas de clase.
  • Árboles de regresión: Se utilizan cuando la variable objetivo es continua (por ejemplo, para predecir el precio de la vivienda). Los nodos de las hojas representan un valor numérico predicho, a menudo la media de los valores objetivo de las muestras de entrenamiento que llegan a esa hoja.

Ventajas y desventajas

Los árboles de decisión ofrecen varias ventajas:

  • Interpretabilidad: Su estructura gráfica facilita su visualización y comprensión.
  • Mínima preparación de datos: Suelen requerir menos limpieza de datos en comparación con otros algoritmos, como necesitar menos normalización de datos.
  • Maneja datos no lineales: Pueden capturar relaciones no lineales entre las características y la variable objetivo.
  • Importancia de las características: Proporcionan intrínsecamente una medida de la importancia de la característica basada en la precocidad o frecuencia con que se utiliza una característica para la división.

Sin embargo, también tienen inconvenientes:

  • Sobreajuste: Los árboles de decisión pueden volverse fácilmente demasiado complejos y captar el ruido de los datos de entrenamiento, lo que conduce a una mala generalización en datos de prueba no vistos. Técnicas como la poda o el establecimiento de restricciones en el crecimiento del árbol ayudan a mitigar el sobreajuste.
  • Inestabilidad: Pequeñas variaciones en los datos pueden hacer que se genere un árbol completamente distinto.
  • Sesgo: los árboles pueden estar sesgados hacia características con más niveles o clases dominantes si el conjunto de datos está desequilibrado.

Aplicaciones reales

Los árboles de decisión se emplean en diversos ámbitos:

  1. Diagnóstico médico: Ayudar a los médicos creando modelos que sugieran diagnósticos basados en los síntomas del paciente y los resultados de las pruebas. Por ejemplo, un árbol podría guiar el diagnóstico haciendo preguntas sobre los síntomas de forma secuencial(IA en aplicaciones sanitarias).
  2. Predicción de la pérdida de clientes: Las empresas utilizan árboles de decisión para identificar a los clientes susceptibles de dejar de utilizar su servicio en función de sus patrones de uso, datos demográficos e historial de interacciones, lo que permite realizar esfuerzos de retención específicos(Predicción de la pérdida de clientes).
  3. Evaluación del riesgo financiero: Evaluación de la solvencia mediante el análisis de factores como los ingresos, las deudas y el historial crediticio(Modelos de visión por ordenador en finanzas).
  4. Control de calidad en la fabricación: Identificación de posibles defectos en los productos a partir de las lecturas de los sensores o los parámetros del proceso(Improving Manufacturing with Computer Vision).

Relación con otros modelos

Los árboles de decisión constituyen la base de métodos de conjunto más complejos, como los bosques aleatorios y los árboles de gradiente reforzado (como XGBoost o LightGBM). Los bosques aleatorios, por ejemplo, construyen múltiples árboles de decisión sobre distintos subconjuntos de datos y características y agregan sus predicciones, lo que a menudo mejora la precisión y la solidez frente al sobreajuste en comparación con un único árbol. Aunque son muy eficaces para muchos problemas de datos tabulares, los árboles de decisión difieren significativamente de modelos como las redes neuronales convolucionales (CNN) o los transformadores de visión (ViT) utilizados en visión por ordenador. Los modelos como Ultralytics YOLO11 aprovechan las arquitecturas de aprendizaje profundo optimizadas para tareas como la detección de objetos, la clasificación de imágenes y la segmentación de instancias, que implican el procesamiento de datos complejos y de alta dimensión como las imágenes, un dominio en el que los árboles de decisión simples son menos eficaces. La comprensión de modelos fundacionales como los árboles de decisión proporciona un contexto valioso dentro del panorama más amplio de la IA y el modelado predictivo. Herramientas como Scikit-learn proporcionan implementaciones populares para árboles de decisión, mientras que plataformas como Ultralytics HUB agilizan el desarrollo y despliegue de modelos de visión avanzados.

Únase a la comunidad Ultralytics

Únase al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo.

Únete ahora
Enlace copiado en el portapapeles