Glosario

Árbol de decisión

Descubra el poder de los árboles de decisión en el aprendizaje automático para la clasificación, la regresión y las aplicaciones del mundo real como la sanidad y las finanzas.

Un árbol de decisión es un popular e intuitivo modelo de aprendizaje automático que utiliza una estructura en forma de árbol para realizar predicciones. Funciona dividiendo un conjunto de datos en subconjuntos cada vez más pequeños y desarrollando simultáneamente un árbol de decisión asociado. El resultado final es un árbol con nodos de decisión y nodos hoja. Un nodo de decisión representa una característica o atributo, una rama representa una regla de decisión y cada nodo de hoja representa un resultado o una etiqueta de clase. Como su estructura se asemeja a un diagrama de flujo, es uno de los modelos más fáciles de entender e interpretar, lo que lo convierte en una piedra angular de la modelización predictiva.

Cómo funcionan los árboles de decisión

El proceso de construcción de un árbol de decisión consiste en dividir recursivamente los datos de entrenamiento en función de los valores de distintos atributos. El algoritmo elige el mejor atributo para dividir los datos en cada paso, con el objetivo de que los subgrupos resultantes sean lo más "puros" posible, es decir, que cada grupo esté formado principalmente por puntos de datos con el mismo resultado. Este proceso de división suele guiarse por criterios como la impureza de Gini o la ganancia de información, que miden el nivel de desorden o aleatoriedad en los nodos.

El árbol comienza con un único nodo raíz que contiene todos los datos. A continuación, se divide en nodos de decisión, que representan preguntas sobre los datos (por ejemplo, "¿Tiene el cliente más de 30 años?"). Estas divisiones continúan hasta que los nodos son puros o se cumple una condición de parada, como la profundidad máxima del árbol. Los nodos finales no divididos se denominan nodos hoja y proporcionan la predicción final para cualquier punto de datos que llegue a ellos. Por ejemplo, un nodo hoja puede clasificar una transacción como "fraudulenta" o "no fraudulenta". Esta interpretabilidad es una ventaja clave, a menudo destacada en los debates en torno a la IA explicable (XAI).

Aplicaciones reales

Los árboles de decisión son versátiles y se utilizan tanto para tareas de clasificación como de regresión en diversos sectores.

La IA en el diagnóstico sanitario: Se puede utilizar un árbol de decisión para crear un modelo de diagnóstico preliminar. El modelo tomaría como datos de entrada (características) datos del paciente como los síntomas (fiebre, tos), la edad y los resultados del laboratorio. A continuación, el árbol seguiría una serie de reglas de decisión para predecir la probabilidad de una enfermedad específica. Por ejemplo, una división podría basarse en si un paciente tiene fiebre, seguida de otra división en función de la gravedad de la tos, para desembocar finalmente en un nodo hoja que sugiere un diagnóstico probable. De este modo, los profesionales médicos pueden seguir un camino claro basado en reglas. El Instituto Nacional de Bioingeniería e Imágenes Biomédicas (NIBIB) ofrece más información sobre este campo.
Servicios financieros para la evaluación del riesgo crediticio: Los bancos y las instituciones financieras utilizan árboles de decisión para determinar la elegibilidad de los préstamos. El modelo analiza datos del solicitante como la puntuación crediticia, los ingresos, el importe del préstamo y el historial laboral. El árbol podría dividirse primero en función de la puntuación crediticia. Si la puntuación es alta, sigue un camino; si es baja, otro. Las divisiones posteriores en función de los ingresos y la duración del préstamo ayudan a clasificar al solicitante como de bajo o alto riesgo, lo que influye en la decisión de aprobación del préstamo. Esta aplicación es una parte esencial de la IA en las finanzas.

Relación con otros modelos

Los árboles de decisión constituyen la base de métodos de conjunto más complejos que a menudo ofrecen una mayor precisión.

Bosques aleatorios: Este popular modelo construye múltiples árboles de decisión sobre diferentes subconjuntos aleatorios de datos y características. A continuación, agrega sus predicciones (por votación para la clasificación o promediando para la regresión), lo que mejora el rendimiento y hace que el modelo sea más robusto contra el sobreajuste.
Árboles potenciados por gradiente: Modelos como XGBoost y LightGBM son técnicas de conjunto avanzadas que construyen árboles de decisión secuencialmente, donde cada nuevo árbol corrige los errores del anterior.
Agrupación K-Means: Es importante distinguir los árboles de decisión de los algoritmos de agrupación. K-Means es un método de aprendizaje no supervisado para agrupar datos no etiquetados, mientras que los árboles de decisión se utilizan para el aprendizaje supervisado para hacer predicciones basadas en datos etiquetados.
Redes neuronales convolucionales (CNN): Aunque son potentes para los problemas con datos tabulares, los árboles de decisión son menos eficaces para datos de alta dimensión como las imágenes. En visión por ordenador, se utilizan en su lugar modelos como las CNN y los transformadores de visión (ViT). Arquitecturas de última generación como Ultralytics YOLO11 aprovechan estas estructuras de aprendizaje profundo para tareas complejas como la detección de objetos, la clasificación de imágenes y la segmentación de instancias.

La comprensión de modelos fundamentales como los árboles de decisión proporciona un contexto valioso en el panorama más amplio de la inteligencia artificial (IA). Herramientas como Scikit-learn proporcionan implementaciones populares para árboles de decisión, mientras que plataformas como Ultralytics HUB agilizan el desarrollo y despliegue de modelos de visión avanzados para casos de uso más complejos.

Árbol de decisión

Entrene los modelos YOLO de Ultralytics para agilizar los flujos de trabajo en todos los sectores

Solución flexible de licencias empresariales para impulsar su innovación

Entrene modelos de IA en segundos con Ultralytics YOLO

Cómo funcionan los árboles de decisión

Aplicaciones reales

Relación con otros modelos

Leer más en esta categoría

¿Puede la IA detectar acciones humanas? Exploración del reconocimiento de actividades

Detección de fracturas de muñeca con visión por ordenador

Cómo saber si la fruta del dragón está madura mediante visión por ordenador

Únase a la comunidad Ultralytics