Tree of Thoughts (ToT)
Explora el marco del árbol de pensamientos (ToT) para mejorar el razonamiento de los LLM. Aprende a implementar la búsqueda estructurada y la lógica de varios pasos con Ultralytics YOLO26.
El Árbol de pensamientos (ToT, por sus siglas en inglés) es un marco de razonamiento avanzado diseñado para mejorar las capacidades de resolución de problemas de los Modelos de Lenguaje Extensos (LLM). A diferencia de los métodos de prompts lineales tradicionales, ToT permite a los modelos explorar múltiples rutas de razonamiento de forma simultánea, de manera similar a como se exploran las ramas de un árbol. En cada paso, el modelo genera varios "pensamientos" posibles o pasos de razonamiento intermedio, evalúa su viabilidad y decide activamente qué caminos seguir, pausar o abandonar. Este enfoque refleja la resolución de problemas humana, donde a menudo consideramos varias posibilidades, probamos hipótesis mentalmente y retrocedemos si nos damos cuenta de que un enfoque concreto es erróneo.
Link to this sectionDiferenciación del Árbol de pensamientos respecto a la Cadena de pensamiento#
Al explorar estrategias de prompting, es importante distinguir el Árbol de pensamientos del Prompting de Cadena de pensamiento (CoT). CoT instruye a un modelo a seguir una única secuencia lineal de pasos lógicos para llegar a una conclusión. Aunque es altamente eficaz para muchas tareas, CoT no puede recuperarse si comete un error al principio de su secuencia. Por el contrario, ToT mantiene explícitamente una estructura de árbol de múltiples rutas de razonamiento. Al utilizar algoritmos de búsqueda en anchura o marcos de trabajo de búsqueda en profundidad, ToT puede retroceder desde callejones sin salida y pivotar hacia ramas más prometedoras, lo que lo hace significativamente más robusto para tareas complejas de IA generativa.
Link to this sectionAplicaciones en el mundo real del Árbol de pensamientos#
La capacidad de mirar hacia adelante y evaluar múltiples resultados hace que ToT sea muy valioso en diversos sectores que requieren lógica compleja.
- Los agentes de IA autónomos utilizan ToT para la planificación estratégica en entornos dinámicos. Por ejemplo, en logística, un agente puede trazar múltiples escenarios de rutas, evaluando los efectos en cascada de los retrasos por tráfico o clima antes de comprometerse con una ruta óptima.
- En pipelines avanzados de visión por ordenador, ToT facilita el razonamiento visual en varios pasos. Cuando se despliega junto a modelos de detección de objetos de alta velocidad como Ultralytics YOLO26, un modelo de razonamiento puede evaluar una escena visual, generar hipótesis sobre posibles riesgos de seguridad en fabricación inteligente y retroceder si una inspección visual más detallada refuta la teoría inicial.
Link to this sectionIntegración de datos de visión en ramas de razonamiento#
Al construir sistemas de razonamiento, la percepción visual actúa como la entrada sensorial para el árbol lógico del modelo. Puedes inyectar sin problemas datos de detección en tiempo real en un modelo de razonamiento de OpenAI o en un agente que evalúe ramas. El siguiente ejemplo demuestra cómo extraer datos ambientales utilizando YOLO26, lo que podría servir como función de evaluación de nodos en un marco ToT más amplio.
from ultralytics import YOLO
# Load Ultralytics YOLO26 to analyze visual states for a reasoning tree
model = YOLO("yolo26n.pt")
results = model("https://ultralytics.com/images/bus.jpg")
def evaluate_thought_state(detections):
# Returns True if a 'bus' is found, prompting the ToT agent to explore this logic branch
return any(model.names[int(box.cls)] == "bus" for box in detections[0].boxes)
print(f"Is this reasoning branch viable? {evaluate_thought_state(results)}")Link to this sectionEl futuro del razonamiento estructurado por IA#
A medida que investigadores de organizaciones como Google DeepMind continúan refinando la evaluación heurística, la integración de ToT en los flujos de trabajo cotidianos de la IA se está acelerando. Nos acercamos más a la inteligencia artificial general (AGI), donde los modelos combinan a la perfección el aprendizaje multimodal con la búsqueda estructurada. Los equipos que construyen estas aplicaciones de nueva generación confían en una infraestructura robusta, como la Plataforma Ultralytics, para gestionar los complejos datasets necesarios para entrenar tanto las capas perceptivas como las de razonamiento de los sistemas de IA modernos. Para aquellos que deseen profundizar en las matemáticas detrás de los grafos computacionales dinámicos que potencian estos modelos, la documentación oficial de PyTorch sigue siendo un recurso inestimable.






