Tree of Thoughts (ToT)
探索思维树 (ToT) 框架以增强 LLM 推理。学习如何使用 Ultralytics YOLO26 实现结构化搜索和多步骤逻辑。
思维树 (ToT) 是一种先进的推理框架,旨在增强 大语言模型 (LLMs) 的问题解决能力。与传统的线性提示方法不同,ToT 使模型能够同时探索多条推理路径,就像探索树的分支一样。在每一步中,模型会生成多个可能的“思维”或中间推理步骤,评估其可行性,并主动决定要继续、暂停还是放弃哪些路径。这种方法模拟了人类的问题解决过程,即我们通常会考虑各种可能性,在脑海中测试假设,如果发现某种方法有缺陷,则会进行回溯。
Link to this section区分思维树与思维链#
在探索提示策略时,区分思维树与 思维链提示 (CoT) 非常重要。CoT 指示模型遵循单一、线性的逻辑步骤序列来得出结论。虽然 CoT 对于许多任务非常有效,但如果它在序列早期犯错,就无法恢复。相比之下,ToT 显式地维护了一个包含多条推理路径的树状结构。通过利用 广度优先搜索算法 或 深度优先搜索框架,ToT 可以从死胡同中回溯并转向更有希望的分支,这使其在处理复杂的 生成式 AI 任务时更为稳健。
Link to this section思维树的实际应用#
预判和评估多种结果的能力,使得 ToT 在需要复杂逻辑的各个行业中都极具价值。
- 自主 AI 智能体 利用 ToT 在动态环境中进行战略规划。例如,在物流领域,智能体可以规划出多种路由方案,在确定最优路径之前评估交通或天气延误带来的连锁反应。
- In advanced computer vision pipelines, ToT facilitates multi-step visual reasoning. When deployed alongside high-speed object detection models like Ultralytics YOLO26, a reasoning model can evaluate a visual scene, generate hypotheses about potential safety hazards in smart manufacturing, and backtrack if a closer visual inspection disproves the initial theory.
Link to this section将视觉数据集成到推理分支中#
在构建推理系统时,视觉感知充当了模型逻辑树的感官输入。你可以无缝地将实时检测数据注入到 OpenAI 推理模型 或评估分支的智能体中。以下示例演示了如何使用 YOLO26 提取环境数据,这可以在更广泛的 ToT 框架中用作节点评估函数。
from ultralytics import YOLO
# Load Ultralytics YOLO26 to analyze visual states for a reasoning tree
model = YOLO("yolo26n.pt")
results = model("https://ultralytics.com/images/bus.jpg")
def evaluate_thought_state(detections):
# Returns True if a 'bus' is found, prompting the ToT agent to explore this logic branch
return any(model.names[int(box.cls)] == "bus" for box in detections[0].boxes)
print(f"Is this reasoning branch viable? {evaluate_thought_state(results)}")Link to this section结构化 AI 推理的未来#
随着像 Google DeepMind 这样机构的研究人员不断完善启发式评估,ToT 在日常 AI 工作流中的整合正在加速。我们正离 通用人工智能 (AGI) 更近一步,届时模型将无缝结合 多模态学习 与结构化搜索。构建这些下一代应用的团队依赖于强大的基础设施,例如 Ultralytics Platform,来管理训练现代 AI 系统的感知层和推理层所需的复杂数据集。对于那些希望深入研究驱动这些模型的动态计算图背后数学原理的人来说,官方的 PyTorch 文档 仍然是无价的资源。






