深圳Yolo 视觉
深圳
立即加入
词汇表

思维树 (ToT)

探索思维树 (ToT) 框架以增强 LLM 推理能力。了解如何使用 Ultralytics YOLO26 实现结构化搜索和多步逻辑。

思维树 (ToT) 是一种先进的推理框架,旨在增强 大型语言模型 (LLM) 的问题解决能力。与传统的线性提示方法不同,ToT 赋能模型同时探索多个推理路径,就像探索一棵树的枝干一样。在每一步中,模型会生成几个可能的“想法”或中间推理步骤,评估其可行性,并积极决定要追求、暂停或放弃哪些路径。这种方法反映了人类解决问题的方式,我们经常考虑各种可能性,在脑海中检验假设,并在意识到某种方法有缺陷时回溯。

区分思维树与思维链

在探索提示策略时,区分思维树与 思维链提示 (CoT) 至关重要。CoT 指示模型遵循单一的线性逻辑步骤序列以得出结论。尽管 CoT 对许多任务非常有效,但如果在序列早期犯错,它无法恢复。相比之下,ToT 明确维护了多条推理路径的树状结构。通过利用 广度优先搜索算法深度优先搜索框架,ToT 可以从死胡同中回溯并转向更有前景的分支,使其在复杂的 生成式 AI 任务中显著更具鲁棒性。

思维树的实际应用

预判并评估多种结果的能力,使得 ToT 在需要复杂逻辑的各个行业中极具价值。

  • 自主人工智能智能体在动态环境中利用 ToT 进行战略规划。例如,在物流领域,智能体可以规划多种路由方案,评估交通或天气延误的连锁效应,然后确定最佳路径。
  • 在先进的 计算机视觉 管线中,ToT 促进多步视觉推理。当与高速 目标检测 模型(如 Ultralytics YOLO26)一同部署时,推理模型可以评估视觉场景,生成关于 智能制造 中潜在安全隐患的假设,如果更仔细的视觉检查推翻了最初的理论,则可以回溯。

将视觉数据集成到推理分支中

在构建推理系统时,视觉感知充当模型逻辑树的感官输入。您可以将实时 detect 数据无缝注入到 OpenAI 推理模型 或评估分支的代理中。以下示例演示了如何使用 YOLO26 提取环境数据,这可以作为更广泛的 ToT 框架中的节点评估函数。

from ultralytics import YOLO

# Load Ultralytics YOLO26 to analyze visual states for a reasoning tree
model = YOLO("yolo26n.pt")
results = model("https://ultralytics.com/images/bus.jpg")


def evaluate_thought_state(detections):
    # Returns True if a 'bus' is found, prompting the ToT agent to explore this logic branch
    return any(model.names[int(box.cls)] == "bus" for box in detections[0].boxes)


print(f"Is this reasoning branch viable? {evaluate_thought_state(results)}")

结构化 AI 推理的未来

随着 Google DeepMind 等组织的研究人员不断完善启发式评估,ToT 融入日常 AI 工作流程的速度正在加快。我们正日益接近 通用人工智能 (AGI),模型将 多模态学习 与结构化搜索无缝结合。构建这些下一代应用的团队依赖于强大的基础设施,例如 Ultralytics 平台,来管理训练现代 AI 系统感知层和推理层所需的复杂数据集。对于那些希望深入研究驱动这些模型的动态计算图背后数学原理的人,官方 PyTorch 文档 仍然是宝贵的资源。

让我们一起共建AI的未来!

开启您的机器学习未来之旅