Изучите структуру «Дерево мыслей» (ToT) для улучшения логического мышления LLM. Узнайте, как реализовать структурированный поиск и многоступенчатую логику с помощью Ultralytics .
Tree of Thoughts (ToT) — это усовершенствованная структура рассуждений, разработанная для улучшения способностей крупных языковых моделей (LLM) к решению задач. В отличие от традиционных линейных методов подсказки, ToT позволяет моделям одновременно исследовать несколько путей рассуждений, подобно исследованию ветвей дерева. На каждом этапе модель генерирует несколько возможных «мыслей» или промежуточных шагов рассуждения, оценивает их жизнеспособность и активно решает, какие пути следует продолжать, приостанавливать или отказываться от них. Этот подход отражает человеческий подход к решению проблем, когда мы часто рассматриваем различные возможности, проверяем гипотезы мысленно и возвращаемся назад, если понимаем, что определенный подход является ошибочным.
При изучении стратегий подсказок важно отличать «Дерево мыслей» от «Цепочки мыслей» (CoT). CoT программирует модель на следование одной линейной последовательности логических шагов для достижения вывода. Несмотря на высокую эффективность для многих задач, CoT не может восстановить работу, если допустит ошибку в начале последовательности. В отличие от этого, ToT явно поддерживает древовидную структуру нескольких путей рассуждений. Используя алгоритмы поиска в ширину или фреймворки поиска в глубину, ToT может отступать от тупиков и переключаться на более многообещающие ветви, что делает его значительно более надежным для сложных задач генеративного ИИ.
Способность предвидеть и оценивать несколько вариантов исхода делает ToT чрезвычайно ценным в различных отраслях, требующих сложной логики.
При построении систем рассуждений зрительное восприятие выступает в качестве сенсорного входа для логического дерева модели. Вы можете беспрепятственно вводить данные обнаружения в реальном времени в модель рассуждений OpenAI или в ветви оценки агента . В следующем примере показано, как извлекать данные об окружающей среде с помощью YOLO26, которые могут служить в качестве функции оценки узла в более широкой структуре ToT.
from ultralytics import YOLO
# Load Ultralytics YOLO26 to analyze visual states for a reasoning tree
model = YOLO("yolo26n.pt")
results = model("https://ultralytics.com/images/bus.jpg")
def evaluate_thought_state(detections):
# Returns True if a 'bus' is found, prompting the ToT agent to explore this logic branch
return any(model.names[int(box.cls)] == "bus" for box in detections[0].boxes)
print(f"Is this reasoning branch viable? {evaluate_thought_state(results)}")
По мере того как исследователи из таких организаций, как Google , продолжают совершенствовать эвристическую оценку, интеграция ToT в повседневные рабочие процессы ИИ ускоряется. Мы приближаемся к искусственному общему интеллекту (AGI), в котором модели плавно сочетают мультимодальное обучение со структурированным поиском. Команды, создающие эти приложения нового поколения, полагаются на надежную инфраструктуру, такую как Ultralytics , для управления сложными наборами данных, необходимыми для обучения как перцептивных, так и логических уровней современных систем ИИ. Для тех, кто хочет глубже погрузиться в математику, лежащую в основе динамических вычислительных графов, которые питают эти модели, официальная PyTorch остается бесценным ресурсом.