Tree of Thoughts (ToT)
Esplora il framework Tree of Thoughts (ToT) per migliorare il ragionamento degli LLM. Impara a implementare la ricerca strutturata e la logica a più passaggi con Ultralytics YOLO26.
Tree of Thoughts (ToT) è un framework di ragionamento avanzato progettato per migliorare le capacità di risoluzione dei problemi dei Large Language Models (LLMs). A differenza dei metodi di prompting lineari tradizionali, ToT permette ai modelli di esplorare più percorsi di ragionamento simultaneamente, proprio come nell'esplorazione dei rami di un albero. Ad ogni passaggio, il modello genera diversi "pensieri" o passaggi di ragionamento intermedi, ne valuta la fattibilità e decide attivamente quali percorsi seguire, mettere in pausa o abbandonare. Questo approccio rispecchia la risoluzione dei problemi umana, in cui spesso consideriamo varie possibilità, testiamo ipotesi mentalmente e torniamo sui nostri passi se ci rendiamo conto che un determinato approccio è difettoso.
Link to this sectionDifferenziare Tree of Thoughts da Chain of Thought#
Durante l'esplorazione delle strategie di prompting, è importante distinguere Tree of Thoughts da Chain-of-Thought Prompting (CoT). CoT istruisce un modello a seguire una singola sequenza lineare di passaggi logici per arrivare a una conclusione. Sebbene sia molto efficace per molte attività, CoT non può recuperare se commette un errore all'inizio della sua sequenza. Al contrario, ToT mantiene esplicitamente una struttura ad albero di percorsi di ragionamento multipli. Utilizzando algoritmi di ricerca in ampiezza o framework di ricerca in profondità, ToT può tornare indietro da vicoli ciechi e passare a rami più promettenti, rendendolo significativamente più robusto per attività complesse di Generative AI.
Link to this sectionApplicazioni nel mondo reale di Tree of Thoughts#
La capacità di guardare avanti e valutare molteplici risultati rende ToT estremamente prezioso in vari settori che richiedono una logica complessa.
- Gli Autonomous AI agents utilizzano ToT per la pianificazione strategica in ambienti dinamici. Ad esempio, nella logistica, un agente può mappare diversi scenari di instradamento, valutando gli effetti a catena di ritardi dovuti al traffico o al meteo prima di impegnarsi in un percorso ottimale.
- Nei pipeline avanzati di computer vision, ToT facilita il ragionamento visivo multi-step. Quando viene distribuito insieme a modelli di object detection ad alta velocità come Ultralytics YOLO26, un modello di ragionamento può valutare una scena visiva, generare ipotesi su potenziali rischi per la sicurezza nel smart manufacturing e tornare sui propri passi se un'ispezione visiva più ravvicinata smentisce la teoria iniziale.
Link to this sectionIntegrazione dei dati visivi nei rami di ragionamento#
Quando costruisci sistemi di ragionamento, la percezione visiva funge da input sensoriale per l'albero logico del modello. Puoi inserire senza problemi dati di rilevamento in tempo reale in un OpenAI reasoning model o in un agente che valuta i rami. L'esempio seguente mostra come estrarre dati ambientali utilizzando YOLO26, che potrebbe fungere da funzione di valutazione dei nodi in un framework ToT più ampio.
from ultralytics import YOLO
# Load Ultralytics YOLO26 to analyze visual states for a reasoning tree
model = YOLO("yolo26n.pt")
results = model("https://ultralytics.com/images/bus.jpg")
def evaluate_thought_state(detections):
# Returns True if a 'bus' is found, prompting the ToT agent to explore this logic branch
return any(model.names[int(box.cls)] == "bus" for box in detections[0].boxes)
print(f"Is this reasoning branch viable? {evaluate_thought_state(results)}")Link to this sectionIl futuro del ragionamento AI strutturato#
Mentre i ricercatori presso organizzazioni come Google DeepMind continuano a perfezionare la valutazione euristica, l'integrazione di ToT nei flussi di lavoro AI quotidiani sta accelerando. Ci stiamo avvicinando sempre più all'artificial general intelligence (AGI), in cui i modelli combinano perfettamente multi-modal learning con la ricerca strutturata. I team che costruiscono queste applicazioni di nuova generazione si affidano a un'infrastruttura robusta, come la Ultralytics Platform, per gestire i complessi dataset necessari per addestrare sia gli strati percettivi che quelli di ragionamento dei moderni sistemi AI. Per chi desidera approfondire la matematica alla base dei grafi computazionali dinamici che alimentano questi modelli, la PyTorch documentation ufficiale rimane una risorsa inestimabile.






