Chain-of-Thought Prompting
Esplora il prompting Chain-of-Thought (CoT) per migliorare il ragionamento dell'AI. Impara come suddividere le attività in passaggi logici migliori la generazione di codice per Ultralytics YOLO26.
Il Chain-of-Thought (CoT) prompting è una tecnica avanzata nel prompt engineering che permette ai large language models (LLMs) di risolvere compiti di ragionamento complessi scomponendoli in passaggi logici intermedi. Invece di chiedere al modello di fornire una risposta finale immediata, il CoT incoraggia il sistema a generare una "catena di pensieri" che imita la risoluzione umana dei problemi. Questo ragionamento passo dopo passo migliora significativamente le prestazioni in compiti che coinvolgono aritmetica, logica simbolica e ragionamento basato sul senso comune, trasformando il modo in cui interagiamo con i sistemi di Intelligenza Artificiale (AI).
Link to this sectionIl meccanismo del ragionamento#
I modelli linguistici standard spesso hanno difficoltà con problemi a più fasi perché tentano di mappare l'input direttamente sull'output in un unico passaggio. Questo approccio a "scatola nera" può portare a errori, specialmente quando il salto logico è troppo ampio. Il Chain-of-Thought prompting risolve questo problema inserendo passaggi di ragionamento tra la domanda in input e l'output finale.
Questo processo funziona generalmente in due modi:
- Zero-Shot CoT: L'utente aggiunge al prompt una semplice frase di attivazione come "Pensiamo passo dopo passo". Questo attiva le capacità di ragionamento latenti del modello senza richiedere esempi specifici.
- Few-Shot CoT: Il prompt include alcuni esempi (esemplari) di domande abbinate alle loro soluzioni passo dopo passo. Questo sfrutta il few-shot learning per mostrare al modello esattamente come strutturare la propria logica prima di tentare un nuovo problema.
Generando esplicitamente un ragionamento intermedio, il modello ha più opportunità di correggersi e offre trasparenza su come sia giunto a una conclusione. Questo è cruciale per ridurre le allucinazioni negli LLM, dove i modelli potrebbero altrimenti affermare con sicurezza fatti errati.
Link to this sectionApplicazioni nel mondo reale#
Sebbene inizialmente sviluppato per la logica basata su testo, il Chain-of-Thought prompting ha potenti applicazioni quando combinato con altri domini dell'AI, come la computer vision e la generazione di codice.
Link to this section1. Migliorare la generazione di codice per la computer vision#
Gli sviluppatori usano il CoT per guidare gli LLM nella scrittura di script software complessi per compiti come l' object detection. Invece di una richiesta vaga come "scrivi del codice per trovare le auto", un prompt CoT potrebbe strutturare la richiesta: "Primo, importa le librerie necessarie. Secondo, carica il modello pre-addestrato. Terzo, definisci la sorgente dell'immagine. Infine, esegui il ciclo di previsione." Questo approccio strutturato garantisce che il codice generato per modelli come YOLO26 sia sintatticamente corretto e logicamente solido.
Link to this section2. Processo decisionale autonomo#
Nel campo dei veicoli autonomi, i sistemi devono elaborare dati visivi e prendere decisioni critiche per la sicurezza. Un approccio Chain-of-Thought permette al sistema di articolare la propria logica: "Rilevo un pedone vicino alle strisce pedonali. Il pedone è rivolto verso la strada. Il semaforo è verde per me, ma il pedone potrebbe attraversare. Pertanto, rallenterò e mi preparerò a fermarmi." Questo rende le decisioni dell'AI interpretabili e in linea con i principi dell' explainable AI (XAI).
Link to this sectionChain-of-Thought in azione#
Sebbene il CoT sia principalmente una tecnica di linguaggio naturale, può essere implementato programmaticamente per garantire interazioni coerenti con i modelli di visione. Il seguente esempio in Python dimostra come uno sviluppatore potrebbe strutturare un prompt per guidare un LLM (qui simulato) nella generazione di codice di inferenza valido per la Ultralytics Platform.
# Example of structuring a Chain-of-Thought prompt for an LLM
# This prompt guides the model to write a valid YOLO26 inference script
cot_prompt = """
Task: Write a Python script to detect objects using YOLO26.
Chain of Thought:
1. Import the YOLO class from the 'ultralytics' library.
2. Load the 'yolo26n.pt' model weights (the latest nano model).
3. Load a sample image using a URL or local path.
4. Run the predict() function and save the results.
Based on these steps, generate the Python code below:
"""
# In a real application, you would send 'cot_prompt' to an LLM API
print(f"Structured Prompt for LLM:\n{cot_prompt}")Link to this sectionDistinguere concetti correlati#
È importante differenziare il Chain-of-Thought prompting da termini simili nel panorama del Machine Learning (ML):
- Prompt Chaining: Questo comporta il collegamento di più chiamate separate al modello, dove l'output di un passaggio diventa l'input del successivo. Il CoT avviene all'interno di un singolo prompt per sollecitare il ragionamento interno, mentre il prompt chaining orchestra un flusso di lavoro attraverso molteplici interazioni.
- Retrieval-Augmented Generation (RAG): Il RAG si concentra sul recupero di dati esterni (come documenti o database) per fondare la conoscenza del modello. Il CoT si concentra sul processo di ragionamento stesso. Spesso vengono combinati: si usa il RAG per ottenere i fatti e il CoT per ragionare su di essi.
- Prompt Tuning: Questo è un metodo di fine-tuning efficiente nei parametri che ottimizza soft prompt continui (vettori) durante l'addestramento. Il CoT è una strategia discreta basata sul linguaggio naturale applicata durante l' inferenza in tempo reale senza alterare i pesi del modello.
Link to this sectionProspettive future#
Man mano che i modelli di base continuano a evolversi, il Chain-of-Thought prompting sta diventando una best practice standard per sbloccare il loro pieno potenziale. La ricerca di gruppi come Google DeepMind suggerisce che, man mano che i modelli scalano in dimensioni, la loro capacità di eseguire ragionamenti CoT migliora drasticamente. Questa evoluzione sta aprendo la strada ad agenti autonomi più affidabili, in grado di gestire flussi di lavoro complessi in settori che vanno dall'assistenza sanitaria alla smart manufacturing.






