Yolo Vision Shenzhen
Shenzhen
Iscriviti ora
Glossario

Prompting Chain-of-Thought

Potenzia il ragionamento dell'IA con il prompting chain-of-thought! Migliora accuratezza, trasparenza e conservazione del contesto per attività complesse e multi-step.

Il prompting della catena di pensiero (CoT) è una tecnica sofisticata di tecnica di prompt engineering progettata per migliorare le capacità di ragionamento dei modelli linguistici di grandi dimensioni (LLM). Invece di chiedere a un modello di intelligenza artificiale di fornire una risposta immediata a una domanda complessa, il prompt CoT istruisce il modello a scomporre il problema in una serie di passi logici intermedi. problema in una serie di passaggi logici intermedi. Questo metodo imita i processi umani di risoluzione dei problemi, permettendo al modello di "pensare ad alta voce" prima di arrivare a una conclusione finale. Generando una sequenza di di ragionamenti, il modello può migliorare significativamente le sue prestazioni in compiti che richiedono aritmetica, ragionamento di senso comune e logica simbolica. ragionamento di senso comune e di logica simbolica. Questo approccio è stato reso popolare dai ricercatori di Google Brain, dimostrando che i processi di pensiero strutturati portano a risultati più affidabili e precisi. Intelligenza Artificiale (IA) più affidabili e accurati.

Meccanismi della catena del pensiero

L'efficacia della CoT risiede nella sua capacità di scomporre compiti complessi in componenti gestibili. Questo non solo Questo non solo aiuta il modello a mantenere la coerenza, ma fornisce anche trasparenza sul modo in cui una risposta è stata ottenuta, un fattore chiave per l'IA spiegabile (XAI). Explainable AI (XAI). Esistono due modi principali di implementare questa strategia:

  • CoT a colpo zero: Si tratta di aggiungere una frase di attivazione come "Pensiamo passo dopo passo" alla fine di un prompt. alla fine di un prompt. Come descritto nella ricerca sui Ragionatori Zero-Shot, questa semplice istruzione attiva le capacità di ragionamento del modello di ragionamento del modello senza bisogno di esempi specifici, facendo leva sull'apprendimento apprendimento a colpo zero per gestire compiti nuovi.
  • CoT a pochi colpi: In questo scenario, il prompt include alcuni esempi di domande abbinate a soluzioni passo-passo. soluzioni passo-passo. Questo utilizza l'apprendimento a pochi colpi, in cui il modello impara il modello di ragionamento modello di ragionamento dal contesto fornito e lo applica al nuovo input.

Applicazioni nel mondo reale

Il prompt Chain-of-Thought sta trasformando il modo in cui gli sviluppatori costruiscono le applicazioni in vari ambiti, in particolare dove la precisione e la logica sono fondamentali.

  1. Analisi di dati complessi: In campi come la finanza o l'analisi dei dati, la CoT viene utilizzata per guidare i modelli attraverso calcoli in più fasi. Ad esempio, un analista potrebbe chiedere a un'intelligenza artificiale di "estrarre innanzitutto i dati relativi ai ricavi del 1° trimestre, quindi aggiustare l'inflazione utilizzando l'indice CPI per il 1° trimestre, poi aggiustare per l'inflazione usando l'indice CPI e infine confrontare il tasso di crescita con l'anno fiscale precedente". anno fiscale precedente". Questo approccio strutturato riduce gli errori di calcolo comuni alle richieste con risposta diretta.
  2. Generazione di codice e debug: Gli sviluppatori utilizzano la CoT per generare codice robusto per visione artificiale (CV) compiti. Invece di chiedere semplicemente chiedere uno script, un utente potrebbe chiedere al modello di delineare la logica per il caricamento di un set di dati, la configurazione dell'architettura del modello e l'esecuzione del ciclo di addestramento. e l'esecuzione del ciclo di addestramento. In questo modo si garantisce che gli script generati per librerie come ultralytics sono logicamente validi e sintatticamente corretti.

Esempio di codice

Pur essendo una tecnica basata sul testo, la CoT viene spesso utilizzata per generare codice Python corretto per i flussi di lavoro di apprendimento automatico. per i flussi di lavoro di apprendimento automatico. L'esempio seguente mostra come strutturare una stringa di prompt in Python per ottenere una soluzione passo-passo per l'utilizzo del codice di apprendimento automatico. soluzione per l'utilizzo di YOLO11 per detect oggetti.

# Example of a Chain-of-Thought prompt structure for generating YOLO11 code
prompt = """
Task: Write a Python script to detect objects in a video stream using YOLO11.

Chain of Thought:
1. Import the YOLO class from the ultralytics package.
2. Load the pre-trained 'yolo11n.pt' model weights.
3. Define the source as '0' for the webcam or a video file path.
4. Run the predict() method with show=True to visualize results in real-time.

Now, generate the Python code based on these steps.
"""

print(f"Sending the following prompt to LLM:\n{prompt}")

Confronto con concetti correlati

È importante distinguere il prompt a catena di pensieri da altre tecniche di tecniche di apprendimento automatico (ML):

  • Prompt di concatenamento: Mentre il CoT si verifica all'interno di un singolo ciclo di richiesta-risposta, il concatenamento di prompt comporta la suddivisione di un'attività in una sequenza di chiamate API separate, dove l'output di un prompt diventa l'input per il successivo. La CoT si concentra sul ragionamento interno, mentre il concatenamento si concentra sull'orchestrazione del flusso di lavoro.
  • Generazione aumentata dal recupero (RAG): La RAG prevede il reperimento di dati esterni per fondare la conoscenza del modello prima di generare una risposta. La CoT può essere combinata con la RAG (ad esempio, "Prima si recupera il documento, poi si ragiona sul suo contenuto"), ma la CoT si riferisce specificamente alla struttura del ragionamento, non alla struttura dei dati. si riferisce specificamente alla struttura del ragionamento, non al meccanismo di reperimento dei dati.
  • Sintonizzazione del prompt: Si tratta di una efficiente di messa a punto dei parametri (PEFT) che ottimizza i prompt morbidi continui (vettori) durante l'addestramento. Al contrario, la CoT è una strategia di prompt in linguaggio naturale discreto discreto, in linguaggio naturale, applicato al di inferenza senza alterare i pesi del modello. pesi del modello.

Integrando la richiesta di Chain-of-Thought, gli sviluppatori possono sbloccare il pieno potenziale dell'IA generativa, assicurando che i modelli non solo forniscano informazioni sul funzionamento dell'IA. IA generativa, garantendo che i modelli non solo forniscano risposte, ma dimostrino anche la validità logica delle loro soluzioni. Questo è essenziale per distribuire agenti di IA affidabili in ambienti critici. agenti di IA affidabili in ambienti critici.

Unitevi alla comunità di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora