Padroneggia l'intelligenza artificiale con l'arricchimento immediato! Migliora i risultati dei Large Language Models usando il contesto, istruzioni chiare ed esempi per ottenere risultati precisi.
L'arricchimento del prompt è il processo di miglioramento automatico o semi-automatico dell'input iniziale dell'utente prima che venga elaborato da un modello di Intelligenza Artificiale (AI), in particolare i Large Language Models (LLM). L'obiettivo principale è quello di migliorare la qualità, la pertinenza e la specificità dell'output dell'IA aggiungendo informazioni contestuali rilevanti, chiarendo potenziali ambiguità, stabilendo vincoli o includendo dettagli specifici. Questa tecnica perfeziona l'interazione tra gli utenti e i sistemi di intelligenza artificiale, rendendo i suggerimenti più efficaci senza richiedere all'utente una profonda competenza nell'ingegneria dei suggerimenti, migliorando così l'esperienza complessiva dell'utente (UX).
Il processo di arricchimento inizia in genere con l'analisi della richiesta originale dell'utente. Sulla base di questa analisi, il sistema sfrutta fonti di informazione aggiuntive o regole predefinite per arricchire la richiesta. Ciò potrebbe comportare l'accesso alla cronologia delle interazioni dell'utente, il recupero di documenti pertinenti da una base di conoscenza, l'incorporazione del contesto della conversazione in corso o l'applicazione di istruzioni di formattazione specifiche richieste dal modello. Ad esempio, una semplice richiesta come "Riassumi gli ultimi sviluppi di Ultralytics " potrebbe essere arricchita per specificare "Riassumi le caratteristiche principali e i miglioramenti delle prestazioni di Ultralytics YOLOv11 rispetto a YOLOv8concentrandosi sulle attività di rilevamento degli oggetti ". Sono comunemente utilizzate tecniche come la Retrieval-Augmented Generation (RAG), in cui il sistema recupera frammenti di dati rilevanti (ad esempio, da Ultralytics Docs) e li incorpora nella finestra contestuale del prompt prima di inviarlo al LLM. In questo modo si assicura che il modello abbia il background necessario per generare una risposta completa e accurata.
L'arricchimento dei prompt è prezioso in numerose applicazioni basate sull'intelligenza artificiale, per migliorare la qualità dell'interazione e le prestazioni delle attività:
Capire le sfumature tra arricchimento immediato e termini simili è fondamentale:
Sebbene l'arricchimento dei prompt sia comunemente associato ai LLM e alla comprensione del linguaggio naturale (NLU), i suoi principi stanno diventando rilevanti nella computer vision (CV). I compiti tradizionali di CV, come il rilevamento di oggetti standard, utilizzano modelli come Ultralytics YOLO si basano tipicamente su input di immagini piuttosto che su richieste di testo complesse. Tuttavia, i più recenti modelli multimodali e i sistemi di visione con prompt, come CLIP, YOLO e YOLOE, accettano prompt testuali o di immagine per guidare attività come il rilevamento di zero colpi. Per questi modelli, arricchire una semplice richiesta di testo (ad esempio, "rileva i veicoli") con un contesto più ampio (ad esempio, "rileva solo i veicoli di emergenza come le ambulanze e i camion dei pompieri in questo feed della telecamera del traffico") potrebbe migliorare significativamente le prestazioni e la specificità. Piattaforme come Ultralytics HUB potrebbero potenzialmente integrare tali tecniche per semplificare l'interazione con l'utente durante la definizione di compiti di visione complessi o l'analisi dei risultati, rappresentando un'area di ricerca e sviluppo dell 'IA in corso volta a migliorare la sicurezza e l'usabilità dell'IA in tutti i settori.