Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Torna al glossario Ultralytics

Prompt Compression

Scopri come la compressione dei prompt ottimizza l'efficienza dell'AI. Impara a ridurre l'utilizzo dei token LLM, ad abbassare i costi e ad aumentare la velocità di inferenza con Ultralytics YOLO26 oggi stesso.

La compressione dei prompt è una tecnica di ottimizzazione avanzata progettata per ridurre la lunghezza e la complessità del testo di input fornito a Large Language Models (LLMs) e multi-modal models. Eliminando algoritmicamente parole ridondanti, contesto irrilevante e stop words pur preservando il significato semantico centrale, la compressione dei prompt consente ai sistemi AI di elaborare le informazioni in modo più efficiente. Questo metodo è sempre più critico per minimizzare i costi computazionali, ridurre la inference latency e impedire ai modelli di superare la loro context window massima.

Link to this sectionCome funziona la compressione dei prompt#

A livello architettonico, la compressione dei prompt utilizza spesso modelli più piccoli e specializzati o algoritmi di teoria dell'informazione per valutare l'importanza di ogni token in un determinato prompt. Tecniche come token merging and entropy-based pruning identificano e rimuovono i token che contribuiscono poco al significato generale. Ciò garantisce che l'input finale contenga solo le informazioni più densamente raggruppate.

Ricerche recenti condotte da organizzazioni autorevoli evidenziano che i prompt altamente compressi possono mantenere le prestazioni su compiti di ragionamento complesso riducendo significativamente il consumo di token. Per gli sviluppatori che integrano l'AI in applicazioni scalabili, aderire alle prompt optimization guidelines by OpenAI e sfruttare i framework di compressione è una best practice standard per un deployment efficiente.

Link to this sectionApplicazioni nel mondo reale#

La compressione dei prompt offre un valore immediato in scenari che richiedono la rapida elaborazione di dati testuali o visivi estesi:

  • Retrieval-Augmented Generation (RAG): Nelle applicazioni di ricerca aziendale, le pipeline RAG recuperano spesso dozzine di documenti lunghi per rispondere a una singola query dell'utente. Gli algoritmi di compressione dei prompt restringono questi documenti recuperati, distillandoli in riassunti fattuali concisi prima di inviarli al modello di generazione. Questo previene l'overflow dei token e accelera la real-time inference.
  • Autonomous AI Agents: Gli agenti e i chatbots devono mantenere una memoria a lungo termine delle interazioni dell'utente. Invece di trasmettere l'intera cronologia della conversazione in ogni nuova query, le tecniche di compressione riassumono i turni di dialogo precedenti, garantendo che l'agente rimanga consapevole del contesto senza incorrere in costi computazionali esponenziali.

Link to this sectionCompressione dei prompt vs. tecniche correlate#

Per costruire pipeline robuste di machine learning operations (MLOps), è importante distinguere la compressione dei prompt da concetti correlati:

  • Vs. Prompt Caching: La cache archivia gli stati computazionali interni del testo precedentemente elaborato per evitare di ricalcolarli. La compressione, d'altra parte, altera e accorcia attivamente il testo di input stesso prima che avvenga qualsiasi elaborazione.
  • Vs. Prompt Engineering: Il prompt engineering è l'arte guidata dall'uomo di progettare istruzioni efficaci. La compressione è una riduzione algoritmica e automatizzata di tali istruzioni.
  • Vs. Prompt Enrichment: L'arricchimento espande un prompt aggiungendo contesto esterno, mentre la compressione lo riduce. Spesso vengono usati insieme: un sistema può arricchire un prompt con risultati di database e poi comprimere il payload finale prima dell'inferenza.

Link to this sectionImplementazione nella Computer Vision#

Nella Computer Vision (CV), i principi della compressione dei prompt si applicano quando si utilizzano modelli a vocabolario aperto che accettano query testuali per identificare oggetti. Mantenere le descrizioni delle classi concise garantisce una codifica testuale più rapida e riduce l'overhead di memoria.

Per ambienti di produzione a classe fissa in cui la velocità è fondamentale, gli sviluppatori solitamente passano da modelli basati su prompt testuali a modelli ad architettura fissa altamente ottimizzati come Ultralytics YOLO26. Puoi gestire in modo efficiente i dataset e addestrare questi modelli all'avanguardia utilizzando la Ultralytics Platform.

from ultralytics import YOLO

# Load an open-vocabulary YOLO-World model
model = YOLO("yolov8s-world.pt")

# Principle of prompt compression: Use concise, distilled class names
# instead of lengthy, complex descriptions for faster text encoding
compressed_prompts = ["helmet", "vest", "forklift"]
model.set_classes(compressed_prompts)

# Run inference with the optimized class list
results = model.predict("https://ultralytics.com/images/bus.jpg")
results[0].show()

Explore solutions

Real-time AI tailored to your operation

IA in agricoltura

Porta l'IA visiva nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per raccolti più elevati e intelligenti.

Scopri di più
Real-time AI that works with your operation

IA nel settore automobilistico

Applica la computer vision nel settore automobilistico con i modelli Ultralytics YOLO. La Vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI that works with your team

IA nell'assistenza sanitaria

Sviluppa soluzioni sanitarie con i modelli Ultralytics YOLO. L'IA di visione nell'assistenza sanitaria potenzia l'imaging medico, la diagnostica più intelligente e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

AI nel settore retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI potenzia il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e offre insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

L'AI nella robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI potenzia il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della catena di montaggio.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. L'IA basata sulla visione artificiale consente l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio in tempo reale della sicurezza nei magazzini.

Scopri di più
Real-time AI tailored to your operation

IA in agricoltura

Porta l'IA visiva nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per raccolti più elevati e intelligenti.

Scopri di più
Real-time AI that works with your operation

IA nel settore automobilistico

Applica la computer vision nel settore automobilistico con i modelli Ultralytics YOLO. La Vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI that works with your team

IA nell'assistenza sanitaria

Sviluppa soluzioni sanitarie con i modelli Ultralytics YOLO. L'IA di visione nell'assistenza sanitaria potenzia l'imaging medico, la diagnostica più intelligente e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

AI nel settore retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI potenzia il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e offre insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

L'AI nella robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI potenzia il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della catena di montaggio.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. L'IA basata sulla visione artificiale consente l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio in tempo reale della sicurezza nei magazzini.

Scopri di più
Real-time AI tailored to your operation

IA in agricoltura

Porta l'IA visiva nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per raccolti più elevati e intelligenti.

Scopri di più
Real-time AI that works with your operation

IA nel settore automobilistico

Applica la computer vision nel settore automobilistico con i modelli Ultralytics YOLO. La Vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI that works with your team

IA nell'assistenza sanitaria

Sviluppa soluzioni sanitarie con i modelli Ultralytics YOLO. L'IA di visione nell'assistenza sanitaria potenzia l'imaging medico, la diagnostica più intelligente e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

AI nel settore retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI potenzia il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e offre insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

L'AI nella robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI potenzia il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della catena di montaggio.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. L'IA basata sulla visione artificiale consente l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio in tempo reale della sicurezza nei magazzini.

Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning