Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Prompt Enrichment

Meistere KI mit Prompt Enrichment! Verbessere die Ausgaben von Large Language Models mit Kontext, klaren Anweisungen und Beispielen für präzise Ergebnisse.

Die Anreicherung von Eingabeaufforderungen ist der Prozess, bei dem die ursprüngliche Eingabe eines Benutzers automatisch mit relevantem Kontext, Daten oder Anweisungen angereichert wird. Anweisungen, bevor sie an ein Modell der Modell der Künstlichen Intelligenz (KI) übermittelt werden. Durch spezifischen Details, die der Benutzer möglicherweise ausgelassen hat, stellt diese Technik sicher, dass Große Sprachmodelle (LLMs) und Vision Systeme eine umfassende Anfrage erhalten, was zu genaueren, personalisierten und umsetzbaren Ergebnissen führt. Sie fungiert als intelligente Middleware-Schicht, die die Interaktion zwischen Mensch und Maschine optimiert, ohne dass der Benutzer ein Experte für die Erstellung detaillierter Aufforderungen sein muss. ein Experte für die Erstellung detaillierter Eingabeaufforderungen sein muss.

Der Mechanismus der Anreicherung

Die Kernfunktion des Prompt Enrichment besteht darin, die Lücke zwischen der möglicherweise vagen Absicht des Nutzers und den präzisen Eingabe, die eine KI benötigt. Wenn eine Anfrage eingeht, ruft das System zusätzliche Informationen - wie Benutzerpräferenzen, historische Daten Vorlieben des Benutzers, historische Daten oder Echtzeit-Sensorwerte - aus einem Wissensgraphen oder einer Datenbank. Diese abgerufenen Daten werden programmatisch formatiert und an die ursprüngliche Anfrage angehängt.

Zum Beispiel in Verarbeitung natürlicher Sprache (NLP), ist eine einfache Frage wie "Wie ist der Status?" für ein Modell unzureichend. Durch Anreicherung kann das System identifiziert das System die aktive Sitzungs-ID des Benutzers, sucht die letzte Transaktion in einer Vektordatenbank nach und schreibt die Eingabeaufforderung um in: "Der Benutzer (ID: 5521) erkundigt sich nach der Bestellung Nr. 998, die sich derzeit in Bearbeitung befindet. Geben Sie ein Status-Update basierend auf diesen Tracking-Daten."

Anwendungsfälle in der Praxis

Eine zeitnahe Anreicherung ist entscheidend für den Einsatz robuster generativen KI-Anwendungen in verschiedenen Branchen:

  1. Kontextabhängige Kundenunterstützung: In automatisierten Helpdesks nutzt ein Chatbot die Anreicherung, um auf die Kaufhistorie und die Kaufhistorie und die technische Umgebung des Kunden zuzugreifen. Anstatt den Nutzer nach seiner Geräteversion zu fragen, holt sich das System diese aus den aus den Metadaten des Kontos und fügt sie in die Eingabeaufforderung ein. Dadurch kann der KI-Agent in der Lage, sofort gerätespezifische gerätespezifische Schritte zur Fehlerbehebung, was die Kundenerlebnis.
  2. Dynamische Computer Vision Konfiguration: Bei Sicherheitsoperationen kann ein Benutzer einfach eine Einstellung "Nachtmodus" umschalten. Hinter den Kulissen übersetzt das Prompt Enrichment diese übergeordnete Absicht in spezifische Objektklassen für ein Vision Language Model (VLM) oder einen Detektor mit offenem Vokabular. Das System reichert die Eingabeaufforderung an, um speziell nach "Taschenlampe", "verdächtige Bewegung" oder "unbefugte Person" zu suchen. "verdächtige Bewegung" oder "unbefugte Person" zu suchen, wodurch das Modell seinen Fokus der Objekterkennung dynamisch anzupassen.

Beispiel: Dynamische Klassenanreicherung mit YOLO

Das folgende Python demonstriert das Konzept der prompten Anreicherung mit Ultralytics YOLO. Hier wird die einfache Auswahl eines Benutzers "Modus"-Auswahl eines Benutzers programmatisch in eine Liste spezifischer beschreibender Klassen angereichert, die das Modell scannt.

from ultralytics import YOLO


def run_enriched_inference(user_mode):
    """Enriches a simple user mode into specific detection prompts."""
    # Load an open-vocabulary YOLO model
    model = YOLO("yolov8s-world.pt")

    # Enrichment Logic: Map simple user intent to detailed class prompts
    context_map = {
        "site_safety": ["hard hat", "safety vest", "gloves"],
        "traffic": ["car", "bus", "traffic light", "pedestrian"],
    }

    # Inject the enriched context into the model
    enriched_classes = context_map.get(user_mode, ["object"])
    model.set_classes(enriched_classes)

    # The model now looks for the specific enriched terms
    # model.predict("site_image.jpg") # Run inference
    print(f"Mode: {user_mode} -> Enriched Prompt: {enriched_classes}")


# Example usage
run_enriched_inference("site_safety")

Prompt Enrichment vs. verwandte Konzepte

Zur Implementierung effektiver Machine Learning Operations (MLOps) zu implementieren, ist es hilfreich, Prompt Enrichment von ähnlichen Begriffen zu unterscheiden:

  • Retrieval-Augmented Generation (RAG): RAG ist eine spezielle Methode der Anreicherung. Sie bezieht sich ausschließlich auf den Mechanismus des Abrufs relevanter Dokumente aus einem externen Korpus, um die Antwort des Modells zu untermauern. Anreicherung ist das umfassendere Konzept, das RAG beinhaltet, aber auch statische Sitzungsdaten, Benutzer-Metadaten oder Systemzeit einfließen lässt, ohne dass eine komplexe semantische Suche.
  • Prompt Engineering: Dies ist die manuelle Gestaltung wirksamer Prompts. Die Anreicherung ist ein automatisierter Prozess, der die Prinzipien der Promptentwicklung dynamisch zur Laufzeit anwendet.
  • Promptes Tuning: Dies ist eine parameter-effiziente Feinabstimmung (PEFT) Technik, bei der "weiche Prompts" (lernbare Tensoren) während des Trainings optimiert werden. Die Anreicherung der Prompts erfolgt vollständig während Echtzeit-Inferenz und verändert nicht die Modellgewichte.
  • Few-Shot Learning: Diese beinhaltet die Bereitstellung von Beispielen innerhalb des Prompts, um dem Modell eine Aufgabe beizubringen. Anreicherungssysteme geben diese Beispiele oft Beispiele dynamisch auf der Grundlage des Aufgabentyps ein und kombinieren somit beide Konzepte.

Relevanz in modernen KI-Systemen

Da Modelle wie Ultralytics YOLO11 und GPT-4 leistungsstärker werden werden, verlagert sich der Engpass oft auf die Qualität des Inputs. Prompte Anreicherung mildert Halluzinationen bei LLMs, indem das Modell auf in faktischen, bereitgestellten Daten. In Computer Vision (CV) ermöglicht sie flexible, Erkennungssysteme, die sich sofort und ohne erneutes Training an neue Umgebungen anpassen können, indem sie einfach die Textaufforderungen, die in das System eingespeist werden. Diese Flexibilität ist entscheidend für den Aufbau skalierbarer, multimodalen KI-Lösungen, die sowohl Text als auch Bilder Text und Bilder.

Werden Sie Mitglied der Ultralytics

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten