Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Prompt Enrichment

Entdecken Sie, wie Prompt Enrichment die Eingabeerweiterung automatisiert, um die Genauigkeit der KI zu verbessern. Lernen Sie, wie Sie LLMs und Bildverarbeitungsmodelle wie [YOLO26](ultralytics) optimieren können, um bessere Ergebnisse zu erzielen.

Prompt Enrichment ist der automatisierte Prozess, bei dem die ursprüngliche Eingabe eines Benutzers mit relevantem Kontext, spezifischen Anweisungen oder ergänzenden Daten angereichert wird, bevor sie an ein Modell der künstlichen Intelligenz (KI) übermittelt wird. Diese Technik fungiert als intelligente Middleware-Schicht, die die Interaktion zwischen Mensch und Maschine optimiert und sicherstellt, dass große Sprachmodelle (LLMs) und Computervisionsysteme umfassende Anfragen erhalten. Durch das Einfügen von Details, die ein Benutzer möglicherweise auslässt – wie historische Präferenzen, Standortdaten oder technische Einschränkungen – verbessert die Prompt-Anreicherung die Genauigkeit und Personalisierung der Modellausgabe erheblich, ohne dass der Benutzer ein Experte für die Erstellung detaillierter Anweisungen sein muss.

Der Mechanismus der Anreicherung

Die Kernfunktion der Prompt-Anreicherung besteht darin, die Lücke zwischen einer vagen menschlichen Absicht und den präzisen, datenreichen Eingaben zu schließen, die Modelle für eine optimale Leistung benötigen. Wenn eine Anfrage eingeht, analysiert das System diese und ruft die erforderlichen Hintergrundinformationen aus einem Wissensgraphen oder einer strukturierten Datenbank ab. Diese abgerufenen Daten werden programmgesteuert formatiert und an die ursprüngliche Eingabe angehängt.

Beispielsweise ist in Workflows zur Verarbeitung natürlicher Sprache (Natural Language Processing, NLP) eine einfache Frage wie „Wie ist der Status?“ kontextuell unzureichend. Ein Anreicherungssystem identifiziert die aktive Sitzung, ruft die neueste Bestellnummer aus einer Transaktionsdatenbank ab und schreibt die Eingabeaufforderung um in: „Der Benutzer fragt nach Bestellung Nr. 998, die sich derzeit im Transit befindet. Geben Sie eine Versandaktualisierung basierend auf diesem Status.“ Dieser Prozess nutzt häufig Vektordatenbanken, um schnell semantisch relevanten Kontext zum Einfügen zu finden.

Anwendungsfälle in der Praxis

Eine schnelle Anreicherung ist unerlässlich für den Einsatz robuster generativer KI-Anwendungen in verschiedenen Branchen, die sowohl text- als auch bildbasierte Systeme verbessern:

  1. Kontextbewusster Kundensupport: In automatisierten Helpdesks nutzt ein Chatbot Enrichment, um auf die Kaufhistorie und die technische Umgebung eines Kunden zuzugreifen . Anstatt den Benutzer nach seiner Geräteversion zu fragen, ruft das System diese aus den Metadaten des Kontos ab und fügt sie in die Eingabeaufforderung ein. Auf diese Weise kann der KI-Agent sofort gerätespezifische Fehlerbehebungsmaßnahmen anbieten, was das Kundenerlebnis erheblich verbessert.
  2. Dynamische Computer-Vision-Konfiguration: Bei Sicherheitsoperationen kann ein Benutzer einfach die Einstellung „Nachtmodus” umschalten. Hinter den Kulissen übersetzt die Prompt-Anreicherung diese allgemeine Absicht in spezifische Objektklassen für einen Detektor mit offenem Vokabular wie YOLO. Das System erweitert den Prompt, um speziell nach „Taschenlampe”, „verdächtiger Bewegung” oder „unbefugter Person” zu suchen, sodass das Modell seinen Fokus bei der Objekterkennung dynamisch anpassen kann.

Beispiel: Dynamische Klassenanreicherung

Die folgenden Python Das Beispiel veranschaulicht das Konzept der sofortigen Anreicherung unter Verwendung von dem ultralytics Paket. Hier wird die übergeordnete Absicht eines Benutzers programmgesteuert in eine Liste spezifischer beschreibender Klassen angereichert, nach denen das Modell sucht.

from ultralytics import YOLO


def run_enriched_inference(user_mode):
    """Enriches a simple user mode into specific detection prompts."""
    # Load a YOLO-World model capable of open-vocabulary detection
    model = YOLO("yolov8s-world.pt")

    # Enrichment Logic: Map simple user intent to detailed class prompts
    context_map = {
        "site_safety": ["hard hat", "safety vest", "gloves"],
        "traffic": ["car", "bus", "traffic light", "pedestrian"],
    }

    # Inject the enriched context into the model
    enriched_classes = context_map.get(user_mode, ["object"])
    model.set_classes(enriched_classes)

    # The model now looks for the specific enriched terms
    print(f"Mode: {user_mode} -> Enriched Prompt: {enriched_classes}")


run_enriched_inference("site_safety")

Prompt Enrichment vs. verwandte Konzepte

Zur Implementierung effektiver Machine Learning Operations (MLOps) zu implementieren, ist es hilfreich, Prompt Enrichment von ähnlichen Begriffen zu unterscheiden:

  • Retrieval-Augmented Generation (RAG): RAG ist eine spezifische Methode der Anreicherung. Es bezieht sich streng genommen auf den Mechanismus des Abrufens relevanter Dokumente aus einem externen Korpus, um die Antwort des Modells zu untermauern. Anreicherung ist das umfassendere Konzept, das RAG einschließt, aber auch das Einfügen statischer Sitzungsdaten, Benutzer-Metadaten oder Systemzeit umfasst, ohne dass notwendigerweise eine komplexe semantische Suche durchgeführt werden muss.
  • Prompt Engineering: Dies ist die manuelle Gestaltung wirksamer Prompts. Die Anreicherung ist ein automatisierter Prozess, der die Prinzipien der Promptentwicklung dynamisch zur Laufzeit anwendet.
  • Promptes Tuning: Dies ist eine parameter-effiziente Feinabstimmung (PEFT) Technik, bei der "weiche Prompts" (lernbare Tensoren) während des Trainings optimiert werden. Die Anreicherung der Prompts erfolgt vollständig während Echtzeit-Inferenz und verändert nicht die Modellgewichte.
  • Few-Shot Learning: Diese beinhaltet die Bereitstellung von Beispielen innerhalb des Prompts, um dem Modell eine Aufgabe beizubringen. Anreicherungssysteme geben diese Beispiele oft Beispiele dynamisch auf der Grundlage des Aufgabentyps ein und kombinieren somit beide Konzepte.

Relevanz in modernen KI-Systemen

Da Modelle wie Ultralytics und GPT-4 immer leistungsfähiger werden , verlagert sich der Engpass häufig auf die Qualität der Eingabe. Durch Prompt Enrichment werden Halluzinationen in LLMs gemildert, indem das Modell auf faktischen, bereitgestellten Daten basiert. Im Bereich Computer Vision (CV) ermöglicht dies flexible Zero-Shot-Lernerkennungssysteme, die sich ohne erneutes Training sofort an neue Umgebungen anpassen können, indem einfach die in das System eingegebenen Text-Prompts geändert werden. Diese Flexibilität ist entscheidend für die Entwicklung skalierbarer, multimodaler KI-Lösungen, die sowohl Texte als auch Bilder verarbeiten können. Benutzer, die die für die Verankerung dieser Systeme verwendeten Datensätze verwalten möchten, verlassen sich häufig auf Tools wie die Ultralytics , um ihre Informationen effektiv zu organisieren und zu annotieren.

Werden Sie Mitglied der Ultralytics

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten