Овладей искусственным интеллектом с помощью оперативного обогащения! Улучшай результаты работы больших языковых моделей, используя контекст, четкие инструкции и примеры для получения точных результатов.
Обогащение подсказки - это процесс автоматического или полуавтоматического улучшения исходной подсказки пользователя перед ее обработкой моделью искусственного интеллекта (ИИ), особенно большими языковыми моделями (БЯМ). Основная цель - повысить качество, релевантность и конкретность вывода ИИ, добавив соответствующую контекстную информацию, прояснив потенциальные двусмысленности, установив ограничения или включив конкретные детали. Эта техника улучшает взаимодействие между пользователями и системами ИИ, делая подсказки более эффективными, не требуя от пользователя глубоких знаний в области разработки подсказок, тем самым улучшая общий пользовательский опыт (UX).
Процесс обогащения обычно начинается с анализа исходной подсказки пользователя. На основе этого анализа система использует дополнительные источники информации или предопределенные правила, чтобы дополнить подсказку. Это может включать в себя доступ к истории взаимодействия с пользователем, извлечение соответствующих документов из базы знаний, учет контекста текущего разговора или применение определенных инструкций по форматированию, требуемых моделью. Например, простая подсказка типа "Обобщите последние разработки Ultralytics " может быть дополнена фразой "Обобщите ключевые особенности и улучшения производительности Ultralytics YOLOv11 по сравнению с YOLOv8сфокусировавшись на задачах обнаружения объектов ". Обычно используются такие техники, как Retrieval-Augmented Generation (RAG), когда система получает соответствующие фрагменты данных (например, из Ultralytics Docs) и включает их в контекстное окно подсказки, прежде чем отправить ее в LLM. Таким образом, модель получает необходимую информацию, чтобы сгенерировать исчерпывающий и точный ответ.
Обогащение подсказок ценно для множества приложений, управляемых искусственным интеллектом, повышая качество взаимодействия и эффективность выполнения задач:
Понимание нюансов между оперативным обогащением и похожими терминами крайне важно:
Хотя обогащение подсказок чаще всего ассоциируется с LLM и пониманием естественного языка (NLU), его принципы становятся актуальными и в компьютерном зрении (CV). Традиционные задачи КВ, такие как стандартное обнаружение объектов с помощью таких моделей, как Ultralytics YOLO обычно опираются на изображения, а не на сложные текстовые подсказки. Однако новые мультимодальные модели и подсказывающие системы зрения, такие как CLIP, YOLO и YOLOE, принимают текстовые или графические подсказки для решения таких задач, как обнаружение нулевого выстрела. Для этих моделей обогащение простой текстовой подсказки (например, "обнаружить транспортные средства") большим количеством контекста (например, "обнаружить только аварийные транспортные средства, такие как машины скорой помощи и пожарные машины в этой записи с дорожной камеры") может значительно улучшить производительность и специфичность. Платформы вроде Ultralytics HUB потенциально могут интегрировать подобные техники для упрощения взаимодействия с пользователем при определении сложных задач видения и анализе результатов, представляя собой область текущих исследований и разработок ИИ, направленных на повышение безопасности и удобства использования ИИ в различных областях.