Настраивайтесь на YOLO Vision 2025!
25 сентября 2025 г.
10:00 — 18:00 BST
Гибридное мероприятие
Yolo Vision 2024
Глоссарий

Инженерия промптов

Освойте искусство промпт-инжиниринга для управления AI-моделями, такими как LLM, для получения точных и качественных результатов в контенте, обслуживании клиентов и многом другом.

Инженерия промптов — это искусство и наука разработки эффективных входных данных (промптов) для управления моделями искусственного интеллекта (ИИ), особенно большими языковыми моделями (LLM), для генерации желаемых выходных данных. Это похоже на то, чтобы быть опытным коммуникатором с ИИ, точно зная, что сказать и как это сказать, чтобы получить наилучший отклик. Эта практика имеет решающее значение, поскольку производительность, релевантность и качество выходных данных модели ИИ в значительной степени зависят от того, как сформулирован запрос. Эффективная инженерия промптов позволяет пользователям использовать весь потенциал мощных базовых моделей для широкого спектра задач.

Как работает разработка промптов (Prompt Engineering)

Суть промпт-инжиниринга заключается в структурировании входных данных, которые обеспечивают четкий и достаточный контекст для модели. В то время как простой вопрос может дать базовый ответ, хорошо спроектированный промпт может контролировать тон, формат и сложность. Ключевые компоненты продвинутого промпта могут включать в себя:

  • Инструкция: Четкое и конкретное указание, сообщающее модели, какую задачу необходимо выполнить (например, «Суммируйте следующую статью в трех пунктах»).
  • Контекст: Предоставление релевантной справочной информации или данных, которые модель должна использовать для формирования своего ответа.
  • Персона: Назначение роли для принятия ИИ, которая влияет на тон и стиль вывода (например, "Действуйте как эксперт-финансовый аналитик").
  • Формат: Определение желаемой структуры вывода, например, список, JSON-объект или определенный стиль написания.
  • Примеры: Включение примеров желаемого формата ввода и вывода, техника, известная как обучение с небольшим количеством примеров, помогает направить ответ модели. Подробный ресурс по этим методам можно найти в Руководстве по промптингу.

Применение в реальном мире

  1. Автоматизация поддержки клиентов: Чтобы обеспечить согласованность и точность бренда, компания может использовать разработку подсказок (prompt engineering) для управления своим чат-ботом поддержки. Подсказка может предписывать ИИ использовать дружелюбный и полезный тон, использовать внутреннюю базу знаний для ответа на вопросы о продуктах и определять четкий протокол для передачи разговора специалисту. Это контролирует поведение ИИ, предотвращая предоставление им неверной информации или взаимодействие с клиентами не в соответствии с брендом.

  2. Генерация креативного контента: В моделях преобразования текста в изображение, таких как Midjourney или DALL-E 3 от OpenAI, подсказка (prompt) является основным инструментом для создания. Простая подсказка, такая как «изображение автомобиля», даст общий результат. Однако подробная подсказка, такая как «Винтажный красный спортивный автомобиль 1960-х годов, мчащийся по прибрежному шоссе на закате, фотореалистичный стиль, кинематографическое освещение, разрешение 8K», предоставляет конкретные инструкции по теме, обстановке, стилю и качеству, что дает в результате индивидуальное и визуально потрясающее изображение.

Релевантность в компьютерном зрении

Хотя изначально разработка промптов возникла в области обработки естественного языка (NLP), она становится все более актуальной в компьютерном зрении (CV). Это обусловлено развитием мультимодальных моделей, которые могут одновременно обрабатывать текст и изображения. Такие модели, как CLIP, и детекторы с открытым словарем, такие как YOLO-World, могут выполнять такие задачи, как обнаружение объектов, на основе произвольных текстовых описаний. Для этих моделей разработка эффективного текстового промпта (например, "обнаружить все 'велосипеды', но игнорировать 'мотоциклы'") является формой разработки промптов, имеющей решающее значение для управления этими моделями Vision Language. Платформы, такие как Ultralytics HUB, облегчают взаимодействие с различными моделями, где определение задач через интерфейсы может выиграть от принципов разработки промптов.

Инженерия промптов в сравнении со смежными концепциями

Важно отличать разработку промптов от других концепций машинного обучения:

  • Тонкая настройка: Это включает в себя обновление весов модели путем продолжения процесса обучения на новом наборе данных. Prompt engineering, напротив, не изменяет саму модель, а скорее направляет поведение существующей модели во время инференса.
  • Тонкая настройка промптов (Prompt Tuning): Метод тонкой настройки с эффективным использованием параметров (PEFT), тонкая настройка промптов включает в себя изучение небольшого набора embeddings «мягких промптов», которые добавляются в начало входных данных. Он автоматизирует создание промптов посредством обучения, тогда как prompt engineering — это ручной процесс создания текстовых «жестких промптов».
  • Prompting с цепочкой рассуждений (Chain-of-Thought, CoT): CoT — это специфический метод разработки промптов, при котором к промпту добавляется инструкция, например, "думай шаг за шагом". Это побуждает модель разбивать сложные задачи на промежуточные этапы рассуждений, что часто приводит к более точным результатам, как подробно описано в оригинальной исследовательской работе Google AI.
  • Цепочки промптов (Prompt Chaining): Этот метод включает в себя разбиение сложной задачи на несколько последовательных промптов, где вывод одного шага является входом для следующего. Prompt engineering — это более широкая практика эффективной разработки каждого из этих отдельных промптов. Такие фреймворки, как LangChain, предназначены для организации таких цепочек.
  • Генерация, дополненная поиском (Retrieval-Augmented Generation, RAG): RAG — это система, которая улучшает запрос, сначала извлекая релевантные данные из внешней базы знаний. Prompt engineering имеет решающее значение в системе RAG для правильной формулировки как первоначального поискового запроса, так и окончательного запроса, который объединяет вопрос пользователя с извлеченной информацией.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас
Ссылка скопирована в буфер обмена