Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

Prompt Engineering

Освой промпт-инжиниринг для ИИ и компьютерного зрения. Узнай, как оптимизировать входные данные для LLM и мультимодальных моделей, таких как Ultralytics YOLO26, для достижения превосходных результатов.

Промпт-инжиниринг — это стратегический процесс разработки, уточнения и оптимизации входного текста для направления моделей искусственного интеллекта (ИИ) на создание точных, релевантных и качественных результатов. Получив первоначальную известность с появлением больших языковых моделей (LLM), таких как GPT-4, эта дисциплина превратилась в критически важный навык для взаимодействия с системами генеративного ИИ в различных модальностях, включая текст, изображения и видео. Вместо изменения базовых весов модели путем дообучения, промпт-инжиниринг использует существующие знания модели, формулируя задачу так, чтобы система могла ее максимально эффективно понять, сокращая разрыв между намерением человека и исполнением машиной.

Link to this sectionМеханика эффективного промптинга#

По сути, промпт-инжиниринг опирается на понимание того, как фундаментальные модели обрабатывают контекст и инструкции. Хорошо составленный промпт снижает неоднозначность за счет предоставления четких ограничений, желаемых форматов вывода (например, JSON или Markdown) и релевантной справочной информации. Продвинутые пользователи применяют такие методы, как few-shot learning, где в промпте приводятся несколько примеров пар «вход-выход» для демонстрации желаемого шаблона.

Еще одна мощная стратегия — chain-of-thought prompting, которая побуждает модель разбивать сложные задачи логического вывода на промежуточные шаги. Это значительно повышает производительность при выполнении логически сложных запросов. Кроме того, оптимизация использования контекстного окна — предела объема текста, который модель может обработать за один раз — критически важна для поддержания связности в длительных взаимодействиях. Внешние ресурсы, такие как руководство OpenAI по проектированию промптов, подчеркивают важность итеративной доработки для эффективной обработки граничных случаев.

Link to this sectionАктуальность в компьютерном зрении#

Хотя промпт-инжиниринг часто ассоциируется с текстом, он становится все более важным в области компьютерного зрения (CV). Современные мультимодальные модели и детекторы с открытым словарем, такие как YOLO-World, позволяют пользователям определять цели обнаружения с помощью обработки естественного языка (NLP), а не предопределенных числовых ID классов.

В этом контексте «промпт» представляет собой текстовое описание объекта (например, «человек в красном шлеме»). Эта возможность, известная как zero-shot learning, позволяет системам обнаруживать объекты, на которых они не обучались явно, за счет использования изученных связей между визуальными признаками и семантическими эмбеддингами. Для высокопроизводительных сред, где классы фиксированы, разработчики могут в конечном итоге перейти от моделей, использующих промпты, к эффективным, дообученным моделям, таким как YOLO26, но промпт-инжиниринг остается ключевым инструментом для быстрого прототипирования и обеспечения гибкости.

Link to this sectionРеальные приложения#

Промпт-инжиниринг создает ценность в различных отраслях, обеспечивая гибкую и интеллектуальную автоматизацию:

  • Динамическая визуальная аналитика: В сфере ИИ в ритейле менеджеры магазинов используют визуальные модели на основе промптов для поиска конкретных товаров без технического вмешательства. Системе можно задать промпт для отслеживания «пустых полок» в один день и «неправильно размещенных товаров» в другой. Такая гибкость позволяет компаниям оперативно адаптировать свои системы обнаружения объектов к сезонным трендам.
  • Автоматизированное создание контента: Маркетинговые команды полагаются на подробные промпты для управления генераторами текст-в-изображение, такими как Stable Diffusion или Midjourney. Разрабатывая промпты, задающие освещение, художественный стиль и композицию, дизайнеры могут быстро создавать визуальные активы.
  • Интеллектуальный поиск знаний: В поддержке клиентов инженеры проектируют «системные промпты», которые предписывают чат-ботам отвечать на запросы, используя только проверенные данные компании. Это ключевой компонент RAG (Retrieval-Augmented Generation), гарантирующий, что ИИ сохраняет полезную тональность общения, избегая галлюцинаций в LLM.

Link to this sectionРеализация с помощью Ultralytics#

Следующий пример демонстрирует, как промпт-инжиниринг применяется программно с использованием пакета ultralytics. Здесь мы используем модель YOLO-World, которая принимает текстовые промпты для динамического определения объектов поиска, что контрастирует со стандартными моделями, такими как YOLO26, использующими фиксированные списки классов.

from ultralytics import YOLO

# Load a YOLO-World model capable of interpreting text prompts
model = YOLO("yolov8s-world.pt")

# Apply prompt engineering to define custom classes dynamically
# The model maps these text descriptions to visual features
model.set_classes(["person in safety vest", "forklift", "blue hardhat"])

# Run inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Show results - the model only detects objects matching the prompts
results[0].show()

Link to this sectionРазграничение похожих концепций#

Для эффективного развертывания ИИ-решений через платформу Ultralytics важно отличать промпт-инжиниринг от схожих методов оптимизации:

  • Промпт-инжиниринг vs. Prompt Tuning: Промпт-инжиниринг подразумевает ручное составление входных данных на естественном языке. Напротив, prompt tuning — это метод параметрически эффективного дообучения (PEFT), при котором в фазе обучения изучаются «мягкие промпты» (непрерывные векторные эмбеддинги). Эти мягкие промпты представляют собой математические оптимизации, невидимые для пользователя.
  • Промпт-инжиниринг vs. Fine-Tuning: Дообучение (fine-tuning) навсегда обновляет веса модели с использованием конкретного обучающего набора данных для специализации на задаче. Промпт-инжиниринг не меняет саму модель; он лишь оптимизирует входные данные во время инференса в реальном времени.
  • Промпт-инжиниринг vs. Prompt Injection: Если инжиниринг носит конструктивный характер, то prompt injection — это уязвимость безопасности, при которой вредоносные входные данные манипулируют моделью, заставляя ее игнорировать ограничения безопасности. Обеспечение безопасности ИИ требует надежной защиты от подобных состязательных промптов.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения