Глоссарий

Подталкивание цепочки мыслей

Усиль рассуждения искусственного интеллекта с помощью подсказок по цепочке мыслей! Повысь точность, прозрачность и сохранение контекста при решении сложных многоэтапных задач.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Побуждение к цепочке мыслей (CoT) - это продвинутая техника, используемая в основном с большими языковыми моделями (LLM) для улучшения их способности выполнять сложные задачи рассуждения. Вместо того чтобы спрашивать только окончательный ответ, CoT побуждает модель генерировать промежуточные шаги или "цепочку мыслей", которая логически приводит к решению. Такой подход имитирует человеческие процессы решения проблем и помогает моделям эффективнее решать задачи, требующие арифметических, логических или символических рассуждений, что часто приводит к значительно большей точности. Эта техника была особо отмечена в исследованиях Google AI.

Как работает цепочка мыслей

Подсказки CoT направляют модель ИИ, явно показывая ей, как разрулить проблему. Существует два основных варианта:

  1. Few-Shot CoT: Подсказка включает несколько примеров (shots), где каждый пример состоит из вопроса, подробного пошагового процесса рассуждений (цепочки мыслей) и окончательного ответа. Модель учится на этих примерах применять аналогичный процесс рассуждений к заданному вопросу. Это одна из форм обучения на нескольких примерах, применяемая к путям рассуждений.
  2. Zero-Shot CoT: Этот более простой подход не требует приводить примеры. Вместо этого к вопросу прилагается простая инструкция вроде "Давай думать шаг за шагом". Эта подсказка побуждает модель сформулировать процесс рассуждений, прежде чем дать окончательный ответ. При этом задействуются заложенные в модель способности, полученные в ходе длительного предварительного обучения.

Благодаря внешнему представлению шагов рассуждения CoT делает процесс моделирования более прозрачным и позволяет легче отладить, где рассуждение могло пойти не так. Это контрастирует со стандартными подсказками, которые часто требуют прямого ответа и могут не справиться с задачами, требующими множества логических шагов.

Преимущества и применение

Основное преимущество подсказок CoT заключается в том, что они способны расширить возможности рассуждений ЛЛМ для решения сложных задач, с которыми не справляются стандартные подсказки. К основным преимуществам относятся:

  • Улучшение производительности: Значительно повышает точность выполнения таких заданий, как математические задачи на слова, логические головоломки и ответы на многоэтапные вопросы.
  • Повышенная прозрачность: Сгенерированная цепочка мыслей дает представление о процессе рассуждений модели, способствуя созданию объяснимого ИИ (XAI).
  • Лучше справляется со сложностью: Позволяет моделям справляться с проблемами, требующими декомпозиции на более мелкие, управляемые шаги.

Примеры из реального мира:

  1. Сложная поддержка клиентов: ИИ-чатбот, использующий CoT, может решать сложные проблемы клиентов, например устранять технические неполадки, состоящие из нескольких частей, или объяснять сложные вопросы по выставлению счетов. Подсказки CoT заставляют ИИ сначала определить суть проблемы, затем вспомнить соответствующие политики или технические шаги, при необходимости проверить историю пользователей и, наконец, сформулировать пошаговый план решения для клиента. Это более эффективно, чем прямое угадывание решения. Платформы вроде Salesforce Einstein используют подобные рассуждения для обслуживания клиентов.
  2. Анализ и интерпретация данных: Получив набор данных и сложный запрос (например, "Определите ключевые факторы, способствующие снижению продаж в прошлом квартале, на основе этого отчета"), ИИ, использующий CoT, может наметить план анализа: во-первых, определить релевантные точки данных; во-вторых, выполнить необходимые расчеты или сравнения; в-третьих, синтезировать полученные результаты; и, наконец, представить вывод. Такой структурированный подход повышает надежность аналитических выводов, сделанных с помощью ИИ.

CoT особенно ценен в областях, требующих надежного и сложного принятия решений, таких как поддержка анализа медицинских изображений или финансовое моделирование, дополняя достижения в таких областях, как компьютерное зрение (CV), созданное с помощью таких моделей, как Ultralytics YOLO.

Сравнение с родственными концепциями

Подсказки CoT связаны с другими техниками обработки естественного языка (NLP) и машинного обучения (ML), но отличаются от них:

  • Инженерия подсказок: Это широкая практика разработки эффективных входных данных (подсказок) для моделей ИИ. CoT - это особая, продвинутая техника разработки подсказок, направленная на то, чтобы вызвать рассуждения. Другие техники могут быть направлены на ясность, обеспечение контекста(Prompt Enrichment) или спецификацию формата.
  • Цепочка подсказок: Цепочка подсказок подразумевает разбиение сложной задачи на последовательность более простых, взаимосвязанных подсказок, где выход одной подсказки становится входом для следующей. Это часто требует внешней оркестровки (например, с помощью таких фреймворков, как LangChain). В отличие от этого, CoT нацелен на то, чтобы вызвать весь процесс рассуждений в рамках одного взаимодействия "подсказка - ответ".
  • Обучение с нулевым результатом: Это относится к способности модели выполнять задачи, которым она не обучалась явно, без каких-либо примеров. Zero-shot CoT - это специфическое применение этого метода, использующее общую инструкцию ("Давайте думать шаг за шагом") для запуска рассуждений. Однако CoT часто работает лучше в условиях нескольких выстрелов, которые предоставляют примеры рассуждений, специфичные для конкретной задачи, в отличие от чистого обучения с нулевым выстрелом.

Подсказки CoT представляют собой значительный шаг на пути к созданию более способных и интерпретируемых систем искусственного интеллекта (ИИ). Понимание и использование таких техник может быть полезным при разработке сложных моделей ИИ, потенциально используя такие платформы, как Ultralytics HUB, для управления обучением и развертыванием. Такие техники, как Self-Consistency, могут еще больше улучшить CoT за счет выборки нескольких путей рассуждений и выбора наиболее последовательного ответа.

Читать полностью