Нажав кнопку "Принять все файлы cookie", вы соглашаетесь с сохранением файлов cookie на вашем устройстве для улучшения навигации по сайту, анализа его использования и помощи в наших маркетинговых усилиях. Дополнительная информация
Настройки файлов cookie
Нажав кнопку "Принять все файлы cookie", вы соглашаетесь с сохранением файлов cookie на вашем устройстве для улучшения навигации по сайту, анализа его использования и помощи в наших маркетинговых усилиях. Дополнительная информация
Узнайте о недавно выпущенных моделях OpenAI o1 и о том, что делает их особенными. Мы также рассмотрим, как они работают и как они повлияют на будущее ИИ.
ИИ-сообщество уже давно обсуждает следующий шаг для GPT-моделей OpenAI, и многие называют его "проектом "Клубника"". Причина этого в том, что если спросить GPT-4o, сколько букв "Р" в слове "клубника", он ответит, что в слове"клубника" две буквы "Р". Это может показаться странным, учитывая, насколько мощной является GPT-4o. Однако модель создана для обработки подтекста, а не точных слов. Ходили слухи, что следующая модель будет нацелена на решение этой проблемы. Сэм Альтман еще больше подогрел эти слухи, опубликовав фотографии клубники на своем аккаунте X (ранее известном как Twitter).
В четверг, 12 сентября, компания OpenAI сделала очередной анонс, и мы наконец-то получили ответ на эти догадки! OpenAI o1, новая серия моделей ИИ, созданных для того, чтобы замедлить работу и подумать, прежде чем ответить, была выпущена. Интересно, что OpenAI o1 умеет лучше рассуждать и правильно отвечать на вопрос о клубнике! В этой статье мы обсудим, что такое OpenAI o1, как он работает, где его можно использовать и что он означает для будущего ИИ. Давайте начнем!
Новые достижения в области искусственного интеллекта от OpenAI
В июле 2024 года руководители OpenAI сообщили, что исследования OpenAI приближаются к человеческому уровню решения проблем, называемому вторым уровнем ИИ. Очевидно, что этот уровень сосредоточен на рассуждениях, поскольку OpenAI представляет новую серию моделей, OpenAI o1, как думающую, прежде чем ответить. OpenAI o1 - это новая LLM (большая языковая модель), модель ИИ, которая понимает и генерирует человекоподобный текст путем изучения закономерностей на основе огромного количества языковых данных. Она была разработана для решения сложных задач, требующих глубоких рассуждений.
Модель была обучена с помощью обучения с подкреплением- метода, при котором модель учится принимать лучшие решения методом проб и ошибок, получая вознаграждение или наказание за свои действия. Алгоритм обучения с подкреплением помогает модели думать более эффективно, следуя цепочке мыслей. В OpenAI также рассказали, что производительность o1 продолжает улучшаться с увеличением количества обучения с подкреплением во время тренировок и с увеличением времени, потраченного на "размышления" во время решения задач, показывая, что как длительное обучение, так и вдумчивая обработка помогают повысить способности модели.
Хотя OpenAI o1 - это значительное достижение в области сложных рассуждений, он все еще является ранней моделью и не имеет некоторых функций, которые делают ChatGPT полезным, например, просмотр веб-страниц или загрузка файлов и изображений. Для многих обычных задач GPT-4o пока может оказаться более способным. Однако OpenAI o1 знаменует собой большой шаг вперед в способности ИИ справляться со сложными рассуждениями, поэтому OpenAI начинает новую серию и называет ее OpenAI o1.
Как новые модели OpenAI улучшают рассуждения ИИ
OpenAI o1 можно использовать для решения таких задач, как расшифровка шифров, решение задач по программированию, математических задач, кроссвордов и даже сложных тем в области науки, безопасности и здравоохранения. В забавном кивке на кодовое имя проекта OpenAI продемонстрировал способности модели к рассуждению, взломав шифр, который раскрыл сообщение "THERE ARE THREE R'S IN STRAWBERRY".
Помимо разгадывания шифров, OpenAI o1 также искусен в кодировании. Она демонстрирует высокие результаты в соревновательных задачах по программированию, например, на Codeforces - платформе, где программисты решают сложные задачи по кодированию в условиях ограниченного времени. В этих задачах модель достигает высоких рейтингов Elo (система оценок, которая измеряет уровень мастерства на основе результатов, полученных в сравнении с другими участниками) и превосходит предыдущие модели. Кроме того, она отлично справляется с математикой и демонстрирует высокие результаты на таких экзаменах, как Американский вступительный экзамен по математике (AIME).
Рис. 3. Бенчмаркинг способностей o1 к кодированию.
Эти достижения делают OpenAI o1 значительным усовершенствованием по сравнению с предыдущими моделями, такими как GPT-4o. Он открывает новые возможности для ИИ в таких областях, как бизнес, разработки, исследования и здравоохранение. Например, в области генетики OpenAI o1 может быстро просмотреть большое количество научных работ, выявить ключевые выводы и связи между генетическими маркерами и заболеваниями. Он понимает сложный научный язык и может кратко излагать важные моменты, помогая исследователям сосредоточиться на наиболее важной информации.
Более пристальный взгляд на цепочку мыслей
Ранее мы видели, что в OpenAI o1 реализован процесс рассуждений "Цепочка мыслей". Он позволяет модели решать сложные задачи, подобно человеческим когнитивным стратегиям. Модель может разбивать задачи на более мелкие, управляемые шаги и итеративно совершенствовать свой подход. В отличие от предыдущих моделей, которые полагались на немедленное распознавание образов, o1 оптимизирует процесс принятия решений, исследуя несколько путей рассуждений, учась как на успехах, так и на ошибках с помощью обучения с подкреплением.
OpenAI решила не скрывать от пользователей эти необработанные цепочки мыслей, предлагая вместо этого резюме, которые дают представление о рассуждениях модели, не раскрывая каждый шаг. Это решение помогает предотвратить неправомерное использование мыслительного процесса модели и в то же время позволяет разработчикам отслеживать и совершенствовать безопасность и согласованность ИИ. Наблюдая за внутренними скрытыми цепочками, разработчики могут убедиться, что o1 придерживается этических норм и избегает вредного поведения.
Бенчмаркинг OpenAI o1
OpenAI o1 демонстрирует значительные улучшения по сравнению с GPT-4o в нескольких бенчмарках, проверяющих способность рассуждать и решать задачи. На Американском пригласительном экзамене по математике (AIME) 2024, сложном экзамене по математике для лучших учеников старших классов, o1 достиг точности 74 %, используя всего один образец на задачу, по сравнению с 12 % у GPT-4o. При консенсусе по 64 образцам точность возросла до 83 %, а при использовании уточненного метода повторного ранжирования по 1 000 образцов - до 93 %, что позволило войти в число 500 лучших студентов по стране.
Помимо математики, o1 также показал отличные результаты в тестах, проверяющих научные знания, таких как GPQA Diamond, который охватывает вопросы уровня доктора наук по химии, физике и биологии. Примечательно, что в этом тесте o1 превзошел экспертов-людей с докторской степенью, став первой моделью ИИ, которой удалось это сделать. Она также превзошла GPT-4o по 54 из 57 категорий в тесте MMLU, который проверяет понимание различных предметов, включая историю, право и науку.
Компания OpenAI представила две новые модели ИИ в серии o1: o1-preview и o1-mini. Модель o1-preview предназначена для более глубокого размышления перед ответом и отлично справляется со сложными задачами по науке, кодированию и математике. Она предлагает расширенные возможности решения проблем для пользователей, занимающихся сложными проектами. Напротив, o1-mini - это более компактная, быстрая и экономичная модель, оптимизированная специально для рассуждений в области STEM, в частности математики и кодирования. Несмотря на то что o1-mini обладает менее обширными знаниями о мире, она почти соответствует результатам o1-preview в таких ключевых оценках, как математический конкурс AIME и кодовые задачи Codeforces, и при этом стоит на 80 % меньше.
Вы можете опробовать эти модели на различных платформах OpenAI. Пользователи ChatGPT Plus и Team могут получить доступ к моделям o1-preview и o1-mini с помощью инструмента выбора моделей и испытать расширенные возможности рассуждений прямо в ChatGPT. Разработчики с доступом к API уровня 5 могут начать создавать прототипы с помощью этих моделей, хотя некоторые расширенные функции еще находятся в разработке. OpenAI также планирует вскоре сделать o1-mini доступным для всех пользователей ChatGPT Free. Изучив эти модели, вы сможете воочию убедиться в достижениях в области искусственного интеллекта и выбрать ту, которая лучше всего подходит для ваших нужд.
Этические соображения по поводу ИИ, высказанные OpenAI
При разработке серии моделей o1 компания OpenAI уделяла особое внимание этике и безопасности. Прежде чем выпустить модели o1-preview и o1-mini, они провели тщательную оценку, включая внешние тесты и внутренние проверки на наличие таких рисков, как запрещенный контент, галлюцинации и предвзятость. Модели разработаны с расширенными возможностями рассуждения, чтобы лучше понимать и соблюдать правила безопасности.
Для управления рисками OpenAI также внедрила такие средства защиты, как блок-листы и классификаторы безопасности. Модель o1 имеет средний общий рейтинг риска. Она имеет низкий риск в таких областях, как кибербезопасность и автономность модели, и средний риск в таких областях, как химическое, биологическое, радиологическое и ядерное (CBRN) содержание и убеждение. Консультативная группа по безопасности и совет директоров OpenAI рассмотрели эти меры безопасности, чтобы убедиться, что модель безопасна и этична для использования.
От слухов к реальности: OpenAI o1 выходит на сцену
OpenAI o1 - это большой шаг вперед в развитии искусственного интеллекта, превративший некоторые из ранних слухов в реальность. В отличие от GPT-4o, серия o1 мыслит более глубоко, используя подход "Цепочка мыслей", разбивая сложные проблемы на более мелкие шаги для лучшего ответа. В настоящее время в ChatGPT и API доступна ранняя предварительная версия, OpenAI планирует добавить такие функции, как просмотр веб-страниц, загрузка файлов и изображений. OpenAI также поделилась, что планирует продолжать разработку и выпуск моделей серии GPT, а также новой серии OpenAI o1. По мере того как ИИ продолжает развиваться, подобные достижения прокладывают путь к созданию более мощных, интуитивных и универсальных систем ИИ, которые смогут лучше помогать и понимать потребности человека.