OpenAI O1: новая парадигма в искусственном интеллекте
OpenAI запустила новую флагманскую модель под названием O1, которая может "рассуждать" сама с собой, что приведет к новой парадигме в ИИ и LLM
🚀 OpenAI запускает O1
OpenAI только что запустил свою новую модель O1, которая может "рассуждать" сама с собой, прежде чем ответить на запрос пользователя, и побила все рекорды по решению сложных задач.
Слухи о новой модели OpenAI, получившей внутреннее кодовое обозначение "strawberry/Q*", ходили уже давно, что даже привело к появлению конспирологических теорий вроде "Что видел Илья?" в твиттере. Люди давно подозревали, что это саморазвивающаяся, самосовершенствующаяся модель, и теперь это стало известно.
🙋♀️ Как это работает?
OpenAI O1 или клубника - это саморазвивающаяся модель, которая может продумать несколько шагов, прежде чем ответить на вопрос. Модель разбивает сложную задачу на шаги и пытается ее решить. Она также способна к самокритике, что означает, что она может самокорректироваться, если идет в неправильном направлении, основываясь на заданном контексте.
Это очень похоже на то, как работает COT или цепочка мыслей, но ключевое отличие в том, что шаги COT сами обучаются с помощью RL, и это открывает новую парадигму масштабирования. Отсюда и возврат к именованию "O1" от GPT-4o.
Ранее LLM имели длительный этап предварительного обучения, на котором использовался большой объем вычислений, чтобы LLM создал модель мира и собрал всю информацию. Затем, во время тестирования (то есть когда мы задаем ему вопрос), он должен просто ответить на него, основываясь на том, что он узнал. Но теперь, при использовании O1, LLM делает несколько шагов, чтобы самостоятельно оценить входные данные, а затем выдает ответ. На начальном этапе работы с O1 количество шагов для рассуждения сравнительно меньше - 10-20 шагов, занимающих 15-20 секунд, но OpenAI планирует масштабировать это до часов, дней и недель! Представьте, что вы просите LLM сформулировать лекарство от рака, а он рассуждает неделями и выдает ответ.
📊 На каком месте находится O1?
С точки зрения бенчмарков, O1 по сравнению с GPT-4o (и, соответственно, Claude Sonnet 3.5) разбивает в пух и прах все лучшие сложные бенчмарки. Сложные задачи - это написание кода, понимание и анализ PRD, медицинский отчет или написание романа. В общем, все, что требует критического мышления.
Но, с другой стороны, O1 ограничена в базовых возможностях и иногда справляется с простыми задачами вроде написания личного сообщения или редактирования блога даже хуже, чем GPT-4o.
💥 Как опробовать O1!
Теперь перейдем к тому, как мы можем использовать O1! В настоящее время пользователи ChatGPT Plus могут использовать O1 прямо на chatGPT, но с очень строгими ограничениями по скорости.
O1-preview: 30 запросов в неделюO1-mini: 50 запросов в неделю
Вы также можете проверить O1 через Merlin Pro, с гораздо лучшими ограничениями!
😮 Будущее
OpenAI O1 - это большой шаг, это не просто новая модель после gpt-4o, это новый способ обучения LLM, мышление о вычислениях и означает, что есть длинная полоса для использования производительности, так как мы только царапаем поверхность с O1-preview и есть много другого, что должно произойти в течение следующего 1 года.
Войны за ИИ, которые зашли в тупик, снова накалятся, и OpenAI снова утвердит свое лидерство.
Experience the full potential of ChatGPT with Merlin
Бхавеш Чаудхари
Программист. Воплощаем идеи в жизнь. Веб-разработчик полного цикла.