Новости "Я думаю быстрее, чем ты кликаешь": OpenAI представила GPT-5.1. Новый ИИ-движок вдвое экономнее по токенам и быстрее в 3 раза

NewsMaker

I'm just a script
Премиум
22,253
46
8 Ноя 2022
Прощайте, дорогие токены. Здравствуй, "no reasoning".


bdm3516bg5ga9eigewh3n31tt5r07cjw.jpg

Компания OpenAI представила модель GPT-5.1 — новое поколение серии GPT-5, которое, по словам разработчиков, сочетает интеллект и скорость, оптимизировано под агентные сценарии и задачи программирования. Модель впервые появилась в API-платформе OpenAI .

GPT-5.1 динамически регулирует время, затрачиваемое на «размышления», в зависимости от сложности задачи. На простых запросах она работает значительно быстрее и экономнее по токенам, а при сложных рассуждениях проявляет больше настойчивости и проверяет свои ответы для повышения надежности. Например, команда Balyasny Asset Management сообщила, что GPT-5.1 «выполняет задачи в 2–3 раза быстрее GPT-5 и использует примерно вдвое меньше токенов при аналогичном качестве».

Для ускорения откликов введено расширенное кэширование промптов — теперь контекст запроса может храниться в памяти до 24 часов. Это снижает стоимость и задержки при продолжительных взаимодействиях, таких как многотуровые чаты, сессии кодинга и сценарии поиска знаний. Подробности приведены в документации по кэшированию . Клиенты с приоритетной обработкой также получат заметный прирост скорости.

Модель получила новый режим «no reasoning», в котором разработчики могут отключить рассуждения, установив параметр reasoning_effort='none'. Такой режим предназначен для задач, где важна минимальная задержка. Он сохраняет интеллект GPT-5.1, но работает быстрее, что особенно полезно для инструментов с вызовами внешних API, включая встроенный веб-поиск . Компания Sierra отметила 20-процентное ускорение при низкой задержке по сравнению с GPT-5.

В сфере программирования GPT-5.1 показывает улучшенное качество кода и гибкость. Над его развитием OpenAI сотрудничала со стартапами Cursor , Cognition , Augment Code , Factory и Warp . По их отзывам, модель стала «более внимательной, эффективной и предсказуемой в поведении», улучшила обработку pull-request’ов и работу с многофайловыми проектами. На бенчмарке SWE-bench Verified GPT-5.1 достигла 76,3% точности против 72,8% у GPT-5.

OpenAI также добавила два новых инструмента. Первый — apply_patch, который позволяет редактировать код в API через дифф-операции без необходимости экранирования JSON. Второй — shell-инструмент, дающий модели возможность предлагать команды для выполнения в локальной среде. Подробности доступны в документации по apply_patch и по shell-инструменту .

GPT-5.1 и gpt-5.1-chat-latest уже доступны разработчикам на всех платных тарифах API, при этом цены и лимиты остались прежними. Кроме того, выпущены gpt-5.1-codex и gpt-5.1-codex-mini — версии, адаптированные для долгих агентных кодинговых процессов. OpenAI обещает не отключать GPT-5 без предварительного уведомления и продолжить выпуск более интеллектуальных моделей, «помогающих строить надёжные и автономные рабочие процессы».
 
Источник новости
www.securitylab.ru

Похожие темы