Новости Китайский ответ ChatGPT: Alibaba представила модель с триллионом параметров

NewsMaker

I'm just a script
Премиум
20,415
46
8 Ноя 2022
Цена как у самолёта, полузакрытый доступ и огромные амбиции.


omn8ne1285aei0m35hat3iogrvr2jiqa.jpg


Китайский гигант Alibaba представил новую модель искусственного интеллекта Qwen-3-Max-Preview с более чем триллионом параметров. Она появилась в официальном облачном сервисе компании и в маркетплейсе OpenRouter. Это продолжение серии Qwen3, первая версия которой вышла в мае и включала модели от 600 миллионов до 235 миллиардов параметров.

Параметры определяют точность работы нейросети, но чем их больше, тем выше энергозатраты и требования к вычислительным ресурсам. По оценкам экспертов, GPT-4.5 от OpenAI имеет от 5 до 7 триллионов параметров и остаётся одной из самых масштабных моделей в мире. Новая разработка Alibaba превзошла предыдущую флагманскую модель Qwen3-235B-A22B-2507, выпущенную в июле.

Компания опубликовала результаты тестов: Qwen-3-Max-Preview показала лучшие способности, чем Kimi K2 от MoonShot AI, упрощённая версия Claude Opus 4 от Anthropic и DeepSeek V3.1. Испытания охватывали пять разных категорий, включая понимание текстов на китайском и английском, следование сложным инструкциям, работу с открытыми задачами, многоязычную обработку и использование инструментов. При этом полноценного технического отчёта с подтверждением этих данных Alibaba пока не представила. Эти достижения продолжают тренд, когда Qwen 2.5 Max добивает монополию США на передовой ИИ.

Серия Qwen принесла Alibaba лидерство в глобальном open-source-сообществе: на платформе Hugging Face её модели загрузили более 20 миллионов раз, а число производных решений превысило 100 тысяч. Это подтверждает ранее зафиксированный успех, когда LLM от Alibaba получила наивысший балл в мировом рейтинге Hugging Face. Однако Qwen-3-Max-Preview пока не выложен в открытый доступ, он доступен только через официальные каналы. Предыдущая модель Qwen2.5-Max также не была открытой. Инженер Alibaba Биньюань Хуэй заявил, что версия модели с расширенными «размышляющими» функциями находится в разработке.

Новая модель оказалась одной из самых дорогих в линейке: стоимость работы составляет 0,861 доллара за миллион входных токенов и 3,441 доллара за миллион выходных. Для сравнения, Qwen3-235B-A22B-2507 в своей упрощённой версии обходится в 0,287 и 1,147 доллара соответственно, а Kimi K2 — в 0,60 и 2,50 доллара.

Также Alibaba заявила о масштабных инвестициях в инфраструктуру для искусственного интеллекта — 380 миллиардов юаней (около 52 миллиардов долларов) за ближайшие три года. Это больше, чем компания вложила в эту сферу за весь предыдущий десятилетний период. Такой шаг подчёркивает стремление занять лидирующие позиции как на китайском, так и на глобальном рынке.

Компания активно конкурирует с другими игроками в области ИИ, регулярно представляя новые модели и часть из них делая открытыми. Недавно появились сообщения о разработке собственных процессоров для искусственного интеллекта, которые должны снизить зависимость от американских чипов Nvidia, особенно в условиях ужесточающегося контроля со стороны властей КНР над иностранными технологиями. Эта стратегия становится особенно актуальной на фоне того, что новые санкции против Nvidia могут серьёзно ограничить доступ китайских компаний к передовым чипам. При этом стоит учитывать и потенциальные риски, связанные с китайскими технологическими компаниями, о которых предупреждают западные спецслужбы в контексте китайской тени над Европой . Выпуск Qwen-3-Max-Preview закрепил за Alibaba статус серьёзного соперника в сегменте крупных языковых моделей и подтвердил намерение Китая влиять на будущее развитие отрасли.
 
Источник новости
www.securitylab.ru

Похожие темы